DeepMindのAIに負けた囲碁の世界チャンピオンが最終戦直前のゲームで勝利…AlphaGoを上回る妙手で

screen-shot-2016-03-13-at-11-24-49-am

マシン3勝、人間1勝…これが、DeepMindのAlphaGo対人間の囲碁世界チャンピオンLee Sedolの、5番勝負のこれまでの結果だ。

先週GoogleがオーナーであるそのAIは、Sedolとの初戦に勝って歴史的な勝利を達成した。初めてマシンが、世界クラスのプロの囲碁プレーヤーを負かしたのだ。その後、そのアルゴリズムは続く2試合にも勝って3連勝を達成、5番勝負における勝利を確定した。

しかし、まだ2試合残っている今となってSedolは、(The Vergeによれば)第4試合に勝ち、人類のために1勝を取り戻した。

DeepMindのファウンダーDemis Hassabisのツイート(下図)によると、マシンの負けは、第78手におけるSedolの妙手に圧(お)されて、致命的なミスを犯したためだ。

AlphaGoは、囲碁というとてつもなく複雑なゲームをマスターするために、二つの人工知能テクニックを併用している。それは、深層学習(deep learning, ディープラーニング、多段構造のニューラルネット)とモンテカルロツリー検索(Monte Carlo Tree Search)だ。それによりこのAIは、数百万のゲームをシミュレートでき、その結果から学んだことを一般化して囲碁の戦略を作り出す。明らかにその成功率は高いが、しかし不敗ではない。

今年の初めにGoogleのブログ記事は、AlphaGoの前に立ちふさがる複雑性というチャレンジを、こう説明している:

“囲碁には陣形が1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000とおりありえる。それは宇宙の原始の数よりも多く、チェスの10の100乗倍である”。

AlphaGoのSedolに対する勝利は、彼が世界第二位のプロの囲碁プレーヤーであるだけに、見事という言葉しかないが、人工知能は未だに、やれることの幅が極端に狭い。言い換えるとそれらはいずれも、きわめて特定的なタスクのために設計されている。チェスに、あるいはJeopardy(ジョパディ)に強くなるため、とか。

人工知能の究極の目標は言うまでもなく、汎用性のある学習AIを作ることだ。多面的なインテリジェンスを適用して、さまざまな種類の問題を解けること。そしてHassabis自身も認めるように、今の単一目的のAIマシンですら、オフボードゲームの世界の混沌とした複雑性において勝利を獲得することからは、まだまだはるかに、遠い位置にいるのだ。

人間が行う仕事は、一見単純なものですら、…たとえば部屋を片付けるようなことでも…、そこに存在する変数の数は、もっとも高度なマシンインテリジェンスですら愚鈍に見えるほどに、膨大なのだ。だからわれわれ人間は、囲碁に負けたぐらいで落ち込む必要はない。

このAlphaGoシリーズの最終戦は、3月15日に行われる。ライブの実況を、 YouTubeで観戦できる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

GoogleのDeepMindがAIの大きな画期を記す: 囲碁の世界チャンピオンLee Sedolに第一戦で勝利

screenshot-2016-03-09-16-02-34

GoogleがオーナーであるロンドンのDeepMindの囲碁ソフトが、世界チャンピオンのLee Sedolに勝ち、人工知能(AI)の開発史に特筆すべき新たな画期が刻まれた。

韓国のソウルで行われた五番勝負の第一戦で今日、そのソフトウェアAlphaGoは、Leeが持ち時間29分弱を残す時点で負けを認めたため、早期の勝利を手にした。最後の第五戦は来週火曜日(米国時間3/15)に行われ、YouTubeはそれまでの全試合をライブで放送する。勝者の賞金は、100万ドルだ。

AIの進歩は、戦略ゲームのトッププレーヤーに対する勝利で歴史に刻まれる。チェスのグランド・マスターGarry KasparovがDeep Blueに負けたのは1997年、IBMのWatsonがJeopardyで勝ったのは2011年だが、東アジアで数世紀の伝統を持つ囲碁の戦略と知的な深さは、AIの作者に最強のチャレンジを提供し、そのことはGoogle自身も認めていた

DeepMindをGoogleは2年前に5億ドルあまりで買収したが、同社は囲碁専用のソフトウェアAlphaGoを制作した。そして昨年10月にはヨーロッパチャンピオンFan Huiに勝利し、AIが囲碁で人間に勝ったのはそれが初めてとなった。しかし33歳のLeeは、囲碁のレジェンドと呼ばれる9段のプロで、世界最強の囲碁プレーヤーと言われる。

昨年Fan Huiに勝ったとき、DeepMindの協同ファウンダーDemis Hassabisは、AlphaGoの開発は今でも進行中であり、ゲームのテクニックを自力で磨いている、と説明した:

AlphaGoは、自分自身を超えていく。できれば最終的には、この分野の最強の人間が自己を限りなく磨き続けるように。新しいことを自分で発明していく様子は、見ていて本当にすごいと思う。もちろんそれは、囲碁という特定のゲームの枠内のことではあるが、われわれは今では、自分たちた作ったシステムに、厚い親近感すら抱(いだ)いている。とくに、それが作られていくやり方に対する親近感だ。そのやり方とは、自分で学習し、われわれがある程度は教育訓練し、そして、まるで人間のようなスタイルでゲームをプレイしていく。それは、すべての状況や条件等が分かっている状態で人間が手作りしていく従来のプログラムとは違う。それは物事を自分で拾い上げる。だからこそ、それが自力で習得していく能力が、すばらしく思えるのだ。

今度は、第一戦からLeeが何を学んだかが見ものだ。それが木曜日(米国時間3/10)の第二戦で分かる。試合の実況ストリーミングは、YouTube上のDeepMindのチャネルで見られる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))