トップ棋士に3連勝したAlphaGo、引退を表明

盤上ゲームの中で最も戦略的とされる囲碁を打つために開発された、GoogleのAlpha Goが引退することになった。中国で世界最高レベルの打ち手をことごとく破ってからの引退ということになる。最後に対局したのは、世界トップランクの柯潔だ。中国で行われたイベントにて3局戦ったが、いずれもAlphaGoの勝利(3-0)となった。

AlphaGoはもともと、ロンドンのDeepMindにより開発されたものだ。DeepMindは2014年に5億ドルほどの金額でGoogleに買収されている。尚、今回のイベントでは人間5人を同時に相手にするいわゆる「相談碁」でもAlphaGoが勝利している。AlphaGoが世界的な注目を集めたのは、昨年前世界チャンピオンのイ・セドルを破ってからだ。今回の柯潔との対局や相談碁、あるいはペア碁を見るに、どうやらAlphaGoは次のレベルに到達しているようだ。

AlphaGoの引退を発表した、DeepMindのCEOであるDemis Hassabisは次のように語っている

囲碁発祥の地とされる中国で、世界トップレベルの棋士と連戦することは、AlphaGoにとっても進化のための最高の機会となりました。このような最高の機会を経験し、AlphaGoは引退させることといたしました。

今後、AlphaGoの開発チームは「次のレベル」のための開発に注力することとなります。アルゴリズムをより汎用的なものに改造し、この世の中に存在する複雑な問題を解決するためのお手伝いができるようになればと考えています。想定しているのは、病気の治療方法の発見や、消費エネルギーの劇的削減、革新的な新素材の開発などです。

ボードゲームの中でもっとも複雑だとされる囲碁にチャレンジすることで、AIの能力を高め、人間と関わるやり方も磨いてきたわけだ。Googleだけでなく、Tencentもゲームの中でのAIの活用/成長を狙っている。ゲームの世界で、その可能性を実証して注目を集めることで、次のステップに進む準備が整ったと判断したのだろう。AlphaGoは、新たな段階に進むことを決断したわけだ。

これまでにもDeepMindは、実用分野での可能性を探ってきている。昨年にはイギリスの国民保険サービスとの間で情報共有について合意している。但しこれは、営利企業に対して膨大な数の個人データを引き渡すことになるわけで、反対の声もおおくあがっている。現在は個人情報補語監視機関(Information Commissioner’s Office:ICO)による精査が行われているところだ。

こうした混乱は、AI技術自身がもたらしたものではない。しかし活躍の機会を、現時点で十分に活用できていないということにはなる。

「医療分野においても、AIが新たな知識や問題の解決法をもたらすことができれば、これは大きなブレイクスルーとなるわけです。はやくそうした場での活躍を実現したいと考えているのです」とHassabisは述べている。

そのようなわけでAlphaGoは囲碁から離れることになる。但し、ただちに完全に手が切れるというわけではない。DeepMindは、イ・セドル戦からのAlphaGoの進化過程を報告書としてまとめる予定なのだという。また、囲碁初心者が囲碁の魅力を知り、また経験者がより高いレベルになるための学習ツールの開発も行なっているのだとのこと。中国で行われたイベントでも見られたが、柯潔もAlphaGoから学び戦術を自分のものとして取り入れたりしている。そのような可能性をもったツールが登場するのは大いに楽しみだ。

原文へ

(翻訳:Maeda, H

DeepMindのAIに負けた囲碁の世界チャンピオンが最終戦直前のゲームで勝利…AlphaGoを上回る妙手で

screen-shot-2016-03-13-at-11-24-49-am

マシン3勝、人間1勝…これが、DeepMindのAlphaGo対人間の囲碁世界チャンピオンLee Sedolの、5番勝負のこれまでの結果だ。

先週GoogleがオーナーであるそのAIは、Sedolとの初戦に勝って歴史的な勝利を達成した。初めてマシンが、世界クラスのプロの囲碁プレーヤーを負かしたのだ。その後、そのアルゴリズムは続く2試合にも勝って3連勝を達成、5番勝負における勝利を確定した。

しかし、まだ2試合残っている今となってSedolは、(The Vergeによれば)第4試合に勝ち、人類のために1勝を取り戻した。

DeepMindのファウンダーDemis Hassabisのツイート(下図)によると、マシンの負けは、第78手におけるSedolの妙手に圧(お)されて、致命的なミスを犯したためだ。

AlphaGoは、囲碁というとてつもなく複雑なゲームをマスターするために、二つの人工知能テクニックを併用している。それは、深層学習(deep learning, ディープラーニング、多段構造のニューラルネット)とモンテカルロツリー検索(Monte Carlo Tree Search)だ。それによりこのAIは、数百万のゲームをシミュレートでき、その結果から学んだことを一般化して囲碁の戦略を作り出す。明らかにその成功率は高いが、しかし不敗ではない。

今年の初めにGoogleのブログ記事は、AlphaGoの前に立ちふさがる複雑性というチャレンジを、こう説明している:

“囲碁には陣形が1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000とおりありえる。それは宇宙の原始の数よりも多く、チェスの10の100乗倍である”。

AlphaGoのSedolに対する勝利は、彼が世界第二位のプロの囲碁プレーヤーであるだけに、見事という言葉しかないが、人工知能は未だに、やれることの幅が極端に狭い。言い換えるとそれらはいずれも、きわめて特定的なタスクのために設計されている。チェスに、あるいはJeopardy(ジョパディ)に強くなるため、とか。

人工知能の究極の目標は言うまでもなく、汎用性のある学習AIを作ることだ。多面的なインテリジェンスを適用して、さまざまな種類の問題を解けること。そしてHassabis自身も認めるように、今の単一目的のAIマシンですら、オフボードゲームの世界の混沌とした複雑性において勝利を獲得することからは、まだまだはるかに、遠い位置にいるのだ。

人間が行う仕事は、一見単純なものですら、…たとえば部屋を片付けるようなことでも…、そこに存在する変数の数は、もっとも高度なマシンインテリジェンスですら愚鈍に見えるほどに、膨大なのだ。だからわれわれ人間は、囲碁に負けたぐらいで落ち込む必要はない。

このAlphaGoシリーズの最終戦は、3月15日に行われる。ライブの実況を、 YouTubeで観戦できる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))