Facebookのオープンソースの囲碁ボットはプロの棋士に勝つ

碁(囲碁)は機械学習の研究者の必須科目だ。GoogleのDeepMindはそのアルゴリズムを魅せつけて有名になり、そしてFacebookも最近、碁ボットを自分で作っていることを発表した。同社のデベロッパーカンファレンスF8で今日(米国時間5/2)行われたそのELF OpenGoボットの発表では、30名の人間棋士との計14試合に全勝し、プロの資格を獲得した、と宣言された。

FacebookのCTO Mike Schroepferはこう述べた: “DeepMindにいるお友だちの偉業には敬服するけど、でも、まだ答えられていない疑問があるのではないだろうか? これらのツールは、ほかにどんなことに利用できるのか?”。Facebookが今日のブログ記事で言っているのは、DeepMindのモデル本体は不透明な包装紙に包まれたままだ、ということ。対照的にFacebookは、そのボットをオープンソースにした

“これを再現可能にしてしかも世界中のAI研究者が利用できるようにするために、われわれはオープンソースの碁ボットを作り、ELF OpenGoと名付けた。これなら、DeepMindのAlphaGoが答えなかった重要な疑問にも十分、答えることができるだろう”、とチームは主張している。

チームが関心を持っているのは、碁だけではない。FacebookのAI研究グループは、StarCraftボットも作って、あのゲームの混沌とした世界にプレーヤーが対応できるようにした。これも、オープンソースにする予定だ。Facebookはまだ、訓練量が十分ならどんなゲームでも学習できるボットをローンチできるところまでは行ってないが、でもチームはそれに向かって相当前進していることは確かだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

トップ棋士に3連勝したAlphaGo、引退を表明

盤上ゲームの中で最も戦略的とされる囲碁を打つために開発された、GoogleのAlpha Goが引退することになった。中国で世界最高レベルの打ち手をことごとく破ってからの引退ということになる。最後に対局したのは、世界トップランクの柯潔だ。中国で行われたイベントにて3局戦ったが、いずれもAlphaGoの勝利(3-0)となった。

AlphaGoはもともと、ロンドンのDeepMindにより開発されたものだ。DeepMindは2014年に5億ドルほどの金額でGoogleに買収されている。尚、今回のイベントでは人間5人を同時に相手にするいわゆる「相談碁」でもAlphaGoが勝利している。AlphaGoが世界的な注目を集めたのは、昨年前世界チャンピオンのイ・セドルを破ってからだ。今回の柯潔との対局や相談碁、あるいはペア碁を見るに、どうやらAlphaGoは次のレベルに到達しているようだ。

AlphaGoの引退を発表した、DeepMindのCEOであるDemis Hassabisは次のように語っている

囲碁発祥の地とされる中国で、世界トップレベルの棋士と連戦することは、AlphaGoにとっても進化のための最高の機会となりました。このような最高の機会を経験し、AlphaGoは引退させることといたしました。

今後、AlphaGoの開発チームは「次のレベル」のための開発に注力することとなります。アルゴリズムをより汎用的なものに改造し、この世の中に存在する複雑な問題を解決するためのお手伝いができるようになればと考えています。想定しているのは、病気の治療方法の発見や、消費エネルギーの劇的削減、革新的な新素材の開発などです。

ボードゲームの中でもっとも複雑だとされる囲碁にチャレンジすることで、AIの能力を高め、人間と関わるやり方も磨いてきたわけだ。Googleだけでなく、Tencentもゲームの中でのAIの活用/成長を狙っている。ゲームの世界で、その可能性を実証して注目を集めることで、次のステップに進む準備が整ったと判断したのだろう。AlphaGoは、新たな段階に進むことを決断したわけだ。

これまでにもDeepMindは、実用分野での可能性を探ってきている。昨年にはイギリスの国民保険サービスとの間で情報共有について合意している。但しこれは、営利企業に対して膨大な数の個人データを引き渡すことになるわけで、反対の声もおおくあがっている。現在は個人情報補語監視機関(Information Commissioner’s Office:ICO)による精査が行われているところだ。

こうした混乱は、AI技術自身がもたらしたものではない。しかし活躍の機会を、現時点で十分に活用できていないということにはなる。

「医療分野においても、AIが新たな知識や問題の解決法をもたらすことができれば、これは大きなブレイクスルーとなるわけです。はやくそうした場での活躍を実現したいと考えているのです」とHassabisは述べている。

そのようなわけでAlphaGoは囲碁から離れることになる。但し、ただちに完全に手が切れるというわけではない。DeepMindは、イ・セドル戦からのAlphaGoの進化過程を報告書としてまとめる予定なのだという。また、囲碁初心者が囲碁の魅力を知り、また経験者がより高いレベルになるための学習ツールの開発も行なっているのだとのこと。中国で行われたイベントでも見られたが、柯潔もAlphaGoから学び戦術を自分のものとして取り入れたりしている。そのような可能性をもったツールが登場するのは大いに楽しみだ。

原文へ

(翻訳:Maeda, H

AlphaGo、世界ランク1位のプロ棋士に連勝

AlphaGoは、AIの実力が人間を上回ることを再度証明してみせた。人間の方が上回る点がないわけではなかろう。しかし少なくとも囲碁に関しては、AIの実力が人類を上回るようなのだ。

AlphaGoがその名を轟かせたのは、トップレベルの棋士であるイ・セドルを4対1で破ってからのことだ。しかしそこにとどまらず、AlphaGoは世界ランク第1位の柯潔にも連勝してみせたのだ。この対局は全3局が予定されており、今週中に第3局が打たれる予定となっている。

柯潔は現在19歳。第1局は半目勝負(非常な僅差)であったものの、今回は中押し負け(途中でのギブアップ)に追い込まれてしまった。AlphaGoのアナリストによれば、序盤はむしろ柯潔がうまく打っていたのだとのこと。

「これは勝てるのではないかと、どきどきしていたんだ。中盤では勝ちそうだと思ったよ。でもAlphaGoの方はそう感じていなかったのかもしれないね。こちらは心臓の音が聞こえるほど舞い上がっていたけどね」と、対局後に柯潔は述べていた

対局はもう1局残っている。しかし第3局の結果がどうであれ、AlphaGoは世界が認めるナンバーワンプレイヤーを破ったことになるわけだ。歴史の転換点とも位置づけられる対局だったかもしれないが、中国では一切ライブストリーミングもされず、大きな不満の声も上がっている。

AlphaGoを生んだのはロンドンに拠点をおくDeepMindだ。2014年にはGoogleが同社を5億ドルほどて買収している。プロ棋士に勝利するという話は広く世間の耳目を集めるが、DeepMindは囲碁以外の知的活動分野でも世の中の課題を解決し、実用的AIを構築しようともしている。

ただし、そちらの方面ではまだ十分な結果が出ているとは言えない状況だ。たとえばイギリスのNHS(National Health Service:国民保険サービス)との間で、避けられる死を防ぐための医療を構築するためにデータ共有することとしたが、このデータ共有については不適切なものであるとの判断が下されてもいる。

膨大な数の患者データを、Googleの所有する企業に提供することが適切かどうかについて大いに議論になっているわけだ。DeepMindとNHSとの共同プロジェクトについては、データ保護の観点からも検証しているところでもある。

原文へ

(翻訳:Maeda, H

GoogleのAlphaGo、囲碁の世界チャンピオンに対し(半目差で)勝利

GoogleのAlphaGoが、こんどは世界チャンピオンの柯潔を破る成果を達成した。全3戦の予定で、木曜日および土曜日にも対局が組まれているが、まずは第一局に勝利したのだ。勝負は半目勝負(非常な僅差)となったが、AlphaGoが目指すのは「勝利」であり、大差をつけることや、あるいは中押し勝ち(相手のギブアップ勝ち)を目指すようにはなっていない。この勝負がAlphaGoにとって、どの程度に難しいものであったのかは、半目差という結果からうかがい知ることはできない。

柯潔は、最近では比較的珍しい手(三々)からスタートし、かつAlphaGoが打った手に対して、即座に形を決める手(AlphaGoの星に三々入り)を打って対局を開始した。しかし、AlphaGoを意識したこの作戦も、奏功することはなかった。柯潔の手に対してAlphaGoは斬新で予想外の手で応じてきたのだが、専門家たちはAlphaGoが地合(囲碁でのポイントのこと)よりもそれぞれの石を最大限に働かせるための手を打ったと評している。

柯潔は対局後、AlphaGoの能力に驚きかつ感心したと述べた。AlphaGoの着手に対して「人間同士の対局では見たことのない手」とも述べていた。ちなみに対局は5月27日まで開催されているAlphaGo/AIカンファレンスの一環として行われたものだ。

先にも述べた通り、AlphaGo対柯潔の対局はあと2局を残している。その他にもAlphaGoが人間の棋士とペアを組み、べつの人間とAlphaGoのペアと対局するイベントも用意されている。

原文へ

(翻訳:Maeda, H

Google DeepMindの新しい人工知能、DNCは地下鉄路線図から適切な経路を割出す

A web of dots connected by lines against a black background

2011年のノンフィクションのベストセラー、『ファスト&スロー あなたの意思はどのように決まるか』(早川書房)(Thinking, Fast and Slow)でノーベル賞経済学者のダニエル・カーネマンは、人間の思考は基本的に2つに分かれると主張した。この2つの区分はそれぞれ、適切にも、速い思考と遅い思考と名付けられている。

前者はいわば「勘に頼る」思考だ。物事に対する最初の直感的、自動的な反応といってもいい。後者は熟慮された内省を経た思考で、これを得るには時間がかかる。DeepMindの新しいアルゴリズムがもたらそうとしているのは、この「遅い思考」だ。近い将来、カーネマンの言う「遅い思考」が機械学習の手が届く範囲に入ってくる可能性がある。

Googleの子会社、DeepMindNatureに発表された新しい論文でディフェレンシャブル・ニューラル・コンピューター(DNC=differentiable neural computer)と名付けられた機械学習への新しいアプローチを説明している。新しいコンピューターといってももちろん物理的なハードウェアという意味ではない。情報を組織化し、この知識を適用して特定の問題を解決する新しいテクニックと呼ぶべきだろう。.

ニューラル・ネットワークは、本質的には、きわめて洗練された試行錯誤の過程だ。この過程が最終的に答えにたどり着く。こうしたフレームワークはある問題の解決に極めて有効だ。しかし相互に関連する既知の事実の集合を適用して現実世界の問題を解決する上ではさまざな改善の必要があった。

DeepMind

DeepMindの新しいテクノロジーは メモリにコンテンツを保存するというコンセプトと古典的なコントローラーをを用いたニューラルネットワークとを融合するものだ。コントローラーは次のいずれかの方法で情報を記憶する。すなわち新しい位置に記憶するか、既存の情報をその位置で書き換えるかだ。この過程を通じて新たなデータが書き込まれるタイムライン上で連想が形成される。

情報を取り出すためにコンテンツをメモリに保存する場合もコントローラーはその同じタイムラインをを利用する。このフレームワークはナビゲーション可能でコンテンツのグラフ構造から意味ある認識を得るのに有効であることが証明された。

消費者の購買傾向やGPSによるナビゲーションといった現実の複雑な行動がこうした知識グラフの形で表現される。DeepMindではデフェレンシャブル・ニューラル・コンピューターをロンドンの地下鉄路線図の認識に応用し、 コンピューターに記憶された構造化データから正しい経路を生成する生成することに成功した。
同社によれば、次のステップは、大規模なデータセットを処理できる新しいアルゴリズムの開発になるだろうという。

DeepMindのサイトでこの問題に関するさらに詳しい記事を読むことができる。

画像:Ralf Hiemisch/Getty Images

〔日本版〕 DeepMindはGoogleが買収した機械学習のスタートアップで、今年3月にAlphaGoが囲碁の世界チャンピオンを破ったことで一躍注目を集めた。differentiable neural computerについては現在日本語定訳がないようなのでそのままカナ表記とした。differentiableは数学用語では「微分可能な」、一般用語としては「区別できる」という意味。バベッジの最初のコンピューターがdifferential engine(差分機関)と名付けられたことと関係があるかどうかは不明。なおULR文字列がやや奇妙だが原文記事は通常どおり公開されているのでそのまま利用した。

[原文へ]

(翻訳:滑川海彦@Facebook Google+

Google曰く:囲碁チャンピオンを破ることで、人工知能が「人間に見えない答を見つけられる」ことを示した

screenshot-2016-03-09-16-02-34

Googleが開発した人工知能(AI)が最強の囲碁プレーヤーを破った歴史的瞬間については数多く語られている。

囲碁はその膨大な打ち手の可能性から、AIにとって究極のテストの一つと見られている。「一回のゲームには、1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000 種類の可能な打ち手がある ― これは宇宙の原子の数よりも多く、チェスのグーゴル(10の100乗)倍以上である」と、Googleは今年1月に言った

対局のシリーズ ― AlphaGoが4勝1敗で制した ― を見逃がした人や、何がそんなにすごいのかがわからない人たちのために、その一般的重要性についてGoogleがブログで説明している

もはや単なるゲームとはかけ離れている。AlphaGoを開発したGoogle傘下の会社、DeepMindのCEO・共同ファウンダー、Demis HassabisはこのAIの進歩について、人間に馴じみのない、あるいは不可能な方法で問題を解くためにAIを利用できることの証明であると語った。

この体験から2つの重要なことを学んだ。まず、このテストはAIが他の問題を解く可能性を示す良い前兆である。AlphaGoはあらゆることを「グローバル」に見る能力を持っている ― そして人間が行わないよう訓練を受けてきた、あるいは考慮すらしなかった答を見つける能力を。これは、AlphaGoのような技術を使えば、他の分野でも、人間が必ずしも見出せない答を見つけられるという大きな可能性だ。

さらにHassabisは、人間対機械と称されているこの対決が、実際には人間対人間のテストであることを指摘した。なぜなら、AlphaGo自身が生き物だからだという。

AlphaGoは実際には人間の業績だ。[囲碁世界チャンピンでAlphaGoの対戦相手の]イ・セドルとAlphaGoチームは、互いに相手が新しいアイデアやチャンスや解決方法を生みだすことを強いた ― それは長い目で見れば全員の利益になるものだ。

DeepMindのCEOは、自らの1勝を重要な出来事だと言うイ棋士の才気に敬意を表すとともに、成し逐げた進歩にかかわらず、人工知能の未来について地に足をつけて考えている。

「人間にできる幅広い知的作業をこなす柔軟性を学習できる機械 ―真の人工汎用知能の証明 ― までにはほど遠い」とHassabisは言った。

祝福が終った今、DeepMindはいつものつらい勉強に戻らなくてはならないようだ。先週の出来事は、DeepMindに何が出来るかに光を当て広く認知させるものであり、囲碁というゲームに限らず、今後DeepMindの将来のプロジェクトへの関心を高めることは間違いない。

[原文へ]

(翻訳:Nob Takahashi / facebook

DeepMindのAIに負けた囲碁の世界チャンピオンが最終戦直前のゲームで勝利…AlphaGoを上回る妙手で

screen-shot-2016-03-13-at-11-24-49-am

マシン3勝、人間1勝…これが、DeepMindのAlphaGo対人間の囲碁世界チャンピオンLee Sedolの、5番勝負のこれまでの結果だ。

先週GoogleがオーナーであるそのAIは、Sedolとの初戦に勝って歴史的な勝利を達成した。初めてマシンが、世界クラスのプロの囲碁プレーヤーを負かしたのだ。その後、そのアルゴリズムは続く2試合にも勝って3連勝を達成、5番勝負における勝利を確定した。

しかし、まだ2試合残っている今となってSedolは、(The Vergeによれば)第4試合に勝ち、人類のために1勝を取り戻した。

DeepMindのファウンダーDemis Hassabisのツイート(下図)によると、マシンの負けは、第78手におけるSedolの妙手に圧(お)されて、致命的なミスを犯したためだ。

AlphaGoは、囲碁というとてつもなく複雑なゲームをマスターするために、二つの人工知能テクニックを併用している。それは、深層学習(deep learning, ディープラーニング、多段構造のニューラルネット)とモンテカルロツリー検索(Monte Carlo Tree Search)だ。それによりこのAIは、数百万のゲームをシミュレートでき、その結果から学んだことを一般化して囲碁の戦略を作り出す。明らかにその成功率は高いが、しかし不敗ではない。

今年の初めにGoogleのブログ記事は、AlphaGoの前に立ちふさがる複雑性というチャレンジを、こう説明している:

“囲碁には陣形が1,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000,000とおりありえる。それは宇宙の原始の数よりも多く、チェスの10の100乗倍である”。

AlphaGoのSedolに対する勝利は、彼が世界第二位のプロの囲碁プレーヤーであるだけに、見事という言葉しかないが、人工知能は未だに、やれることの幅が極端に狭い。言い換えるとそれらはいずれも、きわめて特定的なタスクのために設計されている。チェスに、あるいはJeopardy(ジョパディ)に強くなるため、とか。

人工知能の究極の目標は言うまでもなく、汎用性のある学習AIを作ることだ。多面的なインテリジェンスを適用して、さまざまな種類の問題を解けること。そしてHassabis自身も認めるように、今の単一目的のAIマシンですら、オフボードゲームの世界の混沌とした複雑性において勝利を獲得することからは、まだまだはるかに、遠い位置にいるのだ。

人間が行う仕事は、一見単純なものですら、…たとえば部屋を片付けるようなことでも…、そこに存在する変数の数は、もっとも高度なマシンインテリジェンスですら愚鈍に見えるほどに、膨大なのだ。だからわれわれ人間は、囲碁に負けたぐらいで落ち込む必要はない。

このAlphaGoシリーズの最終戦は、3月15日に行われる。ライブの実況を、 YouTubeで観戦できる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

GoogleのDeepMindがAIの大きな画期を記す: 囲碁の世界チャンピオンLee Sedolに第一戦で勝利

screenshot-2016-03-09-16-02-34

GoogleがオーナーであるロンドンのDeepMindの囲碁ソフトが、世界チャンピオンのLee Sedolに勝ち、人工知能(AI)の開発史に特筆すべき新たな画期が刻まれた。

韓国のソウルで行われた五番勝負の第一戦で今日、そのソフトウェアAlphaGoは、Leeが持ち時間29分弱を残す時点で負けを認めたため、早期の勝利を手にした。最後の第五戦は来週火曜日(米国時間3/15)に行われ、YouTubeはそれまでの全試合をライブで放送する。勝者の賞金は、100万ドルだ。

AIの進歩は、戦略ゲームのトッププレーヤーに対する勝利で歴史に刻まれる。チェスのグランド・マスターGarry KasparovがDeep Blueに負けたのは1997年、IBMのWatsonがJeopardyで勝ったのは2011年だが、東アジアで数世紀の伝統を持つ囲碁の戦略と知的な深さは、AIの作者に最強のチャレンジを提供し、そのことはGoogle自身も認めていた

DeepMindをGoogleは2年前に5億ドルあまりで買収したが、同社は囲碁専用のソフトウェアAlphaGoを制作した。そして昨年10月にはヨーロッパチャンピオンFan Huiに勝利し、AIが囲碁で人間に勝ったのはそれが初めてとなった。しかし33歳のLeeは、囲碁のレジェンドと呼ばれる9段のプロで、世界最強の囲碁プレーヤーと言われる。

昨年Fan Huiに勝ったとき、DeepMindの協同ファウンダーDemis Hassabisは、AlphaGoの開発は今でも進行中であり、ゲームのテクニックを自力で磨いている、と説明した:

AlphaGoは、自分自身を超えていく。できれば最終的には、この分野の最強の人間が自己を限りなく磨き続けるように。新しいことを自分で発明していく様子は、見ていて本当にすごいと思う。もちろんそれは、囲碁という特定のゲームの枠内のことではあるが、われわれは今では、自分たちた作ったシステムに、厚い親近感すら抱(いだ)いている。とくに、それが作られていくやり方に対する親近感だ。そのやり方とは、自分で学習し、われわれがある程度は教育訓練し、そして、まるで人間のようなスタイルでゲームをプレイしていく。それは、すべての状況や条件等が分かっている状態で人間が手作りしていく従来のプログラムとは違う。それは物事を自分で拾い上げる。だからこそ、それが自力で習得していく能力が、すばらしく思えるのだ。

今度は、第一戦からLeeが何を学んだかが見ものだ。それが木曜日(米国時間3/10)の第二戦で分かる。試合の実況ストリーミングは、YouTube上のDeepMindのチャネルで見られる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))