AragoのAIは囲碁よりも複雑なシヴィライゼーション類似のゲームで人間のプレイヤーを上回り始めた

hiro-freeciv

AragoのフラッグシッププロダクトHIRO AIは、Freeciv(長年人気を誇っているシド・マイヤー監修のシヴィライゼーションシリーズにインスパイアされた無料の文明構築シミュレーションゲーム)をプレイすることができる – そしてそれはますます巧みになってきている。Freecivは膨大な数の戦略が成功へと導く、複雑で広がりのあるゲームで、とくに予測できない人間相手だとその特徴が際立つ。しかし現在HIROは対戦する人間の8割を圧倒することができるようになったことがTechCrunch Disrupt London 2016の壇上でAragoから発表された。

ビデオゲーム勝つことは、どれほど複雑なのだろうか?まあ、それはあなたが選んだオプションや、Freecivのゲームで普通に起こる多くのターンの間に劇的に変化する可能性のある変数にも依存している。個々のゲームの可能な順列は10の15000乗にも達し、これが意味することは、個別の調整やターンの進め方を本当に「学習」するには、極めて可塑性の高いAIを必要とするということだ。

ゲームは、AIの能力をテストし証明するための共通のプラットフォームであることが明らかになっている;GoogleのAlphaGoは、その成功によって多くの注目を集めている例だ。Aragoは、Freecivをプレイする際に可能な打ち手の数が、実際に囲碁よりも指数関数的に大きかったことを指摘している。最高の人間相手に対戦を開始する前でも、まだHIROは小さいデータプールから少ないトレーニングを受けているだけだった。

ハンス・クリスチャン・ブーイング・アラゴ

HIROは既に、ゲームに同梱されているFreeciv内蔵の 「AI」相手には負ける事はなくなっていた(これは言いすぎかもしれない、内蔵AIに関しては追加情報を持っていないので)が、人間のプレイヤーを打ち負かすことができたのは初めてのことだ。まだ人間の対戦相手全員を負かすことはできないが、それでもプラットフォームの進歩を示す顕著な指標だ。

プロのようにゲームを行うことは素晴らしいことだが、それがHIROの唯一の目的ではない。このAragoのAIサービスは、まず第1にビジネス全体のIT自動化を改善しようとする企業に提供され、HIROは企業の人間のITエキスパートの能力拡張のために用いられ、時間の経過とともに、人間もAI自身も良くなっていく。

Aragoによれば、HIROは他のAIエージェントとは異なるやりかたでスマートになっていく。創業者兼CEOのHans-Christian Boosがステージ上で語ったことによれば、同社はHIROを「トレーナー」を使って教えているという。トレーナーは実際の言葉を使ってHIROに人間の手本を伝える、これが意味していることは彼らの機械学習は機械推論コンポーネントも含んでいるということだ。それによって機械はFreecivの例題の中で「タイル」とか「都市」といった概念を学んでいくことができる。これらの概念を想起して再結合することで、科学的(ゲームプレイ)能力とプロフェッショナル(エンタープライズIT)能力の両方に適用されるパフォーマンスの最適化に最終的につながっていく。

Aragoの目標は、具体的で狭いAIを作成することではなく、幅広いタスクを学び、実行できるより一般的なツールを作成することだ。シヴィライゼーション(そしてFreeciv)は、その目標をさらに進める上で役立ち、Boosは無償、戦略、そして莫大なコミュニティフィードバックという重要な要素が、前進の要素としてのFreecivの利用に役立ったということも指摘した。

[ 原文へ ]
(翻訳:Sako)