科学者が人間を狩り殺すことを機械に教えている ‐ ただしDoomの中で

14810867549_86907a635d_o

とある研究の一端を見る機会があったときに、あなたはふと考える「これは興味深い技術的な問題だと思うけれど、AIに人間狩りと殺人を教えることは、人類の存続にとって危険な道を切り拓くのではないだろうか?」

これもその機会の1つだ。

カーネギーメロン大学では人類に対する裏切り者たちが、ニューラルネットワークアプローチを使い文字通りの殺人マシンとなるAIを作っている。まあおそらく私は正確には、フラッギングマシン(ゲームの中で敵を倒す機械)と呼ぶべきだろう、なぜならそれはDoomのデスマッチの中でのみ殺人を行っているからだ。さて、あなたはもちろん、それに何の問題が?その死は仮想的なものに過ぎない、と言うことができる。では何故それが問題になるのだろうか?コンピュータにとっては すべてが仮想的だ。それについて考えて欲しい。

あなたは疑問に思う:これはこれまでずっとゲームの中にいたボットとどう違うのか?コンピュータプレイヤーはずっと存在してきたじゃないか!

あなたは鋭い観察者であり状況の読み手だが、考えてみて欲しい:それらのボットはゲーム自身の中で走り回るプログラムで、全ての変数、座標、エッジ、銃の位置とスペック、そして回復キットの場所を知っている。任意のNPC(非プレイヤーキャラクター)と同様に、それらのロボットはあるゲーム内変数に、ある方法で反応するようにプログラムされている。

これに対してGuillaume LampleとDevendra Singh Chaplotによって作成されたAIは、ゲームを私たち人間がプレイするやり方でプレイする:スクリーンを見て、自分の状況と向きを認識し、マップ上での進路を決め、動くものを何でも攻撃する。それは本質的には、スペースインベーダーのようなより簡単なゲームを支配する方法を学ぶことと類似した手法を使い、スコアを最大化する入力を見つけ出すAIを、レベルアップしたものだ。

これがそのアクションシーンだ:

ニューラルネットは主にピクセルデータ ‐ つまり、あなたが実際に画面で見るものだ ‐ を使って訓練を受けている。しかし、作成者たちは、スクリーン上にあるものが敵かアイテムかの基本的な内部情報をゲームエンジンから送り込むという、ちょっとしたずるをしなければならなかった。

その強化戦略は以下の通り;アイテムを拾い、長く移動し、敵を倒せば加点されるが、ダメージを受けたり瀕死になると減点される。さらに発砲に対しても軽い減点が加えられるようになっている、そうしないとマシンは無差別に発泡して、敵がその照準の先に迷い込んで来るのを待つことが、最善のテクニックだと判断してしまうからだ。これで安心だ!

この設定下で彼らのシステムは、ゲーム中のコンピューターと人間プレイヤーの両者を上回るパフォーマンスを達成した。Doomにおけるゲーム内のコンピューターは全く高度なものではないため、彼らは易々と砲弾の餌食となった。

doom_ai

これは実際には2つのシステム(もしあなたがそう呼びたい場合には脳葉)に分割される。ナビゲーションサイドは移動とアイテムの収集を駆動し、そしておそらく環境映像を解釈する方法を学習している。そしてシューティングサイドは、敵がスクリーン上に現れると制御を握り、正しい方向に銃を向け銃爪を引く。

私たちは、スカイネットの誕生を目撃しているのだろうか?または、おそらく、程なくどこかのスタートアップ企業が、マルチプレイヤーゲームのための汎用戦闘AIを売り込んで来るのかも?どちらにしてもかなり怖ろしい話だ。

FPSをプレイするAIについて説明したLampleとChaplotの論文はArxivで無料で読むことができる

[ 原文へ ]
(翻訳:Sako)