いにしえのASCIIアドベンチャーゲーム「NetHack」への挑戦から見えるAIの未来

機械学習モデルはすでにチェスや囲碁Atari(アタリ)ゲームなどをマスターしているが、Facebookの研究者たちは、AIを世界で最も難しいといわれる、無限に複雑な「NetHack(ネットハック)」に挑戦させて、さらにレベルを押し上げようとしている。

Facebook AI ResearchのEdward Grefenstette(エドワード・グレフェンステット)氏は次のように話す。「私たちはこのゲームで、最も利用しやすい「グランドチャレンジ」を構築しようと考えました。AIを解き明かすことはできませんが、より優れたAIを実現するための道筋を示すことができます。ゲームは、機械を賢くする要素、機械をダメにする要素について仮定を導き出す良い方法です」。

NetHackを初めて耳にする読者も多いだろうが、これは古今東西最も影響力のあるゲームの1つだ。あなたはファンタジー世界の冒険者で、毎回異なるダンジョンでどんどん危険な深みにはまっていく。モンスターと戦い、罠や危険を回避しながら、神と良い関係を築く。これは(はるかにシンプルな元祖「ローグ」の後の)最初の「ローグライク」ゲームで、間違いなく今でも最高で、ほぼ間違いなく最も難しい作品だ。

(なお、NetHackは無料で、ほとんどのプラットフォームでダウンロードしてプレイすることができる)

ゴブリンは「g」、プレイヤーは「@」、ダンジョンの構造は線と点で表すなどの、シンプルなASCIIグラフィックとは裏腹に、NetHackは驚くべき複雑さを持つ。というのも、1987年に登場したNetHackでは、その後も開発チームが交代しながら、オブジェクトやクリーチャー、ルール、そしてそれらを取り巻く無数のインタラクションを増やし続け、活発な開発を続けているからだ。

これこそが、NetHackがAIにとって非常に困難で興味深いチャレンジとなる理由の1つである。オープンエンドなNetHackでは、世界が毎回変化するだけでなく、すべてのオブジェクトやクリーチャーとインタラクションすることができる。インタラクションはほとんどが何十年もかけて手作業でコーディングされ、プレイヤーのあらゆる選択肢を可能にしている。

タイルベースのグラフィックにアップデートされたNetHack。今まで同様、すべての情報がテキストベースだ

「Atari、『Dota 2』、『StarCraft 2』などのゲームを進化させるために必要とされたソリューションは非常に興味深いものですが、NetHackには、それとは異なる課題があります。人間としてゲームをプレイするためには、人間の知識が必要です」とグレフェンステット氏は話す。

NetHack以外のゲームでは、勝つための戦略が多かれ少なかれ明らかになっている。もちろん、Dota 2のようなゲームは、Atari 800よりも複雑だが、考え方は同じだ。プレイヤーが操作する駒、環境というゲームボード、目標となる勝利条件がある。NetHackでもそれは同じだが、もっと複雑怪奇だ。まず、ゲームが細部も含め、毎回異なる。

「新しいダンジョン、新しい世界、新しいモンスターやアイテム、セーブポイントがないなど。ミスをして死んでしまったら、生き返ることはできません。現実の世界に似ていますね。失敗から学び、その知識で武装して新しい状況に臨むのです」と、グレフェンステット氏。

腐食性のポーションはもちろん飲むべきではないが、それをモンスターに投げつけたらどうだろうか?武器に塗るのは?宝箱の錠前にかけるのは?水で薄めたらどうだろう?人間はこれらの行為を直感的に理解するが、ゲームをプレイするAIは人間のようには考えない。

NetHackのシステムの深さと複雑さを説明するのは難しいが、その多様性と難しさはAIのチャレンジに相応しいとグレフェンステット氏は話す。

ニューラルネットワークではなく、(ゲームと同じくらい)複雑な決定木を用いたゲームプレイ用のボットは、何年も前から設計されている。Facebook Researchチームは、機械学習を用いたゲームプレイのアルゴリズムをテストできる学習環境を構築することで、新しいアプローチを生み出したいと考えている。

AIが認識している内容がラベルで表示されたNetHack

NetHack学習環境(NetHack Learning Environment、NLE)は2020年完成したが、NetHackチャレンジはまだ始まったばかりである。NLEは専用のコンピューティング環境にゲームを組み込んだもので、AIはテキストコマンド(指示、攻撃やポーションを飲むなどのアクション)でNLEとやり取りする。

野心的なAIデザイナーにとっては魅力的なターゲットだ。StarCraft 2のようなゲームの方が知名度は高いかもしれないが、ゲーム界のレジェンドであるNetHackで、他のゲームに適用されたモデルとはまったく異なる方法でモデルを構築するというのは興味深いチャレンジである。

また、グレフェンステット氏の説明のように、NetHackは過去の多くのゲームと比較して、利用しやすいゲームだ。StarCraft 2用のAIを作ろうと思ったら、ゲーム内の画像で視覚認識エンジンを実行するために、大規模なマシンパワーが必要だろう。しかし、NetHackはゲーム全体がテキストで構成されているため、非常に効率的に作業を行うことができる。ベーシックなコンピューターでも人間の何千倍もの速さでプレイすることができるので、(他の機械学習の手法には欠かせない)高性能なデバイスを持たない個人やグループでも挑戦することが可能だ。

グレフェンステット氏は「私たちは、大規模な学術研究機関に限定せずに、AIコミュニティに多くのチャレンジを提供できる研究環境を構築したいと考えていました」と話す。

今後数カ月間はNLEが公開され、競技者は基本的に自分の好きな手段でボットやAIを作ってテストすることができる。2021年10月15日に本格的な競技が開始されると、特別なアクセスやRAMのテストなどはできず、制御された環境の中で標準的なコマンドを使ってゲームを操作するように制限される。

競技の目標はゲームをクリアすることで、Facebookチームは、一定時間内にエージェントがNetHackの「アセンション」を何回行ったかを記録する。しかし「どのエージェントでもアセンションがゼロになるだろうと想定している」とグレフェンステット氏は認めている。結局のところ、このゲームは史上最も難しいゲームの1つであり、何年もプレイしている人間でも、数回連続で勝利することはおろか、一生に一度でも勝利することが難しいのだ。その他にも、いくつかのカテゴリーで勝者を判定するための採点基準がある。

このチャレンジが、より本質的に人間の思考に近い、新しいAIへのアプローチの種になることを期待している。ショートカット、トライ&エラー、スコアハック、ザーグ戦術(量で圧倒する戦術)はここでは通用しない。エージェントは論理体系を学び、それを柔軟かつ知的に適用する……さもないと、怒り狂ったケンタウルスやオウルベアに殺されることになる。

NetHackチャレンジのルールやその他の詳細については、こちらを参照のこと。結果は年内に開催されるNeurIPS(Neural Information Processing Systems、ニューラル情報処理システム)カンファレンスで発表される予定だ。

関連記事:AI応用のMRIは4分の1の時間で従来と同等の結果を得られることが盲検法で判明

カテゴリー:人工知能・AI
タグ:Facebook AI Research機械学習ゲーム

画像クレジット:Facebook / Nethack

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。