BaiduのAIチームが知識を一般化できる人間的能力を仮想エージェントに与えた

Baiduの人工知能チームが、重要な進歩を達成した: 上図のような2Dの環境で“生きている”仮想エージェントに、その世界での歩き方・進み方を、自然言語のコマンドで教えた。そのために言語能力を、肯定や否定を通じて強化した。とくにすばらしいのは、エージェントが“zero-shot学習”の能力を持ったこと、言い換えるとAIエージェントが初歩的な文法感覚を持つようになったことだ。

人間の場合それは、赤ちゃんのころに発達する能力だから、記憶にないのがふつうだが、でも親が子どもに教えるときは、それと同じことをしているのだ。子どもに画像を見せて、言葉を繰り返すと、肯定的な強化（ほめる、など）が十分にあれば、その子は言葉と画像を結びつけるようになる。そして、すごい！、物の名前をおぼえたのだ。

しかしBaiduが画期的なのは、エージェントが、学習したコマンドを新しい状況に適用できたことだ〔ゼロショット学習〕。コンピューターは通常、それまでに獲得した知識を新しい物事に当てはめることが得意ではない。Baiduの研究チームは、その違いを次のように説明している:

過去の知識を新しいタスクに適用することは、人間にはとても簡単だが、現在のエンドツーエンドの学習マシンにとっては依然として難しい。“ドラゴンフルーツ”の形状を知っているマシンに“このドラゴンフルーツをナイフで切れ”と命じても、このコマンドに含まれているデータセット（切れ、ナイフで）を明示的に訓練されていなければ実行できない。対照的にわれわれのエージェントは、ドラゴンフルーツの視覚的外見について知っていることを、“Xをナイフで切れ”というタスクに伝送する能力を示した。“ドラゴンフルーツをナイフで切れ”を、事前に明示的に訓練されていなくても”。

このように、前に使ったスキルを一般化できる能力は、人工知能の大きな進歩だ。つまりそれは、まるで人間がやるように、知識を学んでその既得の知識を他へ適用できることを示した。昔のビデオゲームのような、単純な2Dの環境だけど、信じがたい成果だ。ぼくの脳には、できないかもしれない。

[原文へ]
（翻訳：iwatani(a.k.a. hiwa））