クーガーは、大勢の人々が街角や商業施設内を歩き回る状況を生成するAI学習シミュレータ「Dimension」を開発、提供を開始した。同社が持つゲームAIの知見を応用したプロダクトで、自動運転車や自律移動型ロボットのAIのトレーニングやテストに利用する。1億通り以上のシーンを生成できる自由度と、動画像とLIDAR(レーザーを用いた測距技術、関連記事)データの両方を生成できる点が特徴。すでに本田技術研究所や中部大学が研究目的で利用中である。
このAI学習シミュレータが登場した背景には、自動運転車、自律移動型ロボット、ドローンなどの研究開発ニーズが拡大している状況がある。クーガー代表取締役CEOの石井敦氏は次のように説明する。「自律的に行動するロボットや自動運転車は、やがて人が行動している状況の中で一緒に活動するようになる。ところが人の外見や行動は多様なので、AIが理解する上ではまだハードルが高い。髪型や服の色、持ち物が違うと認識を誤る場合がある。例えばスケートボードに乗って移動する小さな子供のように行動が大幅に異なる存在も認識できる必要がある。このような状況を数多く体験して学習し、テストを繰り返すことが重要だ」。多様な姿形の人々が自由に動き回る複雑な状況をシミュレートする技術では、大規模オンラインゲーム制作に参加した経験があるクーガーの技術が活きると石井氏は説明する。
路上を走る自動運転車の研究は盛んだが、それ以外にも商業設備内を自律的に移動するロボットなどの取り組みも多数登場している。多くの種類の状況(シーン)を生成できるDimensionには、AIの学習やテストのためのニーズが大きいと同社は考えている。現実の人間とロボットを一緒に歩き回らせて学習するやり方も考えられるが、それは「エキストラを連れてきて映画を撮影するようなもの」(石井氏)で限界がある。多くの状況をシミュレートできるDimensionはより多くの学習データを作り出すことができるという訳だ。
動画像とLIDARセンシングデータを生成
Dimensionの機能上の特徴は、1億通り以上のシーンを生成できること、また動き回る人々を含めた動画像とLIDARのセンシングデータの両方を生成することだ。動画像は人間に見せるためのものではなく、AIの機械学習の学習データに利用する。そこで「学習させて精度が出るデータ」を作る上では「服の色、持ち物の色などでどのようなランダム性を保たせるべきか」など独自のノウハウがあるとのことだ。
一方、LIDARのセンシングデータはCGで生成した動画像と異なり現実との違いが出ない。そこで自動運転車やドローンでは画像センサーとLIDARを併用する例が多い。
AIトレーニング用シミュレータの試みは、Microsoft ResearchのAirSimがあり(参考記事)、Elon Mask氏らが立ち上げたOpenAIでも学習プラットフォーム「Universe」の取り組みがあった(関連記事、参考記事)。また、DeepMindがBlizzardの戦略ゲームStarCraft IIをAI学習に用いた例もあった(関連記事)。人が登場する複雑なシーンをシミュレートできるゲームAIを学習(トレーニング)に用いるアイデアはすでにいくつも登場している。その中で、クーガーは「ゲームAIとロボット用の機械学習の両方の知見を持つ会社はまだ少ない」と自信を示している。
クーガーは、最近では感情表現を取り入れたCGキャラクターによるAIアシスタント「バーチャルヒューマンエージェント」の開発にも取り組んでいる(関連記事)。将来的には、例えば自動車の自動運転のトレーニングにはシミュレータを使い、自動車内部の人と機械のコミュニケーションにバーチャルヒューマンエージェントを活用するといった活用も視野に入れている。