初音ミクとも対話可能、クーガーがKDDIに技術提供、機械学習×ゲームAI×xR×ブロックチェーン

クーガーは、AIとxR(VR/AR/MR)を組み合わせた「バーチャルヒューマンエージェント」技術を開発し、KDDIの「バーチャルキャラクター×xR」プロジェクトに提供した(クーガーの発表資料KDDIの発表資料 )。

KDDIの発表会で見せたデモより

KDDI発表会のデモに使われたスマートグラス「R9」。重量181gで外見もコンパクト。このサイズにSnapdragon 835(2.45GHz、8コア)、6GバイトのRAM、128Gバイトのストレージ、1400mAhのバッテリーを搭載。視野角50度、表示機能は1080p×2(フルHD×2眼)。開発環境はAndroid Nougat(7.0)ベース

KDDIが4月26日に開催した「xR技術への取り組み」に関する発表会の場では、クリプトン・フューチャー・メディアのバーチャルシンガー「初音ミク」のキャラクターが米ODG社のスマートグラス「R9」により現実世界の中で動いて対話する「バーチャルヒューマンエージェント」のデモンストレーションを披露した。初音ミクが目の前に等身大で表示されていて、部屋の中の人物や置いてあるモノに関心を持って近寄ったり、褒める言葉をかけると喜んだり、ネガティブな言葉をかけると反発したりする。KDDIでは過去にARアプリによる地域密着型イベント「ミク☆さんぽ」を実施しているが、その次世代ともいえる技術になっている。

この事例では「初音ミク」をキャラクターとして起用しているが、もちろん他のキャラクターをエージェントに配役することも可能だ。

学術AIとゲームAIを掛け合わせ、ブロックチェーンでデータを管理

クーガーによるデモンストレーションから。スマートフォン上で「バーチャルヒューマンエージェント」を動かしている

「バーチャルヒューマンエージェント」はCGで表現したキャラクターを備えていて、実世界の中で「人に近寄る」「新しいモノに興味を持って近づく」ように振る舞いをする。また記憶と感情を持ち、振る舞いや会話にそれを織り交ぜるようにする。例えば「新しい椅子」や「初めての来客」などに反応する。

バーチャルヒューマンエージェントには多くの技術要素が組み込まれているが、大きな枠組みとして「2系統のAIを組み合わせた」とクーガー 代表取締役 CEOの石井敦氏は説明する。「学術分野で発達した深層学習などのAIと、ゲーム分野で発達したキャラクターAIは今まで接点がなかった。その両者を結びつけた」(石井氏)。記憶、感情があるかのように振る舞うキャラクターAIの部分ではゲーム開発の知見を盛り込み、一方で画像認識、空間認識の部分では自動運転技術にも応用されつつある機械学習の技術を応用している。

同社は、今回発表の「バーチャルヒューマンエージェント」を、「空間をスマート化する技術」として作り上げる「コネクトーム」と名づけた技術の中でヒューマンインタフェースを担当する技術として位置づけている。「コネクトーム」は脳の配線情報という意味をもつが、同社の技術名称としてのコネクトームは、前述の学術AI、ゲームAI、データをその所有権や信頼性が保てるよう管理するブロックチェーン技術、xR(VR/AR/MR)、IoTの各種技術を組み合わせた技術の総称である。

クーガーの技術「コネクトーム」の全体像。「バーチャルヒューマンエージェント」はコネクトームの入力、出力に相当する。データ管理にはブロックチェーン技術を活用

上の図が「コネクトーム」の全体像である。例えば今回発表の「バーチャルヒューマンエージェント」をスマートフォンをプラットフォームとして利用している場合は、(1) 情報の入力がスマートフォンのカメラ、マイク、6軸センサ、その他センサ。(2) 情報の出力が、スクリーンにCGキャラクターとして表示されてスピーカーから語りかけてくるバーチャルヒューマンエージェント、という形になる。また、音声認識関連ではクラウド側のエンジンも使っているが、画像認識やCG生成のエンジンはほぼスマートデバイス(スマートフォン、スマートグラス)上で動かしている。「リアルタイムな画像認識、CGキャラクター生成ではクライアント側で処理しないと追いつかない」(石井氏)。

将来はAIエージェントのマーケットプレースも

クーガーは、この「バーチャルヒューマンエージェント」を将来的には法人ユーザーや個人ユーザーに提供していく考えだ。法人向けの展開としては、例えば飲食店の接客用のAIとして使う形を検討している。

フェーズ1として、2018年8月には、クーガーのオフィスで社員として立ち振る舞うバーチャルヒューマンエージェント「Rachel」を誕生させたいとしている(この名前から映画『ブレードランナー』を想像した読者はおそらく正しい)。視覚、聴覚、感情をもち、接客やコミュニケーションが可能。オフィス内の機器類、例えば冷蔵庫、テレビ、照明とも連動する。学習履歴、行動履歴、デバイス情報などのデータはブロックチェーンで管理する。「バーチャルヒューマンエージェントにオフィス内で経験を積んでもらう形」だと同社は説明する。

フェーズ2として、2018年12月を目標に、バーチャルヒューマンエージェントのマーケットプレイスを展開する方向だ。経験を積んで育ったAIキャラクターを交換可能としていく。例えば、自分が育てたAIが、複数のAIに派生して育っていく樹形図を見ることができる将来像も考えている。ブロックチェーンのようなdecentralized(管理主体を持たない)の特性を持たせることや、非営利団体による運営などの構想も視野に入っているとのことだ。

クーガーのバックグラウンドについて若干の補足をしておく。同社はスクウェア・エニックスのオンラインゲーム開発協力の経験を持つ。これまでにゲームAIの応用であるAI学習シミュレータを本田技術研究所に提供した経験、ロボット競技ロボティクス出場チームへの支援、Ethereumベースのブロックチェーン関連開発(関連記事関連発表)などの経験を積んでいる。

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。