ロボットたちに、触れることを通して世界を学ぶことを教える

ゆっくりと、しかし、確実に、ロボットのBaxterは学んでいる。それは一連のランダムな「掴み」から始まる。大きくて赤いロボットが、あまり器用とはいえない手つきで、目の前のテーブル上の物体を押したり突いたりしている。この、1日8時間かけて1ヶ月に5万回もの掴みを繰り返すプロセスは、私たち人間にとっては極めてうんざりするような代物だ。ロボットは触覚フィードバックと試行錯誤を経て学習している。あるいはプロジェクトの背後にいるカーネギーメロン大学のコンピュータサイエンスチームが言うように、それは世界に関して赤ん坊のように学習しているのだ。

チームは、“The Curious Robot: Learning Visual Representations via Physical Interactions,”（好奇心旺盛なロボット：身体的な相互作用を介した視覚的表現の学習）という論文の中で、人工知能はオブジェクトと反復的に相互作用を行なうことで、どのように学ぶことができるのかを示している。「例えば」とCMUの学生は書く「赤ん坊はオブジェクトを押したり、突いたり、口の中に入れたり、投げたりして、ものの有りよう（representations）を学ぶ。この目標を達成するために、われわれは、オブジェクトをテーブル上で、押したり、突いたり、掴んだり、観察したりする最初のシステムの1つをBaxter上に構築した」。

私たちがCMUキャンパスに到着するまでに、Baxterはありがたいことに、既に何度も何度もこのプロセスを繰り返した後だった。研究室の助手であるDhiraj Gandhiが、私たち向けにデモを行ってくれた。ロボットはテーブルの向こう側に立っていて、Gandhiはオブジェクトをテーブルの上に並べた。鉛筆ケース、ノーブランドのPower Ranger、いくつかの車のおもちゃ、ミーアキャットのぬいぐるみなどがあり、多様で複雑な形状のために選ばれた100均アイテムのような小間物も入っている。

このデモは、よく知られているオブジェクトと馴染みのないオブジェクトの組み合わせで行われていて、その違いはすぐに明らかになった。ロボットはオブジェクトを認識すると、タブレットで作られた顔を笑顔にしながら、しっかりと対象を掴み、それを適切な箱に入れる。もし良く知らないオブジェクトの場合には、顔を赤らめ困惑の表情を浮かべる … とはいえ更に5万回の掴みを繰り返せば、解決することはできる。

この研究は従来のコンピュータービジョン学習に大きな変化をもたらすものだ。従来のシステムは、ラベルの入力を伴う「スーパーバイザー」プロセスを通してオブジェクトの認識を教えられていた。CMUのロボットはすべてを自分自身で学習する。「現時点では、コンピュータビジョンで起こっていることは、受動的なデータが与えられるということです」とGanshiは説明する。「画像とラベルの取得方法との間には相互作用はありません。私たちが望んでいることは、オブジェクトと相互作用しながら、能動的にデータを取得することです。そうしたデータを通じて、他のビジョンタスクに役立つ機能を学びたいと思っています」と語った。

触れることの重要性を説明するために、Ganshiは70年代半ばの実験を引用した。この実験では英国のある研究者が2匹の仔猫の発達を研究した。1匹は普通に世界と触れ合うことができたが、もう1匹はオブジェクトを見ることだけが許され、実際に触れることは許されなかった。その結果、正常な仔猫たちがするようなことを出来ない、哀れな仔猫が1匹残されることになった。「環境とやりとりを行った方は、どのように足を付けば良いかを学ぶことができました」と彼は説明した。「しかし観察しか許されなかった方はそれができなかったのです」。

このシステムは、Kinectと同様の3Dカメラを使用している。Baxterが収集した視覚的および触覚的な情報は、ディープニューラルネットワークに送られ、ImageNetの中の画像と相互参照される。タッチデータが追加されることによって、ロボットの認識精度は、画像データのみで訓練されたロボットに比べて10％以上良いものになった。「これは非常に励みになる結果である」と、チームはその論文に書いている「なぜならロボットタスクと意味的分類タスクの相関関係は、何十年にもわたり想定されていたものの、決して実証されたことはなかったからだ」。

研究はまだ初期段階だが、この先有望だ。将来的には、ZenRoboticsが開発したゴミをリサイクル品から取り除く、分類ロボットのような用途にタッチと視覚が使われることになるかもしれない。「実際の環境にシステムを投入するまでには、まだまだ大きな課題を解決していかなければなりません」とGanshiは言う。「私たちはその課題を解決したいと考えていますが、今はそこへ向かって赤ん坊のように進んでいるところなのです」。

[ 原文へ ]
（翻訳：Sako）

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。 TechCrunch Japan の投稿をすべて表示