机の上に置いてあるペンを手で拾い上げるのは人間にとってそんなに難しいことではないが、ロボットにとってはまだ困難な課題だ。そこでロボットがより良くランダムに置かれた物を拾えるようになるよう、Googleの研究チームは14台のロボットにタスクを与えた。
ロボットが何かの問題を解決する一般的な方法は、まず環境を調査し、物を掴む計画を策定して実行することだ。ただ現実世界においては、計画の策定から実行するまでの間にも様々なことが変わることがある。
Googleはロボットを使って深層畳み込みニューラルネットワーク(現在の機械学習で広く用いられる手法)を鍛えることで、ロボットはカメラの入力とモーターの動きを元に物を掴んだ時の結果を推測するようなる。簡単に言えば、ロボットが見ている景色と手の動きを連動するということだ。
3000時間に及ぶ練習(80万回の拾う試行)の末に初めて「知的な対応行動の始まり」が見られたとチームは伝えている。
「ロボットは自分のグリッパーを見て、リアルタイムで動きを修正します。また、実際に拾う前に特定の物を集まっている場所から離すといった興味深い行動が見られます」とチームは記している。「これらの行動はシステムにプログラミングされたものではなく、自然と学習したことです」。
Googleの研究者が行ったトレーニング前の試行では、ロボットが30回拾う試行をした時の失敗率は34%だった。トレーニング後、その数値は18%まで下がった。まだ完璧ではないが、もしロボットが追いかけてきて誰かをつかまえようとしたのなら、ロボットは80%近い確率で成功することは覚えておきたい。
[原文へ]