ロボットというものは即興が苦手だ。いつもと違う路面や障害物に遭遇すると、突然停止したり、激しく転倒したりする。しかし研究者たちは、どんな地形にもリアルタイムで対応し、砂や岩、階段などで路面が急に変化しても、その場で直ちに歩幅を変えて走り続けることができるロボットの新しい動作モデルを開発した。
ロボットの動きは正確でさまざまな用途に対応でき、段差を登ったり崩れた場所を渡ったりすることを「学習」することができるが、これらの行動は個々の訓練されたスキルに近いもので、ロボットはそれらを切り替えて行っている。また、Boston Dynamics(ボストン・ダイナミクス)が開発した「Spot(スポット)」のようなロボットは、押したり蹴ったりしても跳ね返せることで有名だが、これはシステムが物理的な異常を修正しながら、歩行における変わらない方針を追求しているに過ぎない。対応能力を備えた動作モデルもいくつか開発されているが、非常に特殊なもの(例えば、このモデルは本物の昆虫の動きに基づいている)だったり、対応するまでにかなり時間がかかるものもある(対応力を発揮する前に、確実に倒れてしまうだろう)。
関連記事:歩き方を即興で変えることのできる昆虫ロボットは本物の昆虫そっくりだ
Facebook AI(フェイスブックAI)、UC Berkeley(カリフォルニア大学バークレー校)、Carnegie Mellon University(カーネギーメロン大学)の研究チームは、この新しい動作モデルを「Rapid Motor Adaptation(迅速運動適応)」と呼んでいる。これは、人間や他の動物が、さまざまな状況に合わせて、すばやく、効果的に、無意識のうちに歩き方を変えられることに由来している。
「例えば、歩けるようになってから、初めて砂浜に行ったとします。足が沈み込み、それを引き上げるためには、より大きな力を加えなければなりません。違和感は覚えるでしょうが、数歩歩けば固い地面を歩くのと同じように自然に歩けるようになるでしょう。そこにはどんな秘密があるのでしょうか?」と、Facebook AIとカリフォルニア大学バークレー校に所属する上級研究員のJitendra Malik(ジテンドラ・マリク)氏は問いかける。
確かに、砂浜に行ったことがなかった人でも、人生の後半になってから初めて浜辺に行った人でさえ、すぐに自然に歩くことができる。柔らかい場所を歩くために、特別な「サンドモード」に切り替えているわけではない。動き方を変えることは自動的に行われ、外部環境を完全に理解する必要もない。
シミュレーション環境を視覚化したもの。もちろん、ロボットはこれらを視覚的に認識することはない(画像クレジット:Berkeley AI Research, Facebook AI Research and CMU)
「置かれた状態に違いが生じると、その影響によって身体自体に生じる違いを、身体が感知してそれに反応するのです」と、マリク氏は説明する。RMAシステムも同じように機能する。「歩く場所の環境が変わると、0.5秒以下の非常に短い時間で十分な測定を行い、その環境が何であるかを推定し、歩行の方針を修正します」。
システムはすべて、現実世界をバーチャルで再現したシミュレーションで訓練された。そこでは、ロボットの小さな頭脳(すべてはロボットに搭載されている限られた計算ユニット上でローカルに実行される)が、(仮想)関節や加速度計などの物理的なセンサーから送られてくるデータを、即座に認知して応答し、転倒を回避しながら最小限のエネルギーで最大限の前進を行う歩き方を学習した。
マリク氏はこのロボットが視覚入力を一切使用していないことを指摘し、RMAアプローチの完全な内部性を強調する。しかし、視覚を持たない人間や動物だって普通に歩けるのだから、ロボットにできないことがあるだろうか?歩いている砂や岩の正確な摩擦係数などの「外部性」を推定することは不可能なので、このロボットは自分自身に注意を向けるだけということになる。
「私たちは砂について学ぶのではなく、足が沈むことについて学ぶのです」と、共同研究者であるバークレー校のAshish Kumar(アシシュ・クマール)氏は述べている。
根本的にこのシステムは2つの部分から成り立っている。1つはロボットの歩行を実際に制御する常時稼働のメインアルゴリズム。そしてもう1つは、それと並行して作動し、ロボットの内部情報の変化を監視する対応アルゴリズムだ。顕著な変化が検出されると、それを分析して「足はこうなっているはずだが、こうなっているということは、状況はこうなっているということだ」と、メインモデルに調整方法を指示する。それ以降、ロボットは変化した状況下においても、どのように前進するかということだけを考え、実質的に即興で状況に合わせた歩行を行うようになる。
シミュレーションによるトレーニングを経て、このロボットは以下のようにニュースリリースにあるとおり、現実の世界でも見事に狙いを成功させた。
このロボットは砂、泥、ハイキングコース、背の高い草、土の山など、すべての実験で一度も失敗することなく歩行できました。ハイキングコースでは、70%の成功率で階段を降りることができました。セメントの山や小石の山では、訓練中に初めて出くわす不安定な地面や沈む地面、障害物となる植物、階段などがあったにもかかわらず、80%の成功率で乗り越えることができました。また、体重の100%に相当する12kgの荷物を積載して移動する際にも、高い成功率で身体の高さを維持することができました。
画像クレジット: Berkeley AI Research, Facebook AI Research and CMU
このような多くの状況における歩行の例は、こちらの動画や上の(ごく簡単な)GIFで見ることができる。
マリク氏は、NYU(ニューヨーク大学)のKaren Adolph(カレン・アドルフ)教授の研究を参考にした。同教授の研究では、人間が歩き方を覚えるプロセスが、いかに対応性が高く、自由な形態であるかを示している。どんな状況にも対応できるロボットを作るには、さまざまなモードを用意してそこから選ぶようにするのではなく、はじめから対応力を身につけなければならないというのが、チームの直感だった。
すべての物体や相互作用を網羅的にラベル付けして文書化しても、洗練されたコンピュータビジョンのシステムを構築することはできないのと同じように、砂利道、泥道、瓦礫、濡れた木の上などを歩くために、それぞれ専用のパラメータを10個、100個、さらには数千個も用意しても、多様で複雑な現実の世界にロボットを対応させることはできない。さらに言えば、ただ「前進せよ」という一般的な概念以外のことは何も指定しなくても済むようになるのが理想だ。
「脚の形状やロボットの形態については、あらかじめ一切プログラムしていません」と、クマール氏は述べている。
つまり、このシステムの基本部分は、四足歩行ロボットだけでなく、他の脚を持つロボットや、さらにはまったく別のAIやロボット工学の分野にも応用できる可能性があるということだ。
「ロボットの脚は手の指にも似ています。脚が環境と相互作用するように、指は物体と相互作用します」と、共同執筆者であるCarnegie Mellon University(カーネギーメロン大学)のDeepak Pathak(ディーパック・パターク)氏は指摘する。「基本的な考え方は、どんなロボットにも適用できます」。
さらにマリク氏は、基本アルゴリズムと対応アルゴリズムの組み合わせが、他のインテリジェントなシステムにも応用できることを示唆している。スマートホームや自治体のシステムは、既存のポリシーに依存する傾向があるが、しかし、状況に応じてその場で対応できるようになったらどうだろう?
今のところ、チームは初期の研究成果を「Robotics:Science and Systems(ロボット工学:科学とシステム)」会議で論文として発表しているだけであり、まだ多くのフォローアップ研究が必要であることを認めている。例えば、即興的な動作を「中期的な」記憶として内部にライブラリー化したり、視覚を利用して新しいスタイルの運動を開始する必要性を予測したりすることなどが考えられる。とはいえ、RMAのアプローチは、ロボット工学の永遠の課題に対する将来性の高い新たなアプローチとして期待が持てそうだ。
関連記事
・【インタビュー】Fetch RoboticsのCEOが自社の買収と倉庫ロボットの未来について語る
・イチゴを傷つけずに収穫するロボットのTrapticが商業展開を開始
・ROS対応協働ロボットアーム「myCobot」のラズパイ版「myCobot Pi」、商業向け「myCobot Pro」が発売開始
画像クレジット:Berkeley AI Research, Facebook AI Research and CMU
[原文へ]
(文:Devin Coldewey、翻訳:Hirokazu Kusakabe)