AIのためのリアルなバーチャルトレーニング環境をフェイスブックとMatterportが共同開発

ロボットが家の中を移動できるように訓練するには、何軒もの本物の家で、実際に何時間も訓練する、何軒もの仮想の家で、仮想的に時間をかける、という2つの選択肢があるが、後者の方が便利なのはいうまでもない。FacebookとMatterport(マーターポート)は共同で、研究者および学習過程にあり、データを必要としているAIに、何千ものバーチャルかつインタラクティブな、本物の家のデジタルツイン(仮想空間で再現されたリアル空間)を提供する。

Facebook側の大きな進歩は、新しいトレーニング環境「Habitat 2.0」と、それを可能にするために作成されたデータセットの2つだ。数年前に公開されたHabitatを覚えているだろうか。当時Facebookは「身体性を有するAI」と呼ばれる現実世界と相互作用するAIモデルを開発するために、AIが動き回ることのできる、写真のようにリアルに描写された仮想環境を大量に構築していた。

関連記事:Facebookがロボットを学習させるための本物そっくりな仮想の家を提供

これまで、たくさんのロボットやAIが、現実よりもゲームに近い、理想的かつ非現実的な空間で、動作や物体認識などの学習を行ってきた。現実のリビングルームは、バーチャルに再現されたものとはまったく異なる。現実に近い空間で動きを学習したAIのナレッジがあれば、家庭用ロボットなどへの実際の適用も実現しやすくなるだろう。

しかし結局のところ、バーチャル環境にはポリゴンの厚みしかなく、相互作用は最小限で、物理的にリアルなシミュレーションもない。ロボットがテーブルにぶつかっても、倒れて物をそこら中にこぼしたりすることもなく、台所で冷蔵庫を開けたり、流し台から物を持ち上げたりすることもできなかった。今回、Habitat 2.0および新しいReplicaCADのデータセットは、相互作用性を改善し、単に3Dの表面をなぞるのではなく、3Dオブジェクトを増やすことで、この問題を解決する。

シミュレートされたロボットは、これまでと同様に新しい住戸単位の環境を動き回るが、あるオブジェクトに到達すると、そのオブジェクトに対して実際にアクションすることができる。あるロボットのタスクが「ダイニングテーブルからフォークを拾ってシンクに置く」ことだと考えてみよう。数年前までは、フォークを適切にシミュレートできなかったので、フォークを持ち上げたり下ろしたりすることだけが想定されていた。Habitat 2.0では、フォークが置かれているテーブルやシンクなどが物理的にシミュレートされる。そのため、計算量は増加するが、格段に有意義なシミュレーションとなる。

この分野は急速に進歩しており、新しいシステムが登場するたびに新機能が追加され、同時に次の大きな改善点やチャンスが示される。この場合、Habitat 2.0の最も近い競争相手は、住戸単位の環境と物理的なオブジェクトのシミュレーションを組み合わせたAI2(エーアイツー)の「ManipulaTHOR」だろう。

Habitat 2.0はスピードでManipulaTHORに勝る。論文によると、シミュレーターの実行速度はManipulaTHORと比較しておよそ50~100倍。つまり、ロボットは1秒あたり50~100倍多くのトレーニングを実行することができる(これは厳密な比較ではなく、2つのシステムは他にも異なる点がある)。

ここで使用されるデータセットはReplicaCADと呼ばれ、基本的にはオリジナルの部屋のスキャンをカスタム3Dモデルで再現したものである。面倒な手作業であり、Facebookはスケールアップの方法を検討していると認めているが、非常に有用な結果を提供する。

オリジナルの部屋のスキャン(上)とReplicaCADによる3D再現(下)

基本的なオブジェクトや動き、ロボットの存在などはサポートされているが、現段階ではスピードを優先したため、再現性は失われている。そのため、より詳細でより多くの種類の物理シミュレーションが計画されている。

また、Matterportは、Facebookとの提携でも大きな動きを見せている。ここ数年でプラットフォームを大幅に拡大したMatterportは、3Dスキャンした建物の膨大なコレクションを持つ。これまでも研究者との共同研究を行ってきたMatterportだが、そのコレクションの大部分をコミュニティで利用できるようにする時が来たと判断した

CEOのRJ Pittman(アールジェー・ピットマン)氏は次のように話す。「私たちは、現存するあらゆる種類の物理的構造物、構造物のようなものに対し、3Dデータを作成しました。住宅、高層ビル、病院、オフィス空間、クルーズ船、ジェット機、マクドナルド……。デジタルツインに含まれる情報すべてが、研究には非常に重要です」「これらの3Dデータはコンピュータビジョン、ロボット工学、家庭内オブジェクトの識別など、あらゆる分野に影響すると確信していました。Facebookに事細かに説明する必要はありませんでした。Habitatや身体性を有するAIにとっては、あきらかに重要なデータだからです」。

Matterportが、不動産を閲覧する人が目にするような住宅のスキャンから企業や公共スペースまで、1000点ものインテリアを極めて詳細に3Dキャプチャーしたデータセット、HM3Dを作成したのはこれが目的だ。HM3Dは、一般公開されているコレクションとしては最大となる。

画像クレジット:Matterport

正確なデジタルツインでトレーニングされたAIがスキャンし、読み取った環境は、スケール的に非常に正確で、例えば窓の表面積やクローゼットの総容積の正確な数値が計算できる。これは、AIモデルにとって有益でリアルな遊び場で、出来上がったデータセットは(まだ)インタラクティブではないものの、現実世界のあらゆる不変性を非常によく反映している(Facebookのインタラクティブデータセットとは異なるが、拡張の基盤となる可能性がある)。

ピットマン氏は「(HM3Dは)極めて多様性の大きなデータセットです」「 私たちは、さまざまな実世界の環境を、豊富に、確実に集めたいと考えていました。AIやロボットのトレーニングで最大限の効果を得るには、このような多様なデータが必要なのです」と話す。

すべてのデータはその空間の所有者から提供されたもので、(極めて小さい文字で印刷された契約書の細則を使って)非倫理的に集められたという心配はない。同氏の説明によると「最終的には、より大きく、よりパラメータ化されたデータセット、すなわちサービスとしての現実的な仮想空間を作成し、APIでアクセスできるようにしたい」とのことだ。

ピットマン氏は語る。「米国風のB&B(ベッドアンドブレックファスト、比較的低価格で利用できる宿泊施設)での利用を想定したおもてなしロボットを作っているとしましょう。B&Bのデータが1000個あればすばらしいと思いませんか?」「この最初のデータセットでどこまでのことが可能かを確認し、学び、研究コミュニティや自社の開発者と協力して、さらに進化させていきたいと考えています。私たちにとって重要な出発点です」。

ReplicaCADとHM3Dはどちらも公開され、世界中の研究者が利用できるようになる予定だ。

関連記事
Googleの研究でロボット犬の小走りが簡単に
VRで事前学習してから作業する公共トイレ用掃除ロボ

カテゴリー:人工知能・AI
タグ:FacebookMatterportトレーニング

画像クレジット:Facebook

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)