Waymo(ウェイモ)は、その重要な自動運転の蓄積データを、新しいOpen Data Setとして開放し、研究目的での利用を可能にする。このデータセットは商用利用向けではないものの、その「研究」の定義は極めて広く、大学はもちろん、他の企業の研究者も対象になっている。
昨年Waymoに入社する前に、ZooxとGoogleの両社に勤めていたこともある、Waymoの主任科学者兼研究責任者であるDrago Anguelov(ドラゴ・アンゲロフ)氏によれば、このデータセットは「これまで研究向けにリリースされた自動運転データセットの中で、最大かつリッチで、最も多様なものの1つ」だということだ。アンゲロフ氏は、ブリーフィングの中で、このデータ提供を推進し始めた理由を、この分野で仕事を進めているWaymoやその他の企業たちが「適切なデータセットが不足しているために、現在動きが鈍くなっているから」だと述べた。
「私たちは、最終的に学界の研究者たちが適切な質問を発することができるように、私たちのできる寄与を行うことを決断しました。そのためには研究者たちは適切なデータを必要としているのです」とアンゲロフ氏は語る。「そして私は、このことはこの分野にいるすべての人を助けることになると思います。私たち自身がこうした課題を解決できないと言っているわけではありません。しかし、効率、拡張性、必要なラベルの量に関しては、改善の余地が常にあります。これは発展途上の分野なのです。現状を考えると、あまりインパクトのない仕事を行うのではなく、主に他者を巻き込んで、私たちの問題を考えてもらい、私たちと一緒に仕事をしてもらおうとしているのです」。
WaymoのOpen Data Setは、路上の自動運転車によって収集された1000個の運転セグメントを研究者たちに提供することで、ギャップを埋めようとしている。それぞれのセグメントは20秒の連続運転のデータを表したものだ。含まれる運転データには、アリゾナ州フェニックスで行われたもの、ワシントン州カークランドのもの、カリフォルニア州マウンテンビューのものが含まれる、そしてまた夜間や雨天、夕暮れ時などの様々な運転条件のものも提供されている。セグメントには、Waymo製の5つのライダーから収集されたデータと、正面および側面を向く5つの標準カメラのもの(高解像度でキャプチャされた360度のビューを提供)、そしてWaymoがライダーと画像データを融合するために使う同期データが含まれる。車両、歩行者、自転車、そして標識などの対象物にはすべてラベルが付けられている。
これまでのWaymoは、特にその収集されたデータに関してはより閉鎖的な企業の1つであり、その長い経験こそが競争上の優位性であることをしばしば口にするプレイヤーでもあった(Waymoは、当初GoogleのX Labとして、2009年に公式に産声を挙げた)。同社はまた、自動運転技術のライバルであるUberが、Waymoの元チームメンバーを雇用した際には、Uberとの間で知的財産権に関する有名な法廷闘争を行った。当然のことながら、このデータが実際にどのくらい「オープン」に利用できるかについて、懐疑的な人もいるだろう。
Waymoの製品リーダーであるVijaysai Patnaik(ビジェイサイ・パトナイク)氏によれば、「研究」利用は多くの分野をカバーしていると説明する。ご想像のとおり、データセットには特定のライセンス契約が伴うがが、パトナイクは、ブリーフィング中に、誰がデータをどのような目的で利用するのかについて、彼らがどのように想定しているのかも説明した。
「想定されているのは、例えば学部やPhDの学生たちや、この分野に興味を持っている様々な大学の教授たちです、そして独立研究機関や、ロボット研究所なども含まれるでしょう」とパトナイク氏は語った。「ベイエリアにはそうした人たちがたくさんいます。【中略】企業は、ライセンス契約に準拠している限り、このデータセットを使用できます。あるいはドラゴ(アンゲロフ)のような個人や、他の組織内の彼のチームなども対象に含まれるでしょう」。
自動運転に取り組む他の企業も似たようなアプローチを採用しており、最近の例としてはLyftとArgo AIの2つが挙げられる。とはいえWaymoは路上の実際の走行時間と走行距離に関して、この分野では圧倒的な優位を誇っている。このため自動運転と関連するロボット分野(コンピュータービジョンを含む)の研究者たちは、おそらく彼らのリリースするものを見たいと熱望するだろう。
[原文へ]
(翻訳:sako)