George Hotz(Geohotz)が創立したスタートアップ、comma.aiは既存の自動車に既存のパーツを組み合わせることによって比較的低価格で自動運転車を製作できることを実証した。そのcomma.aiが7時間25分にわたる高速道路での自動運転で収集した全データをオープンソースで公開した。
地味なニュースに思えるかもしれないがそうではない。すくなくとも現在までに公開された高速道路の自動運転のデータと比べれば画期的だ。
comma.aiは最初の走行デモを成功させたときにBloombergで大きな記事になった。公開されたのは記事で紹介された自動走行システムを作るために機械学習システムを訓練したデータそのものだという。
Hotzはインタビューに答えて「このプロジェクトを始めたときは自動運転車は考えていなかった。単に機械学習をいろいろ試そうとしただけだった。ところがあたりを見回しても機械学習の実験に適した手頃なデータがなかった」と説明している。
HotzはKITTIのデータセットや最近発表されたさらに詳細なOxford RobotCarデータセットなどいくつかのデータを調べた。しかしこうしたデータ・セットは都市部の交通の実験で、Hotzが必要としていたのは高速道路での自動運転のデータだった。
「現在BloombergやNvidiaの実験を再現するのに適したデータは公開されていない。そこでそういうデータが世界に公開されてもいい時期だと考えた」とHotzは説明する。
もちろんcomma.aiのデータが利用できるからといって、誰でも1998年モデルのFord Tempoを自動運転車に変えることができるわけではない。しかしこのデータは有力なスタート地点を提供する。comma.aiが公開したのは現在取り組んでいる自動運転車のデータではなく、約半年前に行ったテストに関する全データだ。comma.aiのテクノロジーがその後さらに進歩しているのは間違いない。
Hotzは私の取材に対して「公開主のビジネスを危険にさらさずにオープンソース化はできるはずだと信じている。オープンソースでさらに情報を公開するためにも会社が生き延びることが重要だ。こうしたデータが得られるまでには数多くの失敗がある。誰もそういう失敗を繰り返す必要はない」とcomma.aiのデータ公開に関するアプローチを説明した。
Hotzによれば、comma.aiがデータをオープンソース化するのは、ホビイストのコミュニティーがさらに多くの貢献をできるようにするためだという。しかし機械学習システムの訓練に必要な基礎的な運転データの収集に膨大なは時間と資源を必要とする。Hotzはオープンソース・データの例としてDeepDriveを挙げた。これはGrand Theft Auto Vのプラットフォームを用いてリアルな自動運転シミュレーションを行うためのニューラルネットワーク・システムだ。
ホビイストを助けるというのは、才能ある人材を獲得するためのパイプラインを築くことでもある。comma.aiはオープンソース化したデータを用いて誰がどのようにさらなるオープンソース化をしているかモニターできる。comma.aiはもっとも輝かしい人材が誰なのかいち早く知ることができる。
Hotzによればcomma.aiのビジョンはシンプルだ。「われわれは今何をしているのかできるかぎり正確な情報を公開する。それでもスタートアップは〔大組織よりも〕速く、スマートかつ安価に機能できるということを確信している」のだという。
〔日本版〕ジョージ・ホッツは17歳で個人として初めてiPhoneのジェイルブレイクに成功するなど著名なハッカー。オープンソース化された自動運転データは圧縮で40GB(解凍後80GB)のサイズで、Anaconda、TensorFlowなどを必要とするという。
[原文へ]
(翻訳:滑川海彦@Facebook Google+)