10年前、10人あまりのエンジニアたちが、Charleston RoadにあるGoogleのマウンテンビューメインキャンパスに、Project Chauffeur(お抱え運転手プロジェクト)のために集められた。これはGoogleの未踏最先端研究”X”の中に生まれた秘密の取り組みだった。
Project Chauffeur ―― 一般には「Google自動運転車プロジェクト」として知られている ―― は、こうして2009年1月に始まった。プロジェクトはやがてその試験的状態を卒業し、2016年にはWaymoと呼ばれる会社として独立した。
このプロジェクトを当初率いていたのはSebastian Thrunである。彼が現在も開発が続く、全てのエコシステムの立ち上げに尽力したのだ。ベンチャーキャピタリストたちが注目し殺到した。自動車アナリストたちは態度を変え、規制当局、都市計画者、そして政策立案者たちはデータを収集し、自動運転車が都市に及ぼす影響について考慮し始めた。
このプロジェクトはまた、自分自身の会社を作りたいエンジニアたちの、跳躍台でもあり続けた。たとえばそうしたエンジニアとして、Auroraの共同創設者Chris Urmson、Argo AIの共同創業者Bryan Salesky、Otto(や最近はPronto.ai)の起業を手がけたAnthony Levandowskiたちの名前が挙げられる。
だが設立当初から参加していたエンジニアたちの多くが、まだWaymoに残っていることは、あまり知られていないかもしれない。それはAndrew Chatham、Dmitri Dolgov、Dirk Haehnel、Nathaniel Fairfield、そしてMike Montemerloといった人びとだ。「初期」の定義の仕方によっては、Hy Murveit、Phil Nemec、そしてDan Egnorなどの、8〜9年間そこにいる人たちも含まれることになる。
今回、WaymoのCTO兼エンジニアリング担当副社長のDolgovに対して、TechCrunchはインタビューを行った。話題はその黎明期について、10周年を迎えるにあたって、そして将来についてである。
以下は、明瞭さのために短く編集された、Dolgovとのインタビューの抜粋である。
TechCrunch(TC):どのようにプロジェクトを始めたのかをお聞きしましょう。Googleの自動運転プロジェクトの最初の日々について教えていただけますか。
DOLGOV:私がこの分野に引きつけられた理由を考えてみると、それはいつでも3つの主要なものに行き着きます。テクノロジーのもたらす影響、テクノロジーそのもの、そして取り組む対象の困難さです(一緒に働く人たちはもちろん大切ですが)。その時点では、きわめて重大な安全性への影響があることは明らかでしたが、その先に、効率性を改善し、人や物の輸送から面倒を取り除く可能性が見越されていました。
決して尽きることのない、こうした高揚感があるのです。自動運転車の仕事を、最初にしたときの事をおぼえています。それは私が書いたソフトウェアを使って、自動車自身が走行した最初の経験でした。これは本当に初期のできごとでした。これは2007年のことです。この体験は私を完全に圧倒しました(Dolgovは、Googleプロジェクトが開始される以前の2007年11月に、DARPA Urban Challengeに参加していた)。
TC:(Googleの共同創業者)ラリー・ペイジが思い付いた、この10本の100マイルチャレンジはどのようなものでしたか?それについて少し説明していただけますか?
DOLGOV:これはおそらく、私たちがこのプロジェクトを2009年にGoogleで始めた際の主要なマイルストーンでした。そしてチャレンジは、それぞれが100マイルの距離がある10本のルートを走行することでした。もちろん、始めから終わりまで、人間は全く介入することなしに、走行させなければなりません。
これらは、非常に明瞭かつ明確に定義された、精密なルートでした。最初に自動運転モードに切り替えた後は、全100マイルを自力で走行しなければなりませんでした。
それぞれのルートは、タスクの完全な複雑さを収集できるように意図的に選択されました。当時私たちにとっては、とにかく問題の複雑さを理解することが先決でした。すべてのルートはベイエリアにありました。私たちはパロアルト周辺の都市環境で運転を行いました、高速道路上で多くの時間を費やし、ベイエリアのすべての橋を訪れました。マウンテンビューからサンフランシスコに行くルートがありましたが、そこにはロンバードストリートを通ることも含まれていました。また私たちは、レイクタホの周りを回るコースも持っていました。
私たちは環境の複雑さを可能な限りカバーしようとしました。そしてそのタスクが本当に素晴らしかった点は、そのことで私たちがこの問題の複雑さの中心を、本当にすばやく把握することができたということなのです。
TC:これらのチャレンジを完了するのにどれくらい時間がかかったのですか?
DOLGOV:それらを終えるのは、2010年の秋までかかりました。
TC:プロジェクトが2010年までに、これらのチャレンジを完了することができたと考えると、凄いことですが、それでもこのタスクにはまだ多くのやるべきことが残されているように思えます。
DOLGOV:その通りです。しかし、私はそれが問題の本質だと思います。 何かを1〜2回、あるいはほんの数回実行できるプロトタイプを作ることと、一般の人たちが日常的に使うことのできる製品を作ることの間には、とても大きな違いがあります。そして、特にこの分野では、私たちが始めたときには、このような一度きりの挑戦で成果を出すことはとても簡単だったのです。
しかし、本当に難しいのは、それを製品にするためにシステムから引き出す必要のある、信じられないレベルの性能なのです。それこそが一番難しいことです。そして二番目に難しいことは、その先に遭遇することになる、果てることなく湧いてくる、滅多に起きない問題の種類の複雑さなのです。おそらく99%の状況ではそうした問題に出会うことはないでしょう。しかしそれでも出会うかもしれない1%もしくは1.1%の状況のために、準備をしておかなければならないのです。
TC:そうした初期の日々を振り返ったときに、あるいはもっと最近のことでも良いのですが ―― 乗り越えられそうもない、あるいはテクノロジーがまだそのレベルに達していないように思われた、ソフトウェアあるいはハードウェアの問題に遭遇した瞬間はあったでしょうか?
DOLGOV:初期の頃には、私たちはあらゆる種類の問題に直面していました。このプロジェクトの歴史の初期段階には、どうやってそこに到達すればよいかを本当にはわからないまま、問題を解決しようとしていただけだったのです。
問題に取り組み始めて、それに向かった進歩が行われます。この数年が、私にとってどのように感じたものかを振り返るならば、ここに一つ問題があったとか、少数のいくつか本当に難しい問題があったとか、一つの壁にぶつかっていたといった表現では全く足りない状況だったと思います。
そうではなく、何百もの本当に難しい問題に遭遇していたのです。とはいえ、そうした問題のいずれもが、レンガの壁のような難攻不落なものではありませんでした。ご存知のように、チームは素晴らしく、テクノロジーは本当に強力で、その問題の解決を進めることができたからです。
しかし、常にこれらの本当に複雑な数百の問題を、同時に扱い続けなければなりませんでした。どれか一つの問題の解決により深く踏み込むと、それがどれだけ難しいかをさらに思い知るといった具合だったのです。
これはとても面白い組み合わせでした。一方では、問題はより困難になり、それについての学びも多くなりました。しかし、その一方では、テクノロジーが急速に進歩し、当初予想されていたよりも速くブレークスルーが起きていたのです。
TC:このプロジェクトが(公式発表とは別に)変化したことに気付いたのはいつでしょう?それが単に問題を解くだけにはとどまらず、ビジネスになり得ると思ったのはいつなのでしょうか?
DOLGOV:私の考えでは、それは私たちの思考が進化し、この技術による、よりはっきりと定義つけられたプロダクトと商用アプリケーションに、より多くの投資が行われたときでしょうね。
私たちが始めた、本当に最初の段階では、問題は「そもそもこれは実現可能なのか?このテクノロジーはうまく働くのか?」でした。とはいえ、このテクノロジーが成功したら、その影響は果てしないものになるという認識は、皆にとって明らかだったと思います。
どのような商用アプリケーションやどのような製品が、その影響をもたらすのかは明らかではありませんでした。しかし、このテクノロジーが世界を変えるだろう方法はたくさんあったので、その点についてあまり心配し続けることはあまりありませんでした。
このテクノロジーを眺めたときに、私たちが開発しているのはドライバーなのです:ソフトウェアとハードウェアの双方ですが ―― 車の中で実行されているソフトウェアとクラウドの中で実行されているソフトウェアがあります。私達はテクノロジースタック全体を、ドライバーとして見なしています。
米国には、人間によって運転されているのべ3兆マイル(4.8兆キロ)もの道があります。ある場合には、彼らは自分自身で運転(drive)し、ある場合には他の人を使役し(drive)、またある場合には貨物を動かして(drive)います。もし「ドライバー」(driver)であるテクノロジーを手に入れたなら、それをすべての場合に展開することが可能です。しかし、それらにはそれぞれ長所と短所があります。
時間が経つにつれて「最も魅力的なものは何だろう?」そして、「どのような順序で取り組むべきなのだろう?」という私たちの考えが成熟して行きました。
それこそが、これまでの作業の結果私たちが現在行っているものなのです。配車サービス(UberやLyftのようなもの)は、私たちが追求している最初の商用アプリケーションです。それ以外にも、長距離輸送、長距離配送に取り組んでいます。いつかこの技術を、個人所有の車、地域の配達業務、公共交通機関などなどに展開することに興味を持っています。
TC:どのようなアプリケーションに一番興味を持っていますか?世の中で見過ごされているなあとあなたが思っているものや、個人的にもっとも興味をお持ちのものは何でしょう?
DOLGOV:このテクノロジーと(そのテクノロジーを利用した)ドライバーが世界中に、そしてさまざまな商用アプリケーションに展開されているのを見ることに、とても興味を持っています。しかし、私が最も興味を持っているものは、私たちの最優先の目標として追求が行われている配車サービスです。
私はそれが最も短期間に、最も多くの人たちに、良い影響を与えることだと思っています。
私はまた私たちの車を使って日々走り回っています。今日仕事場に来るのにも使っています。マウンテンビューとパロアルト周囲で様々な用足しを行うために使っています。これらの車の体験を重ねられることは素晴らしいことです、そしてそうすることによって、本当に多くの移動の面倒が取り除かれています。
TC:なるほど、現在毎日通勤に自動運転車をお使いなのですね?
DOLGOV:はい。まあカリフォルニアではまだ中に人が乗っていますけれど。
TC:どのくらいそれを続けていらっしゃるのですか?
DOLGOV:かなりの間です。実際、永遠に続けているような気がします。
私はいつでも車の中で時間を過ごして来ました。自分が開発している製品を体験し、テクノロジーに直接触れることはとても大切だと思っています。これは、プロジェクトの初期の頃に、私たちが少人数ですべてのことをこなしていたときにも同様でした。
チームが成長しても、少なくとも毎週一度は、私自身もテクノロジーを体験しテスト走行をするようにしています。
私たちが配車アプリケーションの追求を始め、そのためのアプリケーションを開発し、それをユーザー向け製品にするためのインフラストラクチャを構築したときには、私は初期のテスターの1人でした。
それはもう3年ほど前になります。
TC:かつて現在のようなポジションにいることになるとお考えでしたか?10年前に、この先10年でこうなるとは予想されていたでしょうか?あるいは、それは想像よりも早く、あるいは遅く起きたのでしょうか?
DOLGOV:私にとっては、2009年の時点ではハードウェア、ソフトウェア、そしてAIと機械学習によるいくつかのブレークスルーは予想していませんでした。今日の技術は、おそらく2009年の時点で予想していたものよりも、はるかに強力なものであると言うことができると思います。
しかしその一方で、実際の製品を実際に開発し、それを人びとが利用できるように展開するという挑戦は、私が予想していたものよりもずっと困難であることがわかりました。なので、それは両方の側面を含んでいますね。
TC:そこでおっしゃるブレークスルーとはどのようなものでしょうか?
DOLGOV:たくさんあります。LiDARとレーダーは、遥かに強力になりました。
そして強力になることによって、すなわち、より長い範囲、より高い解像度、そしてより多くの機能を実現することによって、望めば、そのセンサーの能力の中で、状況に関するより豊かな情報を得ることができるようになりました。これらはセンサー側の話ですね。
計算、特にハードウェアアクセラレーションによる並列計算は、ニューラルネットワークの進歩にとって非常に強力な支援となりました。これによって大きく後押しされることになりました。
そして、深層学習がやってきて、ニューラルネット自身がいくつかのブレークスルーをもたらしました。
TC:そうですね…あなたが挙げた最後の2つの例ですが、私はそれらがここ数年でもたらされた最新のブレークスルーだと思います。期間的にはそんな捉え方でよろしいのでしょうか?
DOLGOV:このプロジェクトでは常に機械学習を使用してきましたが、それは現在用いられている機械学習とは異なるものでした。
たしか2012年だったと思いますが、私たちのプロジェクトに対して有意義な取り組みが行われ、Googleの中で、自動運転テクノロジーと深層学習の協力が行われるようになりました。
間違いなく、その当時のGoogleは、自動運転と深層学習の両者に真剣に投資する唯一の会社でした。
その時点では、私たちはその(ニューラル)ネットを自動車の中でリアルタイムに動作させることができるようなハードウェアを、所有していませんでした。しかし、クラウドのなかで実行できる、とても興味深いことはあったのです。
深層学習にとって、2013年はとても重要な年でした。ImageNetが大きな競争に勝ったそのときが、深層学習のブレークスルーとなったと考えています。それは、コンピュータビジョン競争における他のすべてのアプローチよりも優れていたのです。
TC:2009年の時点で、2019年には多数の自動運転車企業が、カリフォルニア州の路上でテストをするようになっていると想像することはできましたか?それは見込みがありそうなことだったのでしょうか?
DOLGOV:いえいえ、とんでもない。2009年や2010年の時点では、私はそんなことは想像していませんでした。
プロジェクトの初期段階では、人びとは私たちに冷笑的でした。業界ではこのプロジェクトが面白おかしく取り上げられ、Googleの自動運転プロジェクトに対する、沢山のおふざけが生み出されました。
まあ「おや、なんだかGoogleの中でこのSFネタを実現しようと努力している、おかしな奴らがいるようだぞ」と言われていたところから、現在のような何百とは言わないまでも数十の企業が追求するような主要な産業に育ったことは、驚くべきことですね。
Googleの自動運転レクサスRX 450h
TC:一般の人びとが、街のなかで自動運転車に乗るようになるきっかけはどのようなものでしょうか?純粋に成熟度の問題なのでしょうか?それともWaymoも含めて、すべての企業がその方向への利用者の誘導に責任を持つべきものなのでしょうか?
DOLGOV:新しいテクノロジーと変化に対する人びとの態度には、常に個々人の違いがあると思います。より目立つ否定的な意見もあります。しかし実際には、過去10年間の私の経験から見たときには、前向きな態度と興奮が圧倒的に強くなって来ています。
このプロジェクトを通して私が繰り返し経験してきたことは、とても力強いこのプロジェクトが、人びとの態度を不信と不安から、テクノロジーに触れることによって、興奮と安心そして信頼へと変えていったことです。
私たちの車の一台に、誰かを案内して実際の乗車をするとしましょう。誰もハンドルを握っていない車に乗ることに不安を感じている人でも、一度経験することによって、またその製品がいかに有用かを理解することによって、そしていかに車がきちんと動作するかを知ることによって、徐々に信頼しはじめるのです。それが本当に信頼へとつながっていくのです。
技術がより普及し、より多くの人びとがそれを直接経験するようになれば、それが助けになるでしょう。
TC:2009年当時の最大の課題は今でも同じでしょうか?残っている最後の難問は何でしょう?
DOLGOV:2009年には、すべての問題は、それぞれ解決が必要な個別の問題でしたが、現在ではそれを製品化するということに尽きます。
それは、自動運転システム全体を示すこと、そしてテクノロジーの評価と展開のためのツールとフレームワークの開発をすることにかかっています。そしてご存知のように、全体として変わることなく大切なことは、開発を素早く繰り返すことと、新しいことを学び、そして発見された新しい技術的課題を解決する力なのです。
[原文へ]
(翻訳:sako)