28億円調達でライダーシーンに登場した新しいアプローチ

ライダー(Lidar)は、多くの自動運転車やロボットシステムを構成する重要な部品だが、その技術も急速に進化している。Sense Photonicsという名の新しい会社が、米国時間6月11日に沈黙を破って、2600万ドル(約28億円)のラウンドAとともに登場した。とても広い視野と(文字通り)柔軟な設置を可能とするまったく新しいアプローチがその売りだ。

まだプロトタイプ段階ではあるが、8桁(数千万ドル)の投資額を引きつけるだけの魅力は確かに持っている。Sense Photonicsのライダーは、一見従来のものとは劇的に違っているもののようには見えない。だがその違いは裏側に隠れているものだけではない。

Velodyneのような初期のポピュラーなライダーシステムは、赤外線レーザーパルスを放射し検出する回転モジュールを使用して、光の往復時間を測定することによって周囲を検出していた。その後のモデルでは、例えばDLPタイプのミラーやメタマテリアルベースのビームステアリングといった、あまり機械的ではないもので回転ユニットが置き換えられている。

関連記事:いまさら聞けないライダーLidar)入門

これらのシステムはみな、光のビームや、柱、あるいはスポットを、風景に対してある決まった手順で順次照射していく「スキャン」システムである。しかし、風景全体を一度に大きな照射(フラッシュ)で照らし出す「フラッシュ」ライダーを、なんとか実装できた企業はごくわずかだった。

それこそがSenseの開発したもので、彼らは既存のシステムの通常の欠点、すなわち限られた解像度と範囲の問題を回避できたと主張している。それだけでなく、レーザーを放射する部品(エミッター)と、パルスを計測するセンサーを分離することによって、Senseのライダーは車全体を再設計することなく、設置することが簡単になる。

私は、レーザーシステムのベテランエンジニアでありCEO兼共同創業者であるスコット・バロウズ(Scott Burroughs)氏に、何がSenseのライダーを他の競合相手のものとは違うものにしているのかを尋ねた。

「まずレーザーエミッターですね」と彼は語った「私たちは、よりよい熱効率と目に対する安全性を達成するために分散された、文字通り莫大な数のレーザー素子で構成された装置を作る、秘密のレシピを持っています」。

これらのの小さなレーザー素子たちは、柔軟な裏地の上に貼り付けることができる。つまりレーザー素子の集まりを湾曲させることができるということであり、これによって大幅に視野が拡大する。通常のライダーユニット(360度のものを除く)は、おおよそ水平方向に120度の視野を持っていることが多い、これは水平面に置かれたセンサーとエミッターから確実に取得できるものがその範囲のものだからだ。そしておそらく垂直方向には50から60度の視野角度を持っているだろう。

「私たちは、前例がないと思われる、垂直方向に90度そして水平方向に180度の視野を得ることが可能です」とバロウズ氏は誇らしげに語った。「そしてそれが、これまで話をもちかけた自動車メーカーたちが、とても興奮している点です」。

ここで説明しておく価値があるのは、ライダーシステムは2種類のものに分かれ始めているということだ。1つは前方に向いた長距離用ライダー(LuminarやLumotiveによるものなど)で、200m前方の路上の障害物や人物を検出する。またもう1つは、より短距離で幅広い視野を持つライダーで、より近接した状況認識のために用いられる。例えばバックする車の後ろにいる犬や、数m先の駐車スペースから出てきた車などを検出する。Senseのデバイスは、この2番目のユースケースに非常に適しているのだ。

これらは単なるプロトタイプ装置だが、きちんと機能しており、単なる概念モデル以上のものである

彼らが提供する2番目の興味深いイノベーションがセンサーだ。これは通常はライダー装置の一部に組み込まれているものだが、このシステムではエミッターとは完全に切り離して設置することが可能な、少しばかり特殊なカメラなのである。つまり、エミッターはヘッドライトのようなカーブした部品に統合することが可能になり、一方小さな検出装置たちを既に従来カメラが設置されていたようなサイドミラーやバンパーなどの上に置くことができるのだ。

カメラのようなアーキテクチャは、設置に際して本当に便利なものとなる。また、システムが周囲の画像を再構築する方法にも根本的な影響を与えるのだ。彼らが使用するセンサーは普通のRGBカメラにとても近いものなので、前者からの画像は後者の画像に非常に簡単にマッチさせることができる。

ライダーの深度データと、従来のカメラ画像が、すぐにピクセル単位で対応付けられる

従来のほとんどのライダーは3Dの点群を出力する。これは、ビームが異なる範囲に対して発見した何百万もの点の集合である。これは、従来のカメラとは非常に異なる「画像」の形式であり、点群の深さと形状を2DのRGB画像に変換したり比較するためには、ある程度の作業が必要である。Senseの装置は、2Dの深度マップをネイティブに出力するだけでなく、そのデータを対になるカメラと同期させることができるので、可視光画像をピクセルごとに深度マップに一致させることができる。このことは計算時間を節約し、よって遅延を減らすことになるが、これは自律型プラットフォームにとっては良いことなのだ。

Sense Photonicsの装置は、ここに見られるような点群を出力することもできる

Senseのシステムの利点は明白だが、もちろん現段階ではまだ最初の装置を製品化することに取り組んでいるところだ。その目標に向けて、プレスリリースにもあるように「Acadia WoodsとCongruent Venturesが主導し、Prelude Ventures、Samsung Ventures、Shell Venturesを含む他の多くの投資家たちが参加した」ラウンドAで、2600万ドルの資金調達が行われたのだ。

現金が手元にあることは良いことだ。だが同社はまた、Infineonやその他の企業たち(その中には名前は明かされていないがティア1の自動車会社も含まれていて、明らかに最初のSense Photonics製品の開発に協力していることだろう)と提携も行っている。詳細に関しては、内容がより確定する今年後半を待たなければならないだろう。実際の製品生産はその数カ月後に始まることになる。まだ明確なタイムラインはわかっていないが、こうしたこと全てが今年中に行われることが期待されている。

バロウズ氏はプレスリリースで、「私たちのチームとテクノロジーに対する、投資家の皆さまからの信頼の厚さを、高く評価しています」と語っている。「私たちに寄せられた要求は、水面下で活動していた間でさえ、並外れて大きなものでした」。

[原文へ]

(翻訳:sako)

マヤの巨大古代都市を発掘したレイダーは考古学を変革するか

考古学は、最新テクノロジーとは縁遠い分野のように思われる。AIやロボットは、実地調査の過酷な現場ではまだ心もとない。しかし、ライダー(Lidar)は画期的な技術であることが実証された。とは言え、数千平方キロメートルにおよぶ古代の数百万都市を、レーザーを使った画像化処理技術でマッピングするという最新の調査で、やはり経験と眼識にとって代わるものはないことを、研究者たちは実感した。

Pecunamライダー・イニシアチブは2年前に発足した。研究者と地元自治体が手を組み、グアテマラで長年研究対象となってきた保護区域での最大級の調査を行うことを目的にしている。この調査では、ペテン県マヤ生物圏保護区の、およそ2144平方キロメートルがスキャンされたが、その周辺の、開発されて人が住んでいる地域や、その他の重要と思われる場所もこれに含まれている。

プロジェクトの成功を示す試験的な画像とデータが、今年の初めに発表されたが、研究者たちはその後、本格的なデータ解析を行い、その広範にわたる結果を要約した論文をScienceに掲載した。

イニシアチブが調査した区域。見てわかるとおり、国の5分の1にも及んでいる。

「これほど広範囲な古代の風景を一度に見ることは、これまで不可能でした。このようなデータセットは存在しなかったのです。2月の段階では解析は、実際の量的な意味において、まだひとつも行われていませんでした」と、共同著者でチューレン大学のFrancisco Estrada-Belliは私に話してくれた。彼は、チューレン大学で、Marcello Canutoを含む他の同僚研究者たちとプロジェクトを進めている。「基本的に私たちは、不規則に広がる巨大な都市圏と、農業に関する広大な地物を発見したと発表しました。それから9カ月におよぶ作業で、そのすべてを数量化し、私たちが得た痕跡の一部を、数値的に確認しました」

「私たちの主張がすべて正しかったと知るのは、嬉しいことです」と彼は言う。「一部には、誇張して伝わっていたようですが」

ライダーのデータは無人運転車両で集められたわけではない。聞いた限りでは、たった1台の車で行われている。ドローンすらなく、普通の飛行機が使われた。非効率なように思われるだろうが、調査区域の広さと地形の事情のために、それ以外の方法はとれなかったのだ。

「ドローンは使い物にならなかったでしょう。あれだけの範囲をドローンでカバーするのは不可能です」とEstrada-Belliは説明する。「私たちは、テキサスから飛んできた双発の飛行機を使いました」

飛行機は、ひとつの「ポリゴン」、つまり、おそらく長さ30キロメートル、幅20キロメートルの区画の上空を何十回と飛行している。機体の下部には「多波長、多チャンネル、多スペクトル、狭パルス幅ライダーシステム、Teledyne Optech Titan製Titan」が装備されている。読んで字の如しの装置で、冷蔵庫ほどもある大型の極めて頑丈な機械だ。森の木々を透かして地面の映像を撮影するには、これだけのシステムが必要になる。

何枚もの重複する画像をつなぎ合わせ、補正して、1枚の驚くほど高精細な地面のデジタル画像が作られた。

「私が、それこそ何百回も歩いていた場所の地物を特定してくれたんです」と彼は笑う。「大きな土手道のようなところで、その上を歩いていたのです。しかし、とてもわかりづらい。大量の下生えやら樹木やらで覆われている。つまりジャングルですよ。あと20年歩いていても、気が付かなかったでしょうね」

しかし、そうした構造物は自動的に発見されるわけではない。3Dモデルを見ただけで「これはピラミッド、これは壁」などと具合に識別できるコンピューター・ラベリング・システムは存在しない。それは、考古学者にのみ可能な作業だ。

「実際には、地表データの手作業から始めます」とEstrada-Belliは言う。「私たちは、自然の地形の地表モデルを作りました。画像の中のピクセルは、基本的に高度情報です。そして、いろいろな方向から光をあてて起伏を強調させる照明をシミュレートするフィルターを何重にもかけて、その画像を半透明にして、いろいろな方法を使ってシャープにしたり強調したりして、つなぎ合わせていきました。長時間コンピューターの画面を見つめるという作業を終えた後、それをデジタイズします」

「最初のステップは、視覚的に地物を特定することです。もちろん、ピラミッドはすぐにわかりますが、微妙な地物もあります。識別できたとしても、それがなんであるか、わからないのです」

ライダーの画像から、たとえば、低い線上構造物が浮かび上がる。それは人工物であるかも知れないし、天然の地形かも知れない。それを見分けるのはとても難しいが、周囲の状況や学者としての知識がそれを補う。

「そして、すべての地物をデジタイズする作業に移りました。全部で6万1000個の構造物があります。すべてを手作業で行わなければなりません」とEstrada-Belli。なぜ9カ月もかかったのかと疑問に思われた方のために、彼はこう説明している。「デジタイズは経験に基づいて行われる作業なので、自動化はできないのです。AIにも期待しました。近い将来、それを利用できるときが来るでしょうが、今は経験を積んだ考古学者の目のほうが、コンピューターよりも確実に地物を見分けることができます」

注釈の密度がマップから見てとれると思う。その地物の多くは、今の時点で現地調査によって確認されたものであることに注目して欲しい。既存の地図を見ながら、人間が実際にその土地に行く。そして、その地物が錯覚であったり、期待の産物であったりしないことを確認する。「すべてはそこに存在していると、私たちは確信を持っています」と彼は言う。

  1. pyramid_lidar

  2. pyramid_uncovered

  3. temple_real

  4. temple_lidar

  5. flightlines

「次のステップは数量化です」と彼は説明を続ける。「長さと面積を測定して、ひとつにまとめます。それを、普通にデータセットの解析を行うときと同じように、解析します。地域ごとの構造物の密度、都市や畑の広がりなどです。さらに、農産物の収穫量を推測する方法も編み出しました」

そこが、画像が単なる点の集まりから学術研究に移行するポイントだ。マヤのこの地域には大きな都市があると広く知られていて、何十年間にもわたり熱心な調査が続けられてきたのだが、Fundación Pacunam(Patrimonio Cultural y Natural Maya:マヤの文化及び自然遺産財団)の研究は、これまで使われてきた従来型の調査方法を進化させるものとなった。

「これは膨大なデータセットです。膨大なマヤの低地の断面図です」ととEstrada-Belliは話す。「今はビッグデータが流行り言葉になっているでしょ? 一度に一箇所を見るだけで、これまで決して見られなかったものが、実際に見えるようになるのです。ライダーがなければ、これだけ膨大なパターンの統合はできなかったでしょう」

「たとえば、私の地域では、47平方キロメートルをマッピングするのに15年かかりました」と彼は少し悔しそうに言った。「それが、ライダーを使えば2週間で308平方キロメートルをマッピングできます。私にはまったく太刀打ちできない精細さでね」

その結果、論文には、非常に多くの新理論や結論が書かれることになった。人口と経済の規模の推測、文化的、工学的な知識、隣国との紛争の時代や内容などだ。

この論文は、単にマヤの文化と技術に関する知識を高めたばかりでなく、考古学という学問そのものを進歩させるものとなった。もちろん、何事もそうだが、こうしたことが繰り返される。Estrada-Belliは、ベリーズとカンボジアで同僚が実行した調査から刺激を受けたと話している。彼らの研究は、広大な領域と膨大なデータセットの新しい処理方法の実例を示すという点で貢献してくれた。

実験と現場の作業を重ねることで、その方法はより確かなものになる。そしてそれが広く受け入れられ、人々が模倣するようになる。彼らはすでに、その方法が有効であることを実証した。この研究は、おそらく、考古学でのライダーの可能性を示す、最良の実例となるだろう。

いまさら聞けないライダー(Lidar)入門

「はっきり言って、これほど強力な技術は見たことがありません。地表にあるものですら、その詳細はまだほとんどわかっていないのです。ライダーは、人工の地物のほとんどを、明瞭に、一貫性をもって、わかりやすく特定してくれます」と、共同著者のStephen Houston(ボストン大学)は電子メールで話してくれた。「AIやパターン認識は、地物の発見の精度を高めてくれるでしょう。ドローンも、こうした技術のコストダウンに役立つと期待しています」

「こうした技術は、発見だけでなく、保護にも役立ちます」と、共同著者でイサカ大学のThomas Garrisonは電子メールで指摘した。「遺跡や人工物を3Dスキャンすれば、詳細な記録が残せます。3Dプリントでレプリカを作ることも可能です」

ライダーの画像処理技術は、略奪の程度を知ることにも役立つと、彼は書いている。文化担当の行政機関も、略奪者より前に、遺品や遺跡の存在を知ることができる。

研究者たちは、すでに次の調査を計画している。最初の実験が成功したことで資金を獲得し、二回目はさらに多くの航空調査を増やす予定だ。おそらく、最初の実作業が終わることには、この数年間に流行ったツールが使えるようになっているだろう。

「今後、飛行機の利用料が安くなるとは思えませんが、機材はもっとパワフルになります」とEstrada-Belliは話す。「もうひとつの方向性としては、プロジェクトをスピードアップできる人工知能の発達があります。少なくとも、調査の必要のない場所を除外して、時間の節約を図ると同時に、もっとも可能性の高い場所に狙いを定めることが可能になるでしょう」

また彼は、そのアイデアをインターネットで公開することにより、アマチュアの市民考古学者たちが一緒に考えてくれるようになることを大いに期待している。「私たちと同じ体験をすることはできないでしょうが、人工知能と同じく、短期間に大量の上質なデータを生み出せることは確実です」と彼は言う。

しかし、彼の同僚たちが指摘するように、この数年間のライダーを使った作業は、下準備に過ぎない。

「これは最初のステップであり、数えきれないほどのアイデアの実験、何十もの博士論文につながるものであることを、強調しなければなりません」とHoustonは書いている。「それでも、地表の下に何があるのかを調べる採掘や、廃墟から明確な年代を推論する作業は必要です」

「社会科学や人文科学など数々の学問分野と同様に、考古学もデジタル技術を採り入れています。レイダーはそのほんの一例に過ぎません」とGarrisonは書いている。「同時に私たちは、デジタル・アーカイブに関する問題(とくに古いファイル形式によるトラブル)を意識する必要があります。そして、テクノロジーは、何世紀にもわたり試され、正しいと証明された情報管理方法に取って代わるのではなく、それを補うものとして使うことが重要です」

彼らの論文は9月28日にScienceに掲載されているので、研究の結果を詳しく知ることができる(考古学者や人類学者なら、いっそう楽しめる内容だ)。Pacunamの今後の活動については、このサイトを見ていただきたい。

[原文]
(翻訳:金井哲夫)

いまさら聞けないライダー(Lidar)入門

wtf-is-lidar

その昔、人びとは目から放たれた見えない光線が世界を照らし、それが見るものへの視覚をもたらしているのだと考えていた。もちろん、それは間違いだったのだが、だからといってそれが「見る」ための完璧な方法ではないということではない。実際、それこそがライダーの基本アイデアなのだ。ライダーは、今や考古学から自動運転車に至るまでその有用性が証明されたデジタルイメージ手法である。

ライダー(Lidar)は頭字語の1種で、通常は「light detection and ranging(光による検知と測距)」の略語とされる。まあ最初の2語の間に「imaging」を差し込みたい人もいるだろうけれど。ソナーやレーダーと響きが似ているのは偶然ではない、それらは皆同じ原理である「反響定位法(echo location)を採用しているのだ。まあ、コウモリにできるのだから、私たちにできない理由はないだろう。

エコーで見る

基本的な考え方は単純だ。何かを世界に発射し、それが戻ってくるまでにどれ位の時間がかかっているのかを追跡する。コウモリは音波を使っている。短いきしみ音が環境で反射して、木や虫がどれくらい離れているかによって、耳に戻ってくる時間が異なってくる。それをソナーに転用するには少しばかりの想像力が必要だ、それはより大きな音声パルスを周りの水に向けて発射し、エコーを聞く。もし音波が水中を進む速度を正確に知っていたなら、そして音波が何かに反射して戻ってくる迄にどれくらいかかるかを正確に計測できるなら、反射したものが何であれ、そこまでの正確な距離を知ることが可能だ。

lidar-scanned-sick-lms-animation

おそらく記事の内容は、このGIFに要約されている。

そこからレーダーへの進化はそれほど大きなものではない、ほとんど同じようなことを電波を使って行うのだ。私たちが、飛行場や大きな船の上で、くるくる回るのを見るレーダーアンテナは、電波のビームを発射しているのだ。そして電波は固体に(特に飛行機のような金属に)当たると反射して、それがレーダーアンテナによって検出される。そして私たちは大気中の光の正確な速度を知っているので、飛行機までの距離を計算することができる。

さて、電波は長い距離に渡って固体をみつけるためには大変素晴らしいものなのだが、幾つかの欠点も存在する。例えば、電波はいくつかの物質は反射せずに通り抜けてしまうし、物理学が関係してくるのだが、100フィート(約30.5メートル)程度以下の距離では扱いが難しいのだ。一方、音波には反対の問題がある。それは急速に減衰し速度も相対的に遅い。このため十数フィート以上離れているものを見つけるためには不向きなのだ。

ライダーは有利な点の多い技術だ。ライダーシステムは、レーザーを使って可視スペクトル外の光のパルスを発射し、そのパルスが戻ってくる時間を計測している。ある特定のパルスが反射した方向と距離を、ライダーユニットを中心とした大きな3D地図の中の点として記録する。異なるライダーユニットは、異なる手法を用いるが、一般的にはレーダーアンテナのように円形のスイープを行いながら、同時にレーザーを上下させている。

ライダーが最初に提案された1960年代は、レーザーならびに検出メカニズムは、かさばる上に動作も遅かった。今日では、小さくなった電子部品と高速なコンピューターのおかげで、ライダーユニットは1秒あたり100万回を超えるパルスの送受信が可能であり、1秒あたり何百回もの周囲検知を行うことが可能だ。

戻ってくるレーザパルスからの座標の集合である「ポイントクラウド」は、驚くほど精細で(そして美しい)、環境とその中のオブジェクト全ての輪郭を描き出すことが可能だ。

pointcloud飛行機やヘリコプターのライダーユニットは、飛行中迅速かつ正確に、地上の地形を調査することができる。また考古学者は、ライダーユニットを送り込むことで、その場所の詳細を1インチ単位で記録することができる。また最近では、自動運転車やロボットに搭載されたコンピュータービジョンシステムが、その周囲の状況を簡単に把握することができるようになった。

路上の目

ライダーが手に入れた役立つ用途は、特に最後のものによく適応している。すなわち日常世界のナビゲートだ。私たち人間は、私たちの両眼の視覚から得られる僅かに離れた画像を使って、距離を抽出する洗練された手段を持っている。しかし、もし私たち自身の目からレーザーを発射できて、その反射時間をナノ秒レベルで感知することができるなら、更に素晴らしいことだろう。

ライダーユニットは、一般的には筒状の小さな突起物である。その中ではレーザーと検出器が回転している。多くの自動運転車やプロトタイプの上についているのを見たことがあるだろう。それらは実用上十分に詳細な3Dイメージを生成するので、自動車の電子頭脳に組み込まれたコンピュータービジョンシステムは、車とトラック、自転車とオートバイ、そして大人と子供さえ区別することが可能だ。これは重要なことだ。そうしたものはみな異なる振舞を示し、車の減速を促したり、側方に隙間を空ける必要を生じるかもしれないからだ。

ここに示したビデオはやや古いものだが、車がライダーシステムで周りの何を見ているかについて、分かりやすいイメージを与えてくれる。

とはいえライダーが全てを行うわけではない。例えば、それは標識の文字は平たいので読み取ることができない。そして、もし可視性が限られている場合には、比較的容易にシステムは混乱する。豪雪、濃霧、その他ユニットの視界を妨げるものに影響を受けるのだ。よって、ライダーは他のシステムと連携して動作する必要がある。そのいとこであるレーダーやソナー(実際には超音波)、そして通常の可視光カメラも同時に利用する。ライダー自身は「バンプ(凸あり)」の標識サインを読み取ることはができないかもしれないが、可視光カメラは実際のバンプに直前まで気が付かないかもしれない。チームとして働くことで、システムは間違いなく周囲の環境に対して、人間よりも優れた意識を持つことができるようになるのだ。

高速で高精度のコンピューター知覚の世界は、複雑で急速に進化している。よってライダーの役割も、他のテクノロジーによって追越されたり、その性能を向上させられたりすることによって変わっていくだろう。しかし紀元前500年には否定された視覚の概念が、いままた脚光を浴びているのは間違いないようだ。

[ 原文へ ]
(翻訳:Sako)