数週間前にFLIRと提携してBostonスマート・サーマルカメラを発表し、大きな注目を集めたMovidiusが再び重要な製品を発表した。 同社はサーマルカメラでも使われたMyriad 2プロセッサのメーカーだが、新たな応用分野を発見した。Fathom Neural Compute Stickと名付けられたスティックはUSBをサポートするあらゆるデバイスにニューラル・ネットワークによるコンピューティング能力を与える。
ユーザーはFathomを文字通りどんなデバイス(コンピューター、 GoPro、Raspberry Pi、Arduino etc)のUSBポートにも挿してそれらをスマート化できる。Fathomeに内蔵されたMyriad 2プロセッサが画像をニューラルネットワークに読み込む(結局このチップがカギとなる)。
簡単にいえば、Fathomをプラグインとしたデバイスは認識能力を備える。カメラないし他のデバイスからの画像を高度なコンピューター・ビジョンで処理し、プログラムに従って独自の知的判断を下せるようになるという。重要なのは、こうした処理がすべてUSBスティック内で自己完結的に実行可能だという点だ。いちいちクラウド上の資源を呼び出す必要はない。
このUSBスティックに加えて、MovidiusはFathom Deep Learning Software Framework〔Fathom深層学習ソフトウェア・フレームワーク〕と呼ばれるアプリケーション開発プラットフォームも提供する。ユーザーはこのフレームワークを用いてアルゴリズムを最適化し、コンパイルすることができる。生成されたバイナリー・ファイルはきわめて低い消費電力でMyriad 2プロセッサ上で¥各種のコンピューター・ビジョンを実現できる。 Movidiusではフルパワー、ピーク・パフォーマンスは1ワットで、このとき画像16枚を処理できるとしている。Fathomeスティックの利用分野はもちろん画像処理だけにはとどまらない。
Movidiusではテスト用に1000個のスティックを用意しており、一部の企業、研究者、スモール・ビジネスに対しここ数週間のうちに無料で配布する。第4四半期には大量生産の開始が予定されている。価格は100ドル台になるもようだ。
ここまでが発表されたニュースだが、ではこのニューラルネットワークというのはいったいどんな仕組みで、どんな応用が考えられているのだろう?
Fathomは何ができるのか?
ニューラルネットワークの仕組みやFathomデバイスが現実にどのようなケースに応用できるのか理解するのはたいへん難しい。私は何時間も苦闘して(Movidiusには何回も電話した)やっとある程度のイメージをつかむことができた。以下は問題を大幅に簡単にした比喩的な理解だということを承知していただきたい。
コンピューターがある種のに画像をリアルタイムで認識し、プログラムされたとおりに反応することができれば非常に便利だ。たとえばドローンのコンピューターにどのような場所なら着陸に適しているか、広さや平坦さを覚えさせることができたらどうだろう? ドローンは適切な地点を自ら発見して着陸することができる。
こうしたことを実現するためには非常に複雑なコンピューター・システムを構築しなければならない。 GPUも大量に必要とするだろう。またユーザーはTensorFlowのようなオープンソースのライブラリーを用いて機械学習のためのニューラルネットワークを開発することになる。ソフトウェアが完成したら、次に何百、いや何万という画像をシステムに読み込ませ「着陸可能地点」の特徴を学ばせる。しかしドローンの着陸に適した場所としては裏庭、船の甲板、取り付け道路、山頂…あらゆるバリエーションが考えられる。
努力を重ねていけば、やがてシステムは自ら学習を進め、「着陸可能な地点を認識する」という目標に向けてアルゴリズムを改良していくだろう。だがこうしてシステムが完成したとしても、リモートのデバイスからシステムに接続しリアルタイムでの処理を実現するのは難事業だ。クライアント/サーバー・モデルではある程度の遅延は避けられず、情報の欠落も起きる。ドローンを着陸させようとしている場合、こうした遅延や脱落は致命的な問題を引き起こしかねない。
Fathom Neural Computeスティックが解決しようとしているのはまさにこの種の問題だ。Fathomはニューラルネットワークに基づいたコンピューティング・パワーを自己完結的に内蔵し、リアルタイムで結果を返すことができる(どのように反応すべきかはFathomソフトウェア・フレームワークで アプリを開発する必要がある)。Fathomスティックを装着したデバイスはあたかも内蔵されたシステムであるかのようにコンピュータ・ビジョンを利用できる。
この例でいえば、ドローンは着陸可能地点を認識するためにクラウドと通信する必要はなく、デバイス内で判断を完結させることができるわけだ。しかも必要な電力は非常に少ない。
ひとことで言って、これはすごい。
さらなる応用
低消費電力で高度な画像認識機能を備えたハードウェアという点を理解すれば、あとは多少の想像力を働かせてFathomが利用できる応用分野をいくつも考えることができる。知的判断ができるドローンはその一例だが、コンテキストを認識するセキュリティー・カメラ、自動走行車、進化したレベルの自然言語認識等々だ。
またUSBスティックという小型軽量で接続にきわめて汎用性が高いフォームファクターはウェラブルデバイスが利用するにも適している。各種のヘッドセットへの応用がまず考えられるだろう(量産レベルとなればUSBスティックが外付けされることはなく、デバイスに内蔵されることになるだろうが)。仮想現実、拡張現実がメインストリームに参入しようとしていることを考えればFathomの影響は非常に大きくなりそうだ。
コンピューター・ビジョン (CV)のアルゴリズムは拡張現実、仮想現実、混合現実を実現するたの大きな柱の一つだ。したがってCVの機能を向上させ、フットプリントを小さくするような改良はどれも大きなインパクトを持つことになる。
ビジネス戦略的に考えても、MovidiusのUSBスティックは潜在的顧客獲得の手段として適切だろう。 拡張/仮想現実の実現を目指す大企業はすでにGoogleその他の大企業と提携している。しかしスタートアップや小規模メーカーは手軽に利用できるCVハードウェアを探している。モジュラー性が高く、安価であり手額に追加できるFathomモジュラーはそうしたメーカーにとって理想的なソリューションになる可能性がある。
画像: Movidius
[原文へ]
(翻訳:滑川海彦@Facebook Google+)