画像が何千語分もの情報をもつとしたら、ビデオはその数字にフレームレートを掛けあわせた分の価値があることになる。本日ローンチしたコンピュータービジョンのMatroidは、誰もがビデオの中に含まれた情報を活用できるようになるサービスだ。直感的に操作できる同社のWebプラットフォームを利用することで、ビデオに映る人物やその他のオブジェクトを検出するディテクターをつくることができる。
Matroid創業者のReza Zadeh氏はスタンフォード大学で非常勤の教授を務める人物。彼が最初にこのビジネスの構想を思いついたのは約10年前だった ― そして今、彼は民主化が進むコンピュータビジョンの分野に参入することとなった。Matroidの得意分野は、医療画像などの中にある情報を取り出すことではなく、ビデオからオブジェクトを検出することだ。
Matroidのユーザーは、オブジェクトを検出するディテクターを構築するためにTensorFlowやGoogle CloudのVideo Intelligence APIを利用する必要はない。必要なのは、みずからが用意したトレーニングセットをアップロードするか、何百万もの画像からなるMatroidのライブラリから必要なものを選択することだけだ。Matroidはトレーニング・プロセスの最中に画像や動画を処理することができる。インプットの処理には複数のニューラルネットワークが利用されている。Matroidにビデオをアップロードすると、そこに映る重要なオブジェクトに四角形の枠を重ねるように指示される。そうすることでディテクターをトレーニングすることができるのだ。
Metaroidを使って監視カメラ用のディテクターをつくり、殺人容疑がかけられた人物の無罪を証明するという例を考えてみよう。映画「My Cousin Vinny(邦題:いとこのビニー)」のJ・ペシを救うのだ(日本版注:いとこのビニーは、J・ペシが演じるビニーがスーパーマーケットを訪れた際に強盗殺人犯に間違われてしまうというストーリー。ビニーの愛車はメタリックミント色のビュイック・スカイラーク)。そのために必要なのは、1964年製のビュイック・スカイラークの画像と自動車のコマーシャルビデオなどを使ってディテクターをトレーニングすることだけだ。そして、そのディテクターを使ってスーパーマーケットの監視カメラにビニーの愛車が映っているかどうか確かめればいい。
MetaroidはNielsenなどの企業と手を結び、テレビや他のメディアの動画コンテンツから有益な情報を抜き出すビジネスを展開する予定だ。Appleを例にすれば、iPhoneやMacBookがHBOのテレビドラマに登場する回数を数えるなどのユースケースが考えられる。しかし、Metaroidが活躍するのは広告関連の分野だけではない。例えば、監視カメラの映像を確認するという作業の一部をMetaroidによってオートメーション化することができる。動物や風に揺れる木を無視して、人間や自動車だけを検出するディテクターをつくればいいのだ。
Metaroidはこのユースケースからマネタイズしようとしていて、ストリーミング動画のモニタリングに課金する予定だ。また、データを社外に持ち出すことを嫌う企業に対しては、ローカルに動作するアルゴリズムを有料で提供する。また、Metaroidはビデオに映る光エフェクトを検出したいなどの特定のニーズにも対応できる。YouTube動画に映るバットマンを検出するのは無料だ。
Zadeh氏率いるMetaroidのチームは現在、コンピュータービジョンのマーケットプレイスを構築しようとしている。これが実現すれば、エキスパートたちがより高度にカスタマイズされたディテクターを販売できるようになる。ディベロッパーたちを惹きつけるため、彼らはビジュアライゼーション・ツールを同社のプラットフォームに追加する予定だ。また、同社はTensorFlowを使ったツール内部の大半を公開している。
「ディテクター分野で最大のシェアを持ちたいと考えています」とZadeh氏は話す。
Matroidがサステイナブルな価値を提供するためには、コミュニティをできるだけ早く形成することが必要だ。そのため、Zadeh氏はScaled Machine Learningと呼ばれるカンファレンスを主催したり、TensorFlowの使い方を学ぶための場を設けるなど、機械学習コミュニティで盛んに活動している。
これまでにMatroidはNEAからの資金調達を完了している。Matroidがコミュニティを早期に形成し、彼らのプラットフォームのユーザーが増えてこれば、NEAはこの投資から利益を上げることができるだろう。
[原文]