AIアプリケーションのためのストリーミングデータベースを構築するActiveloopが約5.7億円調達

Y Combinatorの2018年夏季から巣立ったActiveloopは、メディアに特化した人工知能アプリケーションのために特別に設計されたデータベースを開発している。米国時間11月2日、同社は 468 CapitalとCM Venturesがリードする500万ドル(約5億7000万円)のシード投資を発表した。これにはTribe CapitalとShasta Ventures、およびテクノロジー業界のさまざまなエンジェルたちが参加した。

同社の創業者でCEOのDavit Buniatyan(ダビット・ブニアティヤン)氏によると、同社は彼がプリンストン大学で行っていた研究から生まれた。そのとき彼は、AIのユースケースのために特別に設計された、画像や動画など非定型データのストリーミングデータベースが必要だと感じていた。同社はこの度、商用プロダクトのアルファバージョンを立ち上げている。

「私たちのAIのためのデータベースは、具体的には、データを極めて効率的に保存し、これを機械学習のアプリケーションや、コンピュータービジョン、音声処理、NLP(自然言語処理)などのモデルの訓練へストリーミングするレイターです」とブニアティヤン氏は説明している。

実用面では、ビデオやオーディオなどのデータをマシンが理解できる数学的表現に変換するためのオープンソースのAPIだ。さらにそのAPIでデータの異なるバージョンを追跡でき、そして最終的にはそれを、Amazon S3のようなにリポジトリに保存できる。

データがストリーミングで入手できれが、データサイエンティストやデベロッパーはこれまでのようにすべてのデータを手元のノートパソコンにダウンロードする必要もなく、それをモデルが使うために送ることもできる。Netflixでムービーを自分のところへストリーミングするのと同じで、自分のローカルマシンには何もダウンロードしない。

Activeloopの画像データベース(画像クレジット:Activeloop)

彼によると、このオープンソースプロジェクトには55名のコントリビューターがいて、コミュニティのメンバーはおよそ700名いる。そのプログラムはこれまでに30万回ダウンロードされた。

彼がデータをストリーミングしようと思いついたのは、プリンストンの神経科学研究所で大量のデータを扱っていたときだ。彼は、ファイルでは大きすぎると悟った。それをダウンロードするのは非実用的であり、むしろストリーミングするやり方を思いついて、それがActiveloopのベースになった。

現在、社員は15名だが、5〜6名の高度な技術者を求めている。彼が同社を創るときには、人材のダイバーシティをできるかぎり心がけた。たとえばエンジニアリング担当の副社長は女性だ。最近ではエチオピア出身のエンジニアを雇用しようとしたが、彼は結局断った。ブニアティヤン氏によれば、有能な人材であれば性別や人種や国籍などはまったく関係ないし、気にもしないという。

「人の出自や生まれつきなどはどうでもいい。重要なのは、我が社のミッションに貢献してくれるかだけです。私はこの会社をインパクトのある企業に育てたいので、そのための人材が欲しいのです」。

APIはオープンソースだが、この度アルファをリリースした商用プロダクトは、ストリーミングデータへのSQLクエリなど、いろいろな機能が加わっている。それらはオープンソースプロダクトにはない。同社はまだ売上を計上していないが、2022年の第1四半期には商用バージョンをリリースしたい意向だ。

画像クレジット:Activeloop

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)