コンピュータビジョンチームに合成データを提供するDatagenが約61.7億円のシリーズB資金調達を実施

イスラエルで設立されたDatagen(データジェン)は、コンピュータビジョン(CV)チームのために合成データソリューションを提供するスタートアップ企業だ。同社はその事業の成長を促進するため、5000万ドル(約61億7000万円)のシリーズBラウンドを実施し、これまでの資金調達総額が7000万ドル(約86億4000万円)を超えたと発表した。今回のラウンドは新たに投資家となったScale Venture Partners(スケール・ベンチャー・パートナーズ)が主導し、パートナーのAndy Vitus(アンディ・ヴィータス)氏がDatagenの取締役に就任した。

テルアビブとニューヨークにオフィスを構えるDatagenは「実世界の環境をシミュレートすることによってわずかなコストで機械学習モデルを迅速に訓練し、AIの進歩を推進する完全なCVスタックを構築している」と、ヴィータス氏は述べている。このパロアルトに拠点を置くVCは「これはCVアプリケーションの開発とテストの方法を根本的に変えるだろう」と予測する。

11カ月前にDatagenが1850万ドル(約22億8000万円)を調達したシリーズAラウンドを支援した投資家たちも、この新たなラウンドに参加した。その中にはVCのTLV Partners(TLVパートナーズ)とSpider Capital(スパイダー・キャピタル)が含まれる。シリーズAを主導したViola Ventures(ヴィオラ・ベンチャーズ)も、今回はその成長部門であるViola Growth(ヴィオラ・グロース)を通じて参加した。さらに、コンピューター科学者のMichael J. Black(マイケル・J・ブラック)氏や、Trevor Darrell(トレバー・ダレル)氏、NVIDIA(エヌビディア)のAI担当ディレクターであるGal Chechik(ガル・チェチック)氏、Kaggle(カグル)のAnthony Goldbloom(アンソニー・ゴールドブルーム)CEOなど、AIやデータ分野の高名な人物も倍賭けを決めている。

投資家の名簿はもっと長くなる可能性があると、DatagenのOfir Zuk(オフィール・ズク)CEOはTechCrunchに語った。このラウンドは数週間前に終了したが、同スタートアップは、確認が取れていない数名の名前とともに「クローズを延期した少しの余地」を残しているという。

シリーズA以降のDatagenの主なマイルストーンの1つは、ターゲットユーザーが初期のフィードバックで要求したセルフサービス・プラットフォームの構築だったと、ズク氏は語る。これによってDatagenは、顧客がCVアプリケーションのトレーニングに必要なビジュアルデータを生成するための、より拡張性の高い方法を提供することができるようになった。

Datagenのソリューションは、フォーチュン100社や「ビッグテック」企業を含む、さまざまな組織内のCVチームや機械学習エンジニアに使用されている。その用途は多岐にわたるが、中でも特に加速している分野が4つあるとズク氏はいう。AR/VR/メタバース、車内および自動車全般、スマート会議、ホームセキュリティだ。

車内への応用は、Datagenが行っていることをより良く理解するための好例といえるだろう。これはつまり、乗員がシートベルトを着用しているかどうかなど、車内の状況を意味する。乗員やクルマの形状はさまざまであるため、そこでAIが活躍するわけだ。最初に現実世界から作成した3Dモーションキャプチャをベースに、Datagenの顧客は、例えばエアバッグの展開する位置を正確に決めるためなどに必要な膨大なデータを生成することができる。

Datagenは、ビジュアルデータに特化しているものの、特定の分野に縛られているわけではない。もし、小売業やロボット工学のユースケースが軌道に乗れば、倉庫のモーションキャプチャなど、特定の現実世界のデータを収集するだけでよい。その上のアルゴリズムや技術は、分野にとらわれないとズク氏はいう。

20年以上の歴史を持つ企業向けVCのScale Venture Partnersは、すでに自動車運転シミュレーション・プラットフォームのCognata(コグナタ)に投資しており、シミュレーションデータの分野に関しては強気だ。ズク氏も同様で「合成データは現実のデータを凌駕しつつある」という言葉でまとめた。

画像クレジット:Andriy Onufriyenko / Getty Images

原文へ

(文:Anna Heim、翻訳:Hirokazu Kusakabe)

Scale AIが人工知能関連で最もホットで新しい合成データゲームに参入

Scale AI(スケールAI)が73億ドル(約8400億円)企業になるまでの道には、画像、テキスト、音声、動画などのリアルデータが敷き詰められていた。現在、その基盤を利用し、AIで最もホットで新しいカテゴリーの1つであるシンセティック(合成)データゲームに参入する。

同社は米国時間2月2日に、機械学習エンジニアが既存の実世界のデータセットを強化するために使える製品「Scale Synthetic」の早期アクセスプログラムを発表した。同社は、この新しい部門を立ち上げるために2人の幹部を採用した。Nines(ナインズ)で機械学習の責任者を務め、Apple(アップル)で3Dマッピングのコンピュータビジョンエンジニアを務めたJoel Kronander(ジョエル・クロナンダー)氏をシンセティックデータ部門の新責任者として、また、Vivek Raju Muppalla(ビベク・ラジュ・ムッパラ)氏をシンセティックサービス部門のディレクターとして採用した。ムッパラ氏は、Unity Technologies(ユニティ・テクノロジーズ)でAIとシミュレーションのエンジニアリングディレクターを務めた人物だ。

シンセティックデータとは、その名の通り、現実世界の情報を使わず、機械学習アルゴリズムによって作成された偽のデータのことだ。医療用画像など、プライバシーが重視されるデータを作成する際に、強力で便利なツールになり得る。開発者はシンセティックデータを使って学習モデルをより複雑にし、収集された実世界のデータセットに散見されるバイアスを取り除くことができる。

Scaleは当初、人がラベル付けした実際の画像、テキスト、音声、動画データとソフトウェアを組み合わせ、自動運転車メーカーに機械学習モデルの学習に必要なラベル付きデータを提供していた。機械学習モデルは、ロボタクシー、自動運転トラック、倉庫やオンデマンド配送に使われる自動ボットの開発と配備に使われる。その後、このスタートアップは、政府、金融、eコマース、自動運転車とエンタープライズ産業などを顧客とするデータ管理プラットフォーム企業へと変貌を遂げた。

創業者でCEOのAlexandr Wang(アレクサンドル・ワン)氏は、この新しいサービスをデータへのハイブリッドアプローチだと表現し、実験室で育てられた肉にたとえた。

「研究室で育てられた肉が本物の動物の細胞から始まるように、私たちは本物のデータから始まり、そこから製品を育て、開発・構築していきます」と同氏はTechCrunchに語った。実世界のデータをベースにしてシンセティックデータを作成することで、実にユニークで強力なサービスを顧客に提供することができると同氏は述べ、同社は市場にそうしたギャップがあると見ていると付け加えた。

Scaleの顧客も、そのギャップを感じていたようだ。同社がシンセティックデータに力を入れたのは、顧客からの需要に応えるためだったとワン氏はTechCrunchに語った。この製品の開発を始めてから、まだ1年経たないという。自動運転車技術開発企業のKodiak Robotics、Tractable AI、米国防総省はいずれも、Scaleの新しいシンセティックデータ製品を採用していると同氏は述べた。

現在、約450人の従業員を抱えるScaleは、シンセティックデータを2022年の最優先事項として捉えており、製品ラインを充実させるために投資を続ける分野だとしている。しかし、それはリアルデータ事業を引き継ぐことを意味するものではない。ワン氏はシンセティックデータを、開発者が「アルゴリズムなどのAIや、特にエッジケースでより多くの利益を得られるようにするための補完的なツール」と考えている。

例えば、自動運転車の会社は通常、シミュレーションを使って現実世界のシナリオを再現し、その環境で自動運転システムがどのように対処するかを確認する。現実世界のデータでは、彼らが求めているシナリオは得られないかもしれない。

「例えば、100台の自転車が一度に横断するようなシナリオは、現実世界ではあまり遭遇しません」とワン氏は説明する。「現実世界のデータから出発して、すべての自転車や人を合成的に追加することで、アルゴリズムを適切に訓練することができるのです」。

画像クレジット:Getty Images

原文へ

(文:Kirsten Korosec、翻訳:Nariko Mizoguchi