オーストリアの合成データデータスタートアップであるMOSTLY AI(モーストリー・エーアイ)は米国時間1月11日、シリーズBラウンドで2500万ドル(約28億6000万円)を調達したことを発表した。英国のVCファームMolten Ventures(モルテン・ベンチャーズ)がこのオペレーションを主導し、新たな投資家であるCiti Ventures(シティ・ベンチャーズ)が参加した。既存の投資家には、ミュンヘンの42CAP(42キャップ)と、MOSTLY AIの2020年の500万ドル(約5億2700万円)のシリーズAラウンドを主導したベルリンのEarlybird(アーリーバード)が名を連ねている。
合成データ(シンセティックデータ)はフェイクデータであるが、ランダムではない。MOSTLY AIは人工知能を利用して、顧客のデータベースに対する高い忠実度を達成する。同社によると、そのデータセットは「企業の元の顧客データと同じくらいリアルに見え、そこには多くの詳細情報が含まれているが、元の個人データポイントは存在しない」という。
MOSTLY AIのCEOであるTobias Hann(トビアス・ハン)氏はTechCrunchに対して、調達した資金について、プロダクトの限界の拡張、チームの成長、そして欧州と米国での顧客獲得に活用する計画であると語った。米国ではすでにニューヨーク市にオフィスを構えている。
MOSTLY AIは2017年にウィーンで設立され、その1年後にEU全域で一般データ保護規則(GDPR)が施行された。プライバシー保護ソリューションに対するこうした需要と、それに付随する機械学習の台頭は、合成データに向けて大きな勢いを生み出している。Gartner(ガートナー)の予測では、2024年までに、AIおよびアナリティクスプロジェクトの開発に使用されるデータの60%が合成的に生成されるようになるという。
MOSTLY AIの主な顧客は、Fortune 100(フォーチュン100)に名を連ねる銀行や保険会社、通信事業者などである。これら3つの高度に規制されたセクターは、ヘルスケアと並んで、シンセティック表形式データに対する需要の大部分を牽引している。
競合他社とは異なり、MOSTLY AIはこれまでヘルスケアに主力を置いていなかったが、それも変わる可能性がある。「ヘルスケアは確かに私たちが注視しているものです。実際、2022年はいくつかのパイロットプロジェクトの開始を予定しています」とCEOは話す。
AIの民主化は、合成データがいずれはFortune 100企業の枠を超えて使われるようになることを意味する、とハン氏はTechCrunchに語っている。したがって、同氏の会社は今後、より小規模な組織や、さらに幅広いセクターに向けてサービスを提供する計画である。だがこれまでの取り組みにおいて、MOSTLY AIがエンタープライズレベルのクライアントに注力することは理にかなうものであった。
現在のところ、合成データを扱うための予算、ニーズ、高度な技術を有しているのはエンタープライズ企業であるとハン氏は語る。その期待に適合するために、MOSTLY AIはISO認証を取得した。
ハン氏と話をする中で、明確になったことが1つある。同スタートアップは確かな技術的基盤を備える一方で、その技術の商業化と、自社がクライアントに提供し得る付加的なビジネス価値にも等しく労力を注ぎ込んでいる。「MOSTLY AIは、顧客デプロイメントと専門知識の両面で、この新興の急成長領域をリードしています」とMolten Venturesの投資ディレクターであるChristoph Hornung(クリストフ・ホルヌング)氏は述べている。
GDPRやCCPA(カリフォルニア州消費者プライバシー法)などのプライバシー法を遵守する必要性は、明らかに合成データに対する需要を促進するが、それだけが効果を現す要因ではない。例えば、欧州の需要は、より広い文化的コンテクストによっても牽引される。一方、米国では、それはイノベーションの追求からも生じる。そのユースケースとして、アドバンストアナリティクス、予測アルゴリズム、不正検出、プライシングモデルなどが挙げられるが、そこには特定のユーザーに遡ることのできるデータを含まない、という要素が求められる。
「多くの企業がこの領域に積極的にアプローチしているのは、顧客のプライバシー重視を理解しているからです」とハン氏。「これらの企業は、プライバシーを保護する方法でデータの処理と取り扱いを行う場合、競争上の優位性も得られることを認識しています」。
より多くの米国企業が革新的な手法における合成データの採用を求めている様相は、MOSTLY AIが米国でのチームの成長を目指す主要な理由となっている。一方で、同社はウィーン勤務とリモート採用の両方でより一般的な人材開拓も進めている。年末までに人員を35人から65人に増やす計画である。
ハン氏は、2022年は「合成データが軌道に乗る年」であり、その先は「合成データにとって実に堅調な10年」になると予想している。これは、AIの公平性や説明可能性といった重要な概念を中心に、責任あるAIに対する需要が高まっていることに支えられるであろう。合成データはこれらの課題の解決に貢献する。「合成データは、エンタープライズが自らのデータセットを増強し、バイアスを取り除くことを可能にします」とハン氏は語る。
機械学習を別にして、合成データはソフトウェアテストに活用されるポテンシャルが十分にあるとMOSTLY AIは考えている。これらのユースケースのサポートには、データサイエンティストだけではなく、ソフトウェアエンジニアや品質テスターも合成データにアクセスできるようにする必要がある。MOSTLY AIが数カ月前に同社のプラットフォームのバージョン2.0をリリースしたことは、彼らのことを考慮したものである。「MOSTLY AI 2.0はオンプレミスでもプライベートクラウドでも実装でき、それを使用する企業のさまざまなデータ構造に適応できる」と同社は当時記している。
「当社は明らかにB2Bソフトウェアインフラ企業です」とハン氏は語る。シリーズAとBの両ラウンドで、同社はそのアプローチを理解する投資家を探し求めた。
筆者の質問に対してハン氏は、Molten Venturesは上場しているVCであり、通常の資金調達サイクルに縛られないこともかなりの重みがあることを認めている。「パートナーからこのような長期的なコミットメントを得られることは、私たちにとって非常に魅力的でした」。
Citi VenturesはCitigroup(シティグループ)のベンチャー部門であり、米国に本部を置いている。「当社は米国内のチームを大幅に拡大しており、米国内のネットワークや関係を支援可能な米国拠点の投資家を持つことは、あらゆる側面で大きな意義があります」とハン氏は語っている。
新たに2500万ドルの資金を調達し、米国でのプレゼンスを強化することで、MOSTLY AIは今後、合成データ領域の自社のセグメントで他の企業と競争するためのより多くのリソースを手にすることになる。そうした企業には、2021年9月にシリーズBで3500万ドル(約40億1000万円)を調達したTonic.ai(トニック・エーアイ)、同年10月にシリーズBで5000万ドル(約57億3000万円)を集めたGretel AI(グレテル・エーアイ)、シードラウンドを行った英国のスタートアップHazy(ヘイジー)の他、特定の垂直市場に特化したプレイヤーたちが含まれている。
「私たちはこの領域、そして市場全般でますます多くのプレイヤーが出現しているのを目にしており、そこに多くの関心があることが確実に示されています」とハン氏は語った。
画像クレジット:yucelyilmaz / Getty Images
[原文へ]
(文:Anna Heim、翻訳:Dragonfly)