キーワード検索を超える「ニューラル検索プラットフォーム」開発のJina.aiが約34億円調達

ベルリンを拠点とするJina.ai(ジナエーアイ)は、ニューラル検索を利用して、ユーザーが非構造化データ(動画や画像を含む)から情報を見つけ出すことをサポートしているオープンソースのスタートアップだ。同社は現地時間11月22日、Canaan PartnersがリードしたシリーズAで3000万ドル(約34億円)を調達したことを発表した。このラウンドには、新規投資家のMango Capitalの他、既存投資家のGGV Capital、SAP.iO、Yunqi Partnersも参加し、Jina.aiの資金調達総額は3900万ドル(約44億円)となった。

Nan Wang(ナン・ワン)氏、Bing He(ビン・ヘ)氏とともにJina.aiを創業したCEOのHan Xiao(ハン・シャオ)氏は、深層学習ニューラルネットワークを使って、従来のキーワードベースの検索ツールを超えるというのがニューラル検索だと説明する。伝達学習表現学習などの比較的新しい機械学習テクノロジーを利用することで、同社の中核のJinaフレームワークはデベロッパーが特定のユースケースに応じた検索ツールを迅速に構築するのに役立つ。

「画像、音声、動画などの場合、まずディープニューラルネットワークを使って、このデータフォーマットを普遍的な表現に変換します」とシャオ氏は説明する。「ここでは、ほとんどが数学的なベクトル、つまり100次元のベクトルです。そして、マッチングアルゴリズムでは、一致する文字数を数えるのではなく、数学的な距離、つまり2つのベクトル間のベクトル距離を数えます。このようにして、基本的にこの種の方法論を使って、あらゆる種類のデータ検索問題や関連性の問題を解決することができるのです」。

シャオ氏は、Jinaが検索のためのTensorFlowに似ていると表現した(TensorFlowはGoogleのオープンソースの機械学習フレームワークだ)。人々がAIシステムを設計する際のデザインパターンをTensorFlowやPyTorchが定義したように、Jinaは人々がニューラル検索システムを構築する方法を定義し、その過程で事実上の標準となることを目指している。

しかしJinaは、同社が現在展開する製品の1つにすぎない。Jinaベースのニューラル検索アプリケーションの構成要素を開発者が共有・発見できるマーケットプレイスであるJina Hub、あらゆるディープニューラルネットワークを微調整するためのツールである、最近立ち上げたFinetunerなども提供している。

「この1年半、我々は巨大なニューラル検索タワーの基盤となる中核インフラの構築に多大な労力を費やしてきましたが、その作業は終えました。今、我々はこの大きな建物の1階と2階を少しずつ構築しており、エンド・ツー・エンドの開発体験を提供しようとしています」とシャオ氏は話す。

同社によると、Jina AIの開発者コミュニティには現在約1000人のユーザーがいる。ビデオゲーム開発者がゲームエディターの右クリックメニューに関連するゲームアセットを自動入力するために使用したり、リーガルテックのスタートアップがPDF文書のデータを利用したQ&A体験をチャットボットで提供できるようにするために使用したりと、さまざまな用途がある。

オープンソースのJinaフレームワークには、2020年5月の発表以来、すでに200人近くの外部貢献者が参加していて、同社はこのプロジェクトに関するSlackコミュニティもホストしている。

「我々がオープンソースを採用している大きな理由は、オープンソースの速度にあります。私は開発の速度がソフトウェアプロジェクトの成功の鍵を握ると考えています。多くのソフトウェアは、この速度がゼロになってしまうことでダメになるのです」とシャオ氏は説明する。「我々はコミュニティを構築し、高速に反復するためにコミュニティを活用してフィードバックを集めています。我々のようなインフラソフトウェアにとってこれは非常に重要なことです。すばやく改善するには、使いやすさやアクセシビリティなどについて、一流の開発者たちにフィードバックしてもらう必要があります」。

Jina.aiは、今回調達した資金でチームを倍増させ、特に北米での事業を拡大する計画だ。増強したチームで、Jinaエコシステム全体を広げるための研究開発に投資し、新しいツールやサービスを立ち上げる。

「テキストデータ用に構築された従来の検索システムは、画像や動画、その他のマルチメディアがあふれる世界では機能しません。Jina AIは、企業をモノクロからカラーに変え、高速で拡張性があり、データにとらわれない方法で非構造化データを解き放ちます」とCanaan PartnersのJoydeep Bhattacharyya氏は話す。「オープンソースのフレームワークを使った初期のアプリケーションでは、意思決定の改善や業務の改善、さらには新たな収益源の創出などの機会をニューラル検索が支えており、未来の兆しがすでに見えています」。

画像クレジット:Jina.ai

原文へ

(文:Frederic Lardinois、翻訳:Nariko Mizoguchi

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。