アプリに音声と動画によるコミュニケーション機能を組み込むVoximplantがベータ版をリリース

ここ数年、音声やビデオのコミュニケーション機能をアプリやサービスに統合するためのサービスが急増している。Twilioや、Googleが開発する自然言語処理(NLP)プラットフォームのDialogflowなどだ。

サンフランシスコを拠点とするVoximplantも同様のサービスを開発し、Avatarプロダクトのベータ版を公開した。同社はこれまでにBaring Vostok Capital Partners、RTP Ventures、Google Launchpad Acceleratorから1010万ドル(約11億6200万円)を調達した。

同社はすぐに使える自然言語処理サービスを提供しており、開発者はこれを利用してアプリに自然言語処理機能を組み込んでスマートIVR(自動音声応答システム)や音声ボット、チャットボットの機能を追加し、インバウンド通話の自動化、FAQ、インタラクティブなアンケート、NPS(ネットプロモータースコア)、コンタクトセンターの自動化などに活用できる。

Voximplantによれば、同社のサービスでは開発者が複雑なバックエンドのロジックを構築する必要はなく、ノーコードのエディターと会話型AIにより、AI搭載ボットを開発してチャットや電話と簡単に統合できるという。

同社はさらに、機械学習に関する部分はすべてプラットフォームが処理するため、開発者は基本的なJavaScriptの知識があれば十分だと説明している。

Voximplantの共同創業者でCEOのAlexey Aylarov(アレクセイ・アイラロフ)氏は発表の中で「次世代のCPaaS(Communications Platform as a Service)はインテリジェントなサービスとプログラミングが簡単なオムニチャネルのコミュニケーション機能を融合したものであり、これを実現することで現在と将来の当社顧客に最大の価値をもたらすと確信しています」と述べている。

画像クレジット:Flashpop / Getty Images

原文へ

(文:Mike Butcher、翻訳:Kaori Koyama)

AIが核融合を操る力を獲得した。でも大丈夫、これは朗報だ

とある研究グループが、核融合研究に使用される高出力のプラズマ流を磁気的に扱う方法をAIに教えた……おっと、慌てないで欲しい。慌てて手にした電磁パルス砲やドライバーはしまい込んでも大丈夫だ。これは間違いなく良い成果で、来るべきロボカリプスで人類に対して使用される恐ろしい武器ではない。

このプロジェクトは、Google(グーグル)のDeepMind(ディープマインド)とローザンヌ工科大学(EPFL)の共同プロジェクトであり、数年前に前者のAI研究者と後者の融合研究者がロンドンのハッカソンで出会ったときに始まった。そのときEPFLのFederico Felici(フェデリコ・フェリーシ)氏は、彼の研究室がトカマクのプラズマ維持に関して抱えていた問題について説明した。

何気ない日常的な愚痴に過ぎない。しかし、それがDeepMindの琴線に触れて、両者は仕事を始めた。

核融合の研究にはさまざまな方法があるが、いずれも数億度という非常に高い温度で形成されるプラズマを利用している。危険そうに聞こえるし、実際にもそうなのだが、トカマクはそれを制御し、内部で起こっている核融合活動の詳細な観察を可能にする1つの方法なのだ。トカマクは基本的にはトーラス(ドーナツ)のような形をしていて、その中を加熱したプラズマが円を描くように移動するが、その経路は磁場によって慎重に制限されている。

誤解のないように言っておくと、これはクリーンなエネルギーを無限に供給するという噂の核融合炉ではない。エネルギーを生産するわけでもないし、もし突然起動したら近くにいてはいけない。これは、不安定だが将来性のあるこれらのプロセスがどのように制御でき、有用な目的にどのように利用できるのかを、テストし観察するための研究ツールなのだ。

特に、スイスプラズマセンターの「可変構成型」トカマクは、単にリング状にプラズマを閉じ込めるだけでなく、研究者がその形状や経路を制御することができる。1秒間に磁気パラメータを何千回も調整して、リングの幅を広げたり、薄くしたり、高密度にしたり、希薄化させたりと、リングの品質に影響を与えるあらゆる要素を調整できる。

画像クレジット:DeepMind & SPC/EPFL

機械の磁場の詳細な設定は、当然ながら事前に決めておかなければならない。設定方法を間違った場合には、大きな損害を被る可能性があるからだ。この設定は、チームが長年にわたって改良してきたトカマクとプラズマの強力なシミュレーターを使って行われる。しかし、フェリーシ氏はEPFLのニュースリリースでこう説明している。「制御システムの各変数の正しい値を決定するには、今でも長時間の計算が必要です。それこそが、DeepMindとの共同研究プロジェクトの出番となる場所なのです」。

このチームは、まず機械学習システムに、ある設定がどのようなプラズマパターンを生み出すかを予測するように学習させ、次に望ましいプラズマパターンから逆算して、それを生み出す設定を特定した(と簡単そうに書いたが、このようなAIアプリケーションにありがちなこととして、実際の実現は相当大変だった)。

米国時間2月16日発行のNature(ネイチャー)に掲載された論文によれば、このアプローチは大成功を収めたという。

今回のアーキテクチャは、高いレベルで指定された制御目標を満たすと同時に、物理的および運用上の制約を満たしているのだ。このアプローチは、問題の仕様記述に対してこれまでにない柔軟性と汎用性があり、新しいプラズマ設定を生み出すための設計工数を大幅に削減できるという:私たちはこのTokamak à Configuration Variable(構成可変型トカマク)を使うことで、従来の細長い形状に加えて、負三角(negative triangularity)や「スノーフレーク」(snowflake)などの高度な形状を含む、多様なプラズマ形状の生成と制御に成功している。

以下にこのモデルが作り出せたさまざまな形状や構成の例を紹介する。

トカマクの「ドーナツ」をスライスした、内部とビームの断面図(画像クレジット:DeepMind & SPC/EPFL)

これは重要な研究だ、なぜならこのようなプラズマを使って実験するには、電力が必要なのはもちろん、非常に多く(数百万単位だ考えて欲しい)の微調整が必要であり 、すべてを手動で構成することはできないからだ。例えばある理論が2つのストリームを必要とし、一方が他方より22%大きい場合、それを生成するための理論的な設定を「従来の」手法(ご想像の通り、これもすでに非常に複雑なデジタルシミュレーションだ)を利用して案出するには、数週間または数カ月かかることがある。しかし、AIはそれに比べるとほんのわずかな時間で良い組み合わせを見つけ出し、その場で解決策を生み出したり、人間の監査役に有力な作業の出発点を与えたりすることができる。

また、安全面でも重要な意味を持つ。というのも、人間は1~2秒の間に異常を封じ込められるような設定を、即興では行えないからだ。しかし、AIならばリアルタイムに設定を変更して損傷を防ぐことができるかもしれない。

DeepMindの研究者であるMartin Riedmiller(マーティン・リードミラー)氏は、これが「初期の段階」であることを認めているが、もちろんそれは科学におけるほぼすべてのAIアプリケーション全体に言えることだ。機械学習は、数え切れないほどの学問分野で、強力で汎用性のあるツールであることが証明されつつある。しかし、優れた科学者のように、彼らはすべての成功を鵜呑みにせず、その先のより自信を持てる結果を待ち望んでいるのだ。

画像クレジット:DeepMind & SPC/EPFL

原文へ

(文:Devin Coldewey、翻訳:sako)

東京大学と農研機構が作物の品種改良を行う育種家の感性を解明、柑橘類の皮の剥きやすさと実の硬さを深層学習で定量化

Pythonを用いることで、カンキツの果実断面の画像から、果実のさまざまな形態的特徴を定量的かつ自動的に評価する技術を開発

Pythonを用いることで、カンキツの果実断面の画像から、果実のさまざまな形態的特徴を定量的かつ自動的に評価する技術を開発

東京大学農研機構は2月10日、育種家(作物の品種改良を行う人)が独自の感性でもって評価してきた柑橘類の剥皮性(皮の剥きやすさ)と果実の硬度を、AIによる画像解析などにより定量化することに成功したと発表した。これにより、効率的な品種改良が可能になるという。

東京大学大学院農学生命科学研究科(南川舞氏・日本学術振興会 特別研究員、岩田洋佳 准教授)と農研機構(野中圭介氏、浜田宏子氏、清水徳朗氏)からなる研究グループは、柑橘類の果実の剥皮性と硬度を、果実断面のAIの深層学習を用いた画像解析などから、自動的に、定量的に評価する技術を開発した。そうした評価は、これまで育種家の感性に頼ってきたものであり、何を持って評価を行っているかは当事者にしかわからない「ブラックボックス」状態だった。

育種家の感性による達観的評価の方法

育種家の感性による達観的評価の方法

深層学習による剥皮の難易もしくは果実の硬軟の分類と、分類に寄与した特徴の可視化

深層学習による剥皮の難易もしくは果実の硬軟の分類と、分類に寄与した特徴の可視化

柑橘類の果実は、外皮(フラベド)、中果皮(アルベド)、じょうのう(袋)、果肉、種子、果芯(中心部)で構成されている。その断面画像を解析したところ、果芯の崩壊(空間ができること)が進んだ果実ほど皮が剥きやすく実が柔らかいという関係性がわかった。このほか、種子の面積と硬度の関係、アルベドの崩壊の状態も剥きやすさと柔らかさに寄与することもわかった。こうした関係性の推定には、変数間の因果関係を推定するベイジアンネットワークが用いられている。

ベイジアンネットワークにより推定された、カンキツ果実の形態的な特徴と剥皮性・果実硬度との関係

ベイジアンネットワークにより推定された、カンキツ果実の形態的な特徴と剥皮性・果実硬度との関係

この技術により果実の形態的な特徴のデータを自動的に大量に収集できるようになれば、ゲノム情報を活用した効率的な品種改良が可能となる。また、「果芯の崩壊程度や種子面積を改良することで、望ましい剥皮性や果実硬度を有する新品種」の開発も可能になるという。今後は、剥皮性と果実硬度の総合的な遺伝システムの解明を目指すとのことだ。

人が世界を理解するように因果関係をAIの意思決定に導入するノーコード技術のcausaLensが51.8億円調達

今日までの人工知能の最も一般的なアプリケーションの1つは、過去のデータで訓練されたアルゴリズムを使って予測を行い、将来の結果を判断するというものである。しかし、普及が必ずしも成功を意味するわけではない。予測AIは、結果につながる多くのニュアンス、コンテキスト、因果関係の推論を除外する。一部の人たち指摘しているように(そして私たちが見てきたように)、これは予測AIが生み出す「論理的な」答えがときとして悲惨なものになることを意味している。causaLens(コーザレンズ)というスタートアップは、因果推論(causal inference)技術の開発を行っている。この技術は、AIベースのシステムにニュアンス、推論、因果関係の知覚能力を導入する上でデータサイエンティストを必要としない、ノーコードのツールとして提供されており、この問題を解決できると同社は考えている。

causaLensのCEOで共同創業者のDarko Matovski(ダーコ・マトフスキー)氏は、AIが「人間が世界を理解するように世界を理解し始める」ことを目指していると語る。

同社は米国時間1月28日、このアプローチが初期にある程度成功し、1年前にステルス状態から脱して以来収益が500%成長したことを受けて、4500万ドル(約51億8000万円)の資金調達を行ったことを発表した。これはラウンドの「最初のクロージング」と表現されており、引き続きオープンで、規模拡大のポテンシャルを秘めていることを示唆している。

Dorilton Ventures(ドリルトン・ベンチャーズ)とMolten Ventures(モルテン・ベンチャーズ、Draper Esprit[ドレイパー・エスプリ]からブランド名を変更したVC)がこのラウンドをリードし、以前からの支援者であるGeneration Ventures(ジェネレーション・ベンチャーズ)とIQ Capital(IQキャピタル)、そして新たな支援者としてGP Bullhound(GPブルハウンド)も参加した。情報筋によると、ロンドンに拠点を置くcausaLensは、同ラウンドで約2億5000万ドル(約287億8000万円)と評価された。

causaLensの現在の顧客やパートナーには、ヘルスケア、金融サービス、政府機関の他、多岐にわたる業界の組織が名を連ねている。こうした組織は、成果に到達する過程において、AIベースの意思決定だけではなく、より多くの因果関係のニュアンスを取り入れる目的で、同社の技術を活用している。

この仕組みの実例を挙げると、同スタートアップのパートナーの1社であるMayo Clinic(メイヨー・クリニック)は、causaLensを使って癌のバイオマーカーを同定している。

「人間の身体は複雑なシステムであり、基本的なAIパラダイムを適用することで望みどおりのパターンや相関関係を見つけることは可能ですが、成果を得ることはできません」と、同スタートアップのCEOで創業者のDarko Matovski(ダルコ・マトフスキー)氏はインタビューで語っている。「ですが、因果関係の手法を応用して、相違する身体がどのように機能するのかを理解すれば、ある組織が別の組織にどのような影響を与えるのか、その本質をより深く理解することができます」。

関連するすべての変数を考慮すると、それは人間にとって、あるいは人間のチームにとっても、計算することはほぼ不可能なビッグデータの問題である。しかしコンピューターにおいては、対処すべき必要最低限のものと位置づけられる。これは癌の治療法ではないが、この種の研究は、関与する多くの組み合わせに応じた多様な治療法を検討する上で、意義のある一歩である。

causaLensの技術は、ヘルスケア分野でも、あまり臨床的ではない形で応用されている。世界有数の経済大国に属する公衆衛生機関(causaLensはそれについて公表を控えている)は、同社のCausal AIエンジンを使用して、特定の成人が新型コロナウイルスのワクチン接種を躊躇している理由を特定し、その人たちを参加させるためのより良い戦略を考案した(ここでは複数の「戦略」が運用上の細目となっている。対象者によってさまざまな理由を含む複雑な問題であるということに要点がある)。

金融サービスのような領域の他の顧客は、causaLensを使って、ローン評価などの分野における自動化された意思決定アルゴリズムに情報を与えている。従来のAIシステムは、過去のデータのみを使って意思決定にバイアスを導入するものであった。一方ヘッジファンドでは、causaLensの活用により、市場のトレンドがどのように発展して投資戦略に反映されるかについてより深い洞察を得ている。

そして興味深いことに、自動運転輸送の世界に新たな顧客の波が現れているかもしれない。これは、人間の推論の欠如によって分野の進歩が妨げられてきた領域の1つである。

「どれほど多くのデータが自律システムに送られても、それは歴史的な相関関係にすぎません」とマトフスキー氏はこの課題について語っている。同氏によると、causaLensは現在、2つの大手自動車会社と同社の技術の「数多くのユースケース」について協議を進めているが、その中でも特定のユースケースとして「世界がどのように機能するかをシステムが理解する」ような自動運転に注目しているという。「それは、赤信号や停車中の車に関連する相関ピクセルだけではなく、その車が赤信号で減速することでどのような結果が生じるのかも考慮したものです。私たちはAIに推論を導入しています。自動運転において、Causal AIは唯一無二の希望です」。

AIを仕事で使用している人たちが、システムをできる限り正確にしたいと考えるのは当然のことのように思える。それは、そもそもなぜCausal AIによる優れた改善がAIアルゴリズムや機械学習に組み込まれていないのかという疑問を抱かせる。

初期の段階において、推論や「なぜ」と返答することの追求を優先していなかったわけではないとマトフスキー氏は説明する。「人々は長い間、科学の中で因果関係を探求してきました。ニュートンの方程式は因果を示すものであると主張することもできます。それは科学において極めて基本的なことです」。しかしAIの専門家たちは、機械にそれを教える方法を解明できなかったのである。「それは難しすぎました」と同氏は語る。「アルゴリズムとテクノロジーが存在していませんでした」。

同氏によると、その状況は2017年あたりから変化し始めたという。それは研究者らが、AIにおける「推論」や因果関係の表現方法について、既存の成果への貢献を示す信号を発見する(過去のデータを使って成果を決定するのではなく)ことに基づいて検討し、それに立脚したモデルを構築するという初期アプローチを発表し始めた時期である。興味深いことに、これはマトフスキー氏が言及している、仕事をするために大量のトレーニングデータを取り込む必要がないアプローチである。causaLensのチームは、博士号にかなりの比重が置かれている(同スタートアップはここで本格的にドッグフーディング[事前に自身で有用性を確かめる]を実践したといえるかもしれない。チームを編成する際に5万人の履歴書を検討している)。そしてこのチームは、そのバトンを受け取って、それで走り続けてきた。「以来、指数関数的な成長曲線を描いています」と同氏は語っている(その詳細はこちらで確認できる)。

AIに依存する大規模プロジェクトで因果推論の進歩を活用する方法を検討しているのは、causaLensだけではない。Microsoft(マイクロソフト)、Facebook(フェイスブック)、Amazon(アマゾン)、Google(グーグル)など、AIに多額の投資をしている大手テック企業もこの分野に取り組んでいる。スタートアップの中では、Causalis(コーザリス)も特に医薬とヘルスケアでCausal AIを使う機会に焦点を当てており、Oogway(ウーグウェイ)は消費者向けのCausal AIプラットフォームを構築しているようである。これらはすべて、特定の商用、そしてより一般的なユースケースの両方をカバーする、より広範で大規模な当該技術市場が開拓される機会を示している。

「AIは、現実世界におけるポテンシャルを実現するために、因果推論に向けた次のステップを踏み出さなければなりません。causaLensは、Causal AIを活用して介入をモデル化し、機械駆動型の内省を可能にした最初の企業です」とDorilton VenturesのDaniel Freeman(ダニエル・フリーマン)氏は声明で述べている。「このワールドクラスのチームは、本格的なデータサイエンティストの心を掴む洗練性と、ビジネスリーダーに力を与えるユーザビリティを備えたソフトウェアを開発しました。Dorilton Venturesは、次のステージでcausaLensをサポートすることに大きな喜びを感じています」。

「どの企業もAIを採用するようになるでしょう。単に採用できるからではなく、採用する必要があるからです」とMolten Venturesの投資ディレクターであるChristoph Hornung(クリストフ・ホルヌング)氏は付け加えた。「私たちMoltenは、因果性がAIのポテンシャルを引き出すために必要となる重要な要素であると確信しています。causaLensは、最適なビジネス上の意思決定へとデータを変換する能力が証明されている、世界初のCausal AIプラットフォームです」。

画像クレジット:Andriy Onufriyenko / Getty Images

原文へ

(文:Ingrid Lunden、翻訳:Dragonfly)

コンピュータービジョンでレストランのオーダーエラーを解消するAgot AI

Agot AIの共同創業者エヴァン・デサントラ氏とアレックス・リッツエンバーガー氏(画像クレジット:Agot AI)

人工知能はいろいろな業界に浸透してきたが、レストランはその中でも後発となり、その主な導入動機はパンデミックとオンラインオーダーの導入となる。

レストランのAI導入は今後も増えるだろう。2021年には米国人の60%が週に1度以上テイクアウトまたはデリバリーを注文し、31%がデリバリーサービスを利用したMarket Study Reportの予想によると、世界のレストラン管理ソフトウェアの市場は年率25%で伸び、2025年には69億5000万ドル(約8034億円)に達する

しかしながら私たちはみな、フードデリバリーが持ってきたものが注文と違うという経験をしている。そこでAgot AIは、機械学習を利用するコンピュータービジョンの技術を開発し、最初はファストフード業界を対象にして、そのようなエラーが起きないようにした。

同社は3年前にEvan DeSantola(エヴァン・デサントラ)氏とAlex Litzenberger(アレックス・リッツエンバーガー)氏が創業し、レストランテクノロジーのオペレーションの側面や、従業員の成功報酬、レストランの顧客満足度の向上などの問題解決を目指した。

画像クレジット:Agot AI

同社のプロダクトは、オンラインからのオーダーに対する正しさをリアルタイムで確認し、修正が必要なら従業員に告げる。たとえば彼らは、チーズとケチャップを加えるのを忘れていたかもしれない。

同社はその技術を発表して以来、Yum! Brandsなどの大手サービスの協力のもとに、展開を進めてきた。Yumの場合、Agotは同社とのパートナーシップにより、その20のレストランでパイロット事業を行った。パイロットの結果が良ければ、Yumの100のレストランで実装する、とAgotのCEOデサントラ氏はいう。

Yum! BrandsのチーフストラテジーオフィサーであるGavin Felder(ギャビン・フェルダー)氏は声明で次のように述べている。「同社は常に、テクノロジーを利用する革新的な方法でチームのメンバーの能力を高め、私たちのレストランにおいて彼らと顧客の両方の体験を向上させようとしてきた」。そしてパイロット事業の初期的な結果は「私たちが料理を届けているすべてのチャンネルで、顧客にオーダーに忠実で正確なメニューを届けることができるという将来的に有望な可能性を示唆している」。

Yum! Brandsは、Agotの顧客であるだけでなく投資家でもある。以前の1200万ドル(約13億9000万円)のラウンドでは、Continental Grain Co.の戦略的投資部門であるConti VenturesやKitchen Fund、そしてGrit Venturesらとともに投資に参加した。これでAgotの総調達額は1600万ドル(約18億5000万円)に達した。

Agotは新たな資金を、技術チームの拡大と、その他のファストフードブランドとのパイロット事業、およびプロダクトの機能拡張に充てたいとしている。また、機能拡張により、デリバリーだけでなく、ドライブスルーや店内での顧客体験も改善していきたい。

同社は、小規模な概念実証レベルの展開で、オペレーションの能力を示してきたため、今後はより大きな市場とオーディエンスにその技術をスケールしたいという。

Agotは成長率などを明かさないが、同社のチーフビジネスオフィサーのMike Regan(マイク・リーガン)氏によると、彼がデサントラ氏と出会ったとき、彼自身は投資家だったが、オーダーの正確さチェックが今後大きなビジネスになることをすぐに理解し、またAgotがそれに対して総合的な視野で臨んでいることを知った。「それはまさにデジタルトランスフォーメーションそのものだった」とリーガン氏は言っている。

Toastのようなレストラン管理のパイオニアや、その他のスタートアップも、2年前ほど前からこのニーズに対応するようになり、それぞれ独自のアプローチを採っているだけでなく、ベンチャー資本も獲得している。

たとえば最近の数カ月ではLunchboxDeliverectOrdaZakSunday、そしてMargin Edgeなどが新たなラウンドを発表し、レストランを新しいオーダー方式に適応させていくことに向けて大金が流れ始めたことを示唆している。

リーガン氏によると、レストラン業界の現状は「厳しい」けれども、Agotは「社歴3年のスタートアップよりもずっと先を行っている」やめ、事業の成功という点でも、また今後の2年間で大多数のファストフード企業を顧客にしていける能力でも傑出しているという。

そしてデサントラ氏は「新たな資本がAgotを次のレベルのビジネスに押し上げる」と感じている。

「初期のパイロットでは成功を証明したし、現在および将来のパートナーを相手にスケールしていけることにもエキサイトしています。新たな資金はプロダクトの機能拡張と、顧客とそのオペレーションの分析、そしてドライブスルー向けの技術開発に充てたい」とデサントラ氏はいう。

原文へ

(文:Christine Hall、翻訳:Hiroshi Iwatani)

AIを活用した製薬会社向け商業インサイトプラットフォームのODAIAが約16億円を調達

トロントに拠点を置く、AIを活用した製薬会社向け商業インサイトプラットフォームのODAIA(オダイア)は、Flint Capital(フリント・キャピタル)が主導するシリーズA資金調達で1380万ドル(約16億円)を調達した。このプラットフォームは、データ分析、プロセスマイニング、AIを組み合わせ、製薬およびライフサイエンスの商業チームに予測分析を提供するものだ。この資金調達ラウンドは、同社が過去1年間でチームの規模を倍増させたことを受けて行われた。

このスタートアップは、製薬会社のコマーシャルチームが彼らの処方者について何を知る必要があるか判断するのを手助けし、最適なチャネルを通じて正しいメッセージを伝え、最終的には、治療薬を必要とする患者に届けることができるようにすることを目的としている。同社は、プロセスマイニング、カスタマージャーニーマッピング、AIの分野における長年の研究開発の後、2018年にトロント大学で設立された。

「初期の研究作業のいくつかは、ペイシェントジャーニーを分析し、AIと機械学習を使ってそれらのジャーニーを最適化することを中心としていました」とODAIA共同創設者兼CEOのPhilip Poulidis(フィリップ・プーリディス)氏は、電子メールでTechCrunchに語った。「それは、処方者の取引、匿名化された患者の医療請求データ、人口統計学的および社会経済学的データ、匿名化されたラボデータなど、多くの異なるが関連するデータソースの分析を含むために、時間をかけて進化しました。MAPTUALは、上記のデータセットを分析し、予測的洞察を提供するSaaSプラットフォームで、標的治療薬の理想的な候補となる患者を治療している医師の優先順位付けと動的なセグメント化を行うもので、こうした研究・技術開発の積み重ねが、MAPTUALの誕生につながったのです」と述べる。

米国時間2月10日に発表された資金調達ラウンドには、Innospark Ventures(イノスパーク・ベンチャーズ)、Alumni Ventures(アルミナイ・ベンチャーズ)、Graphite Ventures(グラファイト・ベンチャーズ)の他、BDC Capital(BDCキャピタル)、MaRS IAF(マーズIAF)、StandUp Ventures(スタンドアップ・ベンチャーズ)、Panache Ventures(パナッシュ・ベンチャーズ)などODAIAの現在の投資家が参加している。同社によると、新たな資金調達は、プラットフォームの機能強化や、市場拡大をサポートするための営業、マーケティング、カスタマーサクセスチームの拡充に充てられるという。

画像クレジット:ODAIA

プーリディス氏は「今回の資金調達により、製品およびソフトウェアエンジニアリングチームの拡大、商業チームの拡大、プラットフォーム統合パートナーシップの拡大により、製品ロードマップの開発を加速させます」と述べている。

同社は、パンデミックによって顧客向け医薬品ビジネスが変化し、現在はDXが主な優先事項であると述べている。将来についてプーリディス氏は、同スタートアップの目標は、ライフサイエンスデータの多変量データ解析と予測的洞察を1つのプラットフォームで提供することであると述べている。このプラットフォームには、ライフサイエンス企業が処方者とペイシェント・ジャーニーをよりよく理解し、データとAIを活用してリアルタイムに対応できるような機能と能力が含まれると概説した。

同社のシリーズAラウンドは、2019年に発表された160万ドル(約1億8600万円)のシード投資に続くものだ。このラウンドは、Panache VenturesとStandUp Venturesが共同主導し、BDC CapitalのWomen in Technology Venture Fund(ウーマン・イン・テクノロジー・ベンチャー・ファンド)、Inovia Capital(イノヴィア・キャピタル)、MaRS IAFが参加した。この投資家グループは、Toronto Innovation Acceleration Partners(トロント・イノベーション・アクセレーション・パートナー)、トロント大学のUTEST(ユーテスト)、N49P、Ontario Centres of Excellence(オンタリオ・センター・オブ・エクセレンス、OCE)、Autonomic.ai(オートノミック・ドット・エーアイ、Fordが買収)の共同創業者であるAmar Varma(アマール・ヴァルマ)氏などのプレシード投資家に参加した。

画像クレジット:ODAIA

原文へ

(文:Aisha Malik、翻訳:Akihito Mizukoshi)

AIを使ってオンライン上の有害なやりとりを検出するSpectrum Labsが約37億円調達

パンデミックから2年経った今も、多くの人にとってはオンライン上での会話が日々の主要な交流手段となっている。そのためオンライン上で交わされる会話の数は計り知れない量となっているが、ご存じの通りそれらすべてがクリーンでポジティブなものではない。米国現地時間1月24日、プラットフォームプロバイダーに人工知能技術を提供し、有害なやり取りをリアルタイム(20ミリ秒以下)で検出してシャットダウンするというSpectrum Labs(スペクトラム・ラブス)と呼ばれるスタートアップが3200万ドル(約37億円)の資金を調達したと発表した。この資金は、成長中の消費者向けビジネスをさらに強化するための技術に投入される他、社内および顧客との会話のための企業向けサービスを提供するという新たな分野への進出に向けて使用され、会話中の有害性を検知するだけでなく、監査トレイルを提供することでより高い信頼性と安全性を届ける計画である。

「思いやりを重んじる言語界のリーダーになることを目指しています」とCEOのJustin Davis(ジャスティン・デイビス)氏はインタビュー中で話している。

今回のラウンドはIntel Capital(インテルキャピタル)がリードし、Munich Re Ventures(ミューニック・リー・ベンチャーズ)、Gaingels(ガインゲル)、OurCrowd(アワクラウド)、Harris Barton(ハリス・バートン)の他、前回からの支援者であるWing Venture Capital(ウィング・ベンチャー・キャピタル)、Greycroft(グレークロフト)、Ridge Ventures(リッジ・ベンチャーズ)、Super{set}(スーパーセット)、Global Founders Capital(グローバル・ファンダーズ・キャピタル)も参加している。Greycroftは2020年9月にSpectrumの前回ラウンドの1000万ドル(約11億5400万円)を主導しており、Spectrumはこれで現在合計4600万ドル(約53億円)を調達したことになる。

関連記事:有害コンテンツと戦うAIプラットフォーム開発のSpectrum Labsが1000億円超を調達

CTOのJosh Newman(ジョシュ・ニューマン)氏と共同で同社を設立したデイビス氏によると、Spectrum Labsは評価額を公開していないというが、同社の事業規模がその様子を物語っている。

現在Spectrum Labsは、ソーシャルネットワーキング企業のPinterest(ピンタレスト)やThe Meet Group(ザ・ミート・グループ)、出会い系サイトのGrindr(グリンダー)、Jimmy Wales(ジミー・ウェールズ)氏が運営するエンターテインメントWikiのFandom(ファンダム)、Riot Games(ライアットゲームズ)、eラーニングプラットフォームのUdemy(ユーデミー)など20以上の大手プラットフォームと提携しており、これらのプラットフォームでは、何百万人もの顧客が毎日オープンなチャットルームやよりプライベートな会話の中で、何十億ものメッセージを送り合っている。

同社のテクノロジーは自然言語に基づいており、テキストベースの会話と音声の会話の両方をリアルタイムで検出するというものだ。

Spectrumでは音声がテキストに書き起こされるのではなく、音声として「読まれる」のだとデイビス氏は説明する。これによりSpectrumの顧客は有害なやり取りへの対応を大幅に早めることができ、デイビス氏が「ワイルドウェスト特有の言語」と呼ぶ有害な言葉を妨げることが可能になる。Spectrumの技術を使用していない一般的な企業の対応では、ユーザーが問題のあるコンテンツを通報した後、書き起こされた音声の中からその音声を見つけなければならなず、対応にかなりの時間を要してしまう。

ポッドキャスティングだけでなく、Clubhouse(クラブハウス)やTwitter(ツイッター)のSpaces(スペース)のような音声ベースのサービスが人気を博していることから、このテクノロジーはよりいっそう重要なものとなるだろう。

テキストであれオーディオであれ、Spectrumはこれらのやり取りをスキャンし、40以上の行動プロファイルにまたがるあらゆる有害コンテンツを検出するのである。この技術は世界中の研究者や学者と相談しながら構築されたもので、増え続けるウェブ上のデータを取り込みながらさらに改良が重ねられている。プロファイルにはハラスメント、ヘイトスピーチ、暴力的過激主義、詐欺、グルーミング、違法な勧誘、ドキシングなどが含まれており、また現在約40の言語でのスキャンに対応しているという。言語の制限はなく、どんな言語でも機能するとデイビス氏は話している。

「技術的にはどんな言語でも数週間で対応することができます」と同氏。

オンライン上で最も有害性の高い領域はやはり消費者分野である。オープンフォーラムやよりプライベートな空間でのいじめやヘイトスピーチ、その他の違法行為が日々繰り広げられている。Spectrum Labsでは、これまで以上に複雑になった悪質な行為者の手法を検出するための技術への投資をこれからも継続していく予定だ。同社ではプラットフォームの信頼性・安全性チーム向けの管理機能やツールに加えて、ユーザー自身が晒されても良いもの、絶対に晒されたくないものを決定できるようにする方法を改善するため注力していく予定だという。しかしこれはとても微妙な領域である。プラットフォームは一般的に、言論の自由に配慮してユーザー同士の会話に干渉しないことを望んできたため、それが原因で有害性が暴走したとも言えるのだが、プラットフォームの善意が検閲していると見なされ非難される可能性もあるため、この議論は現在も未解決である。

「ポリシーの実施と、ユーザーが望んで受け入れられるかどうかという問題の間には、緊張関係が存在します」とデイビス氏は説明する。プラットフォームの仕事は「最悪の事態を回避しつつ、消費者が見たいものを選択できるようなコントロールを提供することである」と同社は考えている。

また同社は企業向けサービスへの進出も計画している。

企業向けサービスとは興味深い。企業内の人々が互いに会話する方法(Spectrum Labsがすでに提供している消費者向けサービスと同様の形態をとるのだろう)だけでなく、営業、カスタマーサービス、マーケティングなどのエリアで企業が外部の世界とどのように接しているかを見ることができ、そしてSpectrum Labsが収集した情報を分析に活用して、これらの分野でのその後の運営方法を検討することができるのである。

ただし、これは何も新しいサービスではない。例えばSpectrumの競合他社には会話モニタリング分野のスタートアップであるAware(アウェア)がいる。同社は企業向けに特化したサービスである(L1ghtは消費者分野での競合だ)。

まだ他にもある。前回、Spectrum Labsについて書いた際、創業者と創業チームがSalesforce(セールスフォース)に買収されたマーケティングテクノロジー企業Krux(クラックス)の出身であることを指摘した(Spectrum Labsを設立する前に働いていた)。SalesforceはCRMに限らず、企業がより効率的にビジネスを行うための幅広いツールセットを構築しており、また、かつて別のソーシャルネットワークを設立し、FacebookのCTOを務めたこともあるBret Taylor(ブレット・テイラー)氏が現在トップに立っていることもあり、今後Salesforceがこの分野にもっと関心を持って取り組んでもまったく不思議ではない。コミュニケーションフォーラムがどのように利用され、悪用されるかについて詳しい情報を得ることができるのである。

消費者と企業の両方の課題に対処するために、今回のラウンドではIntelが戦略的投資家として参加することになったとデイビス氏は話している。Spectrum Labの技術をIntelのチップ設計とより密接に連携させることで動作速度をさらに向上させる計画で、またIntelにとって、これは信頼性と安全性の問題を重視する同社のハードウェア顧客に対するユニークなセールスポイントにもなる。

「Spectrum Labsの自然言語理解技術は、信頼性の課題に取り組む世界中の企業を強化する、コアプラットフォームとなる可能性を秘めていると確信しています」とIntel Capitalの副社長兼シニアMDであるMark Rostick(マーク・ロスティック)氏は声明の中で伝えている。「デジタルトラストと道徳的な運用が、組織の差別化を図るための重要な要素として考えられている今、トラスト&セーフティー技術を企業運営に構築するということに、大きなチャンスがあると考えています」。

画像クレジット:David Woodfall / Getty Images

原文へ

(文:Ingrid Lunden、翻訳:Dragonfly)

Scale AIが人工知能関連で最もホットで新しい合成データゲームに参入

Scale AI(スケールAI)が73億ドル(約8400億円)企業になるまでの道には、画像、テキスト、音声、動画などのリアルデータが敷き詰められていた。現在、その基盤を利用し、AIで最もホットで新しいカテゴリーの1つであるシンセティック(合成)データゲームに参入する。

同社は米国時間2月2日に、機械学習エンジニアが既存の実世界のデータセットを強化するために使える製品「Scale Synthetic」の早期アクセスプログラムを発表した。同社は、この新しい部門を立ち上げるために2人の幹部を採用した。Nines(ナインズ)で機械学習の責任者を務め、Apple(アップル)で3Dマッピングのコンピュータビジョンエンジニアを務めたJoel Kronander(ジョエル・クロナンダー)氏をシンセティックデータ部門の新責任者として、また、Vivek Raju Muppalla(ビベク・ラジュ・ムッパラ)氏をシンセティックサービス部門のディレクターとして採用した。ムッパラ氏は、Unity Technologies(ユニティ・テクノロジーズ)でAIとシミュレーションのエンジニアリングディレクターを務めた人物だ。

シンセティックデータとは、その名の通り、現実世界の情報を使わず、機械学習アルゴリズムによって作成された偽のデータのことだ。医療用画像など、プライバシーが重視されるデータを作成する際に、強力で便利なツールになり得る。開発者はシンセティックデータを使って学習モデルをより複雑にし、収集された実世界のデータセットに散見されるバイアスを取り除くことができる。

Scaleは当初、人がラベル付けした実際の画像、テキスト、音声、動画データとソフトウェアを組み合わせ、自動運転車メーカーに機械学習モデルの学習に必要なラベル付きデータを提供していた。機械学習モデルは、ロボタクシー、自動運転トラック、倉庫やオンデマンド配送に使われる自動ボットの開発と配備に使われる。その後、このスタートアップは、政府、金融、eコマース、自動運転車とエンタープライズ産業などを顧客とするデータ管理プラットフォーム企業へと変貌を遂げた。

創業者でCEOのAlexandr Wang(アレクサンドル・ワン)氏は、この新しいサービスをデータへのハイブリッドアプローチだと表現し、実験室で育てられた肉にたとえた。

「研究室で育てられた肉が本物の動物の細胞から始まるように、私たちは本物のデータから始まり、そこから製品を育て、開発・構築していきます」と同氏はTechCrunchに語った。実世界のデータをベースにしてシンセティックデータを作成することで、実にユニークで強力なサービスを顧客に提供することができると同氏は述べ、同社は市場にそうしたギャップがあると見ていると付け加えた。

Scaleの顧客も、そのギャップを感じていたようだ。同社がシンセティックデータに力を入れたのは、顧客からの需要に応えるためだったとワン氏はTechCrunchに語った。この製品の開発を始めてから、まだ1年経たないという。自動運転車技術開発企業のKodiak Robotics、Tractable AI、米国防総省はいずれも、Scaleの新しいシンセティックデータ製品を採用していると同氏は述べた。

現在、約450人の従業員を抱えるScaleは、シンセティックデータを2022年の最優先事項として捉えており、製品ラインを充実させるために投資を続ける分野だとしている。しかし、それはリアルデータ事業を引き継ぐことを意味するものではない。ワン氏はシンセティックデータを、開発者が「アルゴリズムなどのAIや、特にエッジケースでより多くの利益を得られるようにするための補完的なツール」と考えている。

例えば、自動運転車の会社は通常、シミュレーションを使って現実世界のシナリオを再現し、その環境で自動運転システムがどのように対処するかを確認する。現実世界のデータでは、彼らが求めているシナリオは得られないかもしれない。

「例えば、100台の自転車が一度に横断するようなシナリオは、現実世界ではあまり遭遇しません」とワン氏は説明する。「現実世界のデータから出発して、すべての自転車や人を合成的に追加することで、アルゴリズムを適切に訓練することができるのです」。

画像クレジット:Getty Images

原文へ

(文:Kirsten Korosec、翻訳:Nariko Mizoguchi

AIでマウスのグルーミング(毛づくろい)を高精度で検出、動物の心と体の変化の把握が人の中枢性疾患の治療に貢献

AIでマウスのグルーミング(毛づくろい)を高精度で検出、動物の心と体の変化の把握が人の中枢性疾患の治療に貢献

東京大学は2月2日、マウスの動画からAIを用いてグルーミング(毛づくろい)行動を検出する方法を開発したと発表した。グルーミングは動物の心と体の状態を理解するうえでの重要な指標であるため、低コスト、長時間の自動判定が可能になれば、動物実験の効率が大幅に向上するという。

東京大学大学院農学生命科学研究科の坂本直観学部生らによる研究グループは、ケージの上部に設置したカメラで撮影したマウスの動画から、その行動を「グルーミングなし」「顔のグルーミング」「体のグルーミング」に分類してラベル付けを行った。そしてこれを脳の神経回路を模した数理モデルである折り畳みニューラルネットワークに学習させた。そして、折り畳みニューラルネットワークが間違えた画像パターンを解析し改善を試みたところ、かなりの高確率での識別が可能となった。また、グルーミング回数の評価では、人の観測と畳み込みニューラルネットワークの予測は同等だった。

健康な動物に比べて不健康な動物の毛並みが悪いのは、健康状態によってグルーミングの頻度や長さが変わるためだという。動物の心身の状態を詳しく観察することが動物実験では大切なのだが、そこでグルーミングが重要な指標となる。だが、目視による観察は研究者の負担が大きく、また観察者や環境によって判断が変わるといった客観性に欠ける部分もある。そこでこの方法が開発された。

現在、その治療法が強く求められている自閉症、認知症、統合失調症といった中枢性疾患には「ヒトの疾患の病態を適切に反映できる動物モデル」が必要なのだが、それが不足しているために治療法の開発が進んでいないと研究グループは言う。しかし今回確立された技術を用いて「動物の心の機微と体の変化を捉えることが可能となれば、ヒトの中枢性疾患の病態解明や治療方法の開発にも大いに役立つことが期待される」とのことだ。

DeepMindのAI「AlphaCode」は競技プログラミングレベルのコードを書ける

DeepMind(ディープマインド)は、任意の問題を解決するためにコードを書くことができるAIを開発した。このAIはコーディングチャレンジに参加し、中間あたりの成績を収めたことで実証されている。まだソフトウェアエンジニアの仕事を奪うまでには至っていないが、基本的な作業の自動化に役立つ可能性がある。

Alphabet(アルファベット)の子会社であるDeepMindのチームは、できる限り多くの形で知能を創造することを目指しており、最近ではもちろん、多くの優秀な頭脳が取り組んでいる作業としてコーディングが挙げられる。コードは、言語、論理、問題解決の融合であり、コンピュータの能力に自然に適合すると同時に、難題でもある。

もちろん、このような試みは初めてではない。OpenAIには独自の自然言語コーディングプロジェクト「Codex」があり、GitHub Copilotと、Microsoftが提供する、GPT-3にコードを完成させるテストの両方を支えている。

関連記事:OpenAIが自然言語AIコーダーのCodexをアップグレード、プライベートベータを開始

DeepMindの論文では、競技プログラミングを狙う理由を説明する中で、フレンドリーながらも競争相手を遠回しに侮辱している。

近年の大規模な言語モデルは、コード生成能力に優れており、簡単なプログラミングタスクをこなすことができるようになってきた。しかし、これらのモデルは、単に命令をコードに変換するだけでなく、問題解決能力を必要とする、より複雑で見たことがない問題で評価すると、いまだに性能が低い。

それについてOpenAIは言いたいことがあるかもしれないが(そして、同社の次の論文ではこの点についての反論が期待できるだろう)、研究者たちが指摘するように、競技プログラミングの問題は一般的に、既存のコードAIには見られないレベルの解釈と創意工夫の組み合わせを必要とする。

DeepMindは、この分野に挑戦するために、GitHubの厳選されたライブラリと、コーディング問題とその解決策のコレクションを使って、新しいモデルをトレーニングした。言葉にすると簡単に聞こえるが、些細なことではない。完成したモデルを、この種のコンテストを主催するCodeforcesが最近開催した(言うまでもなく、AIはそれ以前に見ていない)10のコンテストに投入した。

その結果、50パーセンタイルを少し超える中位の成績を収めた。人間であれば中途半端な成績かもしれないが(決して簡単ではない)、機械学習(ML)モデルの最初の試みとしては、かなり注目に値する。

CodeforcesのMike Mirzayanov(マイク・ミルザヤノフ)CEOはこう述べている。「AlphaCodeの成績は、私の期待を超えていたと断言できます。なぜなら、競技プログラミングでは単純な問題であっても、アルゴリズムを実装するだけでなく、それを発明することも求められることが多いので(これが一番難しい)、半信半疑でした。AlphaCodeは、新人の有望なコンペティターと同レベルの性能を発揮してのけました」。

AlphaCodeが解決した課題とそのソリューションの一例は以下の通り。

画像クレジット:DeepMind

(DeepMindへのメモ:SVGはこのような図には厄介なフォーマットだ。)

ご覧のとおり、これは賢いソリューションだが、エンタープライズ向けSaaS級のものではない。心配無用、それはもっと先の話だ。今は、このモデルが複雑に書かれた課題を一度に解析して理解し、ほとんどの場合、首尾一貫した実行可能な回答を生み出すことができると示すだけで十分だ。

DeepMindチームはこう書いている。「コード生成に関する私たちの探求には改善の余地が大きく残されており、将来はプログラマーの生産性を向上させ、現在コードを書いていない人々にもこの分野を開くことができるような、よりエキサイティングなアイデアを示唆しています」。最後の部分は、筆者に当てはまる。もしAlphaCodeがCSSでレスポンシブレイアウトを変更できるなら、私よりもよほど優れている。

こちらのデモサイトでは、AlphaCodeがどのように構築されたのか、また、さまざまな問題に対するAlphaCodeの解決策をより詳しく見ることができる。

画像クレジット:Krisztian Bocsi/Bloomberg / Getty Images

[原文へ]

(文:Devin Coldewey、翻訳:Aya Nakazato)

LeapMind、エッジデバイス上でのリアルタイム動作と高画質を両立させた高精細AI画像処理モデル発表

LeapMind、エッジデバイス上でのリアルタイム動作と高画質を両立させた高精細AI画像処理モデル発表

ハードウェアとソフトウェアの両面で機械学習技術の開発を行うLeapMind(リープマインド)は1月31日、エッジデバイス上でリアルタイムで動作し、ノイズ除去によりスマートフォンレベルの高画質を実現したAI画像処理モデルを発表した。これまでエッジデバイスで挙げられてきた性能面と画質面の課題を同時に解決し、高性能・高画質・軽量化を実現するものとなった。

エッジデバイスでは、計算コストの高いAIによる画像処理は、リアルタイム動作が困難であるとされてきた。またAI画像処理においては、アナログ信号をデジタル化する際の精度を示す量子ビット数を小さくすると画質が低下するとされてきた。しかしLeapMindは、同社独自の「極小量子化」技術と、超低消費電力AI推論アクセラレータIP「Efficiera」(エフィシエラ)を組み合わせることで、動画カメラのリアルタイム動作を可能にし、「Pixel embedding」(ピクセル・エンベッディング)技術で高画質化を実現させた。

これにより、高価な高感度センサーや大型レンズを使わずとも、32bit浮動小数点モデルと同等の画質が得られるようになった。監視カメラや検査用カメラなど産業用カメラを高画質化できるため、物体認識や検査の精度が向上する。LeapMind取締役CTOの徳永拓之氏は、「低ビット量子化モデルによるAI画像処理技術の製品化は我々が調べる限りでは世界初です」と話す。

LeapMindはこのモデルの特徴を、Raw-to-rawによるノイズの低減と既存画像処理パイプラインへの影響の最小化、ディープラーニングベースのノイズ低減処理、センサー固有のノイズ再学習で最適化が行える学習済みモデルの提供、リアルタイム動作可能な軽量処理としている。

入力画像。左:ISO51200、1/800sec, F4.0で撮影。右:ISO102400、1/320sec、F8.0で撮影

入力画像。左:ISO51200、1/800sec, F4.0で撮影。右:ISO102400、1/320sec、F8.0で撮影

出力画像:32bit浮動小数点モデルの出力

出力画像:32bit浮動小数点モデルの出力

出力画像:LeapMindの極小量子化モデルの出力

出力画像:LeapMindの極小量子化モデルの出力

 

分析や開発にも使えるリアルさを持つ合成データをAIで作り出すMOSTLY AIが約28.6億円調達

オーストリアの合成データデータスタートアップであるMOSTLY AI(モーストリー・エーアイ)は米国時間1月11日、シリーズBラウンドで2500万ドル(約28億6000万円)を調達したことを発表した。英国のVCファームMolten Ventures(モルテン・ベンチャーズ)がこのオペレーションを主導し、新たな投資家であるCiti Ventures(シティ・ベンチャーズ)が参加した。既存の投資家には、ミュンヘンの42CAP(42キャップ)と、MOSTLY AIの2020年の500万ドル(約5億2700万円)のシリーズAラウンドを主導したベルリンのEarlybird(アーリーバード)が名を連ねている。

合成データ(シンセティックデータ)はフェイクデータであるが、ランダムではない。MOSTLY AIは人工知能を利用して、顧客のデータベースに対する高い忠実度を達成する。同社によると、そのデータセットは「企業の元の顧客データと同じくらいリアルに見え、そこには多くの詳細情報が含まれているが、元の個人データポイントは存在しない」という。

MOSTLY AIのCEOであるTobias Hann(トビアス・ハン)氏はTechCrunchに対して、調達した資金について、プロダクトの限界の拡張、チームの成長、そして欧州と米国での顧客獲得に活用する計画であると語った。米国ではすでにニューヨーク市にオフィスを構えている。

MOSTLY AIは2017年にウィーンで設立され、その1年後にEU全域で一般データ保護規則(GDPR)が施行された。プライバシー保護ソリューションに対するこうした需要と、それに付随する機械学習の台頭は、合成データに向けて大きな勢いを生み出している。Gartner(ガートナー)の予測では、2024年までに、AIおよびアナリティクスプロジェクトの開発に使用されるデータの60%が合成的に生成されるようになるという。

MOSTLY AIの主な顧客は、Fortune 100(フォーチュン100)に名を連ねる銀行や保険会社、通信事業者などである。これら3つの高度に規制されたセクターは、ヘルスケアと並んで、シンセティック表形式データに対する需要の大部分を牽引している。

競合他社とは異なり、MOSTLY AIはこれまでヘルスケアに主力を置いていなかったが、それも変わる可能性がある。「ヘルスケアは確かに私たちが注視しているものです。実際、2022年はいくつかのパイロットプロジェクトの開始を予定しています」とCEOは話す。

AIの民主化は、合成データがいずれはFortune 100企業の枠を超えて使われるようになることを意味する、とハン氏はTechCrunchに語っている。したがって、同氏の会社は今後、より小規模な組織や、さらに幅広いセクターに向けてサービスを提供する計画である。だがこれまでの取り組みにおいて、MOSTLY AIがエンタープライズレベルのクライアントに注力することは理にかなうものであった。

現在のところ、合成データを扱うための予算、ニーズ、高度な技術を有しているのはエンタープライズ企業であるとハン氏は語る。その期待に適合するために、MOSTLY AIはISO認証を取得した。

ハン氏と話をする中で、明確になったことが1つある。同スタートアップは確かな技術的基盤を備える一方で、その技術の商業化と、自社がクライアントに提供し得る付加的なビジネス価値にも等しく労力を注ぎ込んでいる。「MOSTLY AIは、顧客デプロイメントと専門知識の両面で、この新興の急成長領域をリードしています」とMolten Venturesの投資ディレクターであるChristoph Hornung(クリストフ・ホルヌング)氏は述べている。

GDPRやCCPA(カリフォルニア州消費者プライバシー法)などのプライバシー法を遵守する必要性は、明らかに合成データに対する需要を促進するが、それだけが効果を現す要因ではない。例えば、欧州の需要は、より広い文化的コンテクストによっても牽引される。一方、米国では、それはイノベーションの追求からも生じる。そのユースケースとして、アドバンストアナリティクス、予測アルゴリズム、不正検出、プライシングモデルなどが挙げられるが、そこには特定のユーザーに遡ることのできるデータを含まない、という要素が求められる。

「多くの企業がこの領域に積極的にアプローチしているのは、顧客のプライバシー重視を理解しているからです」とハン氏。「これらの企業は、プライバシーを保護する方法でデータの処理と取り扱いを行う場合、競争上の優位性も得られることを認識しています」。

より多くの米国企業が革新的な手法における合成データの採用を求めている様相は、MOSTLY AIが米国でのチームの成長を目指す主要な理由となっている。一方で、同社はウィーン勤務とリモート採用の両方でより一般的な人材開拓も進めている。年末までに人員を35人から65人に増やす計画である。

ハン氏は、2022年は「合成データが軌道に乗る年」であり、その先は「合成データにとって実に堅調な10年」になると予想している。これは、AIの公平性や説明可能性といった重要な概念を中心に、責任あるAIに対する需要が高まっていることに支えられるであろう。合成データはこれらの課題の解決に貢献する。「合成データは、エンタープライズが自らのデータセットを増強し、バイアスを取り除くことを可能にします」とハン氏は語る。

機械学習を別にして、合成データはソフトウェアテストに活用されるポテンシャルが十分にあるとMOSTLY AIは考えている。これらのユースケースのサポートには、データサイエンティストだけではなく、ソフトウェアエンジニアや品質テスターも合成データにアクセスできるようにする必要がある。MOSTLY AIが数カ月前に同社のプラットフォームのバージョン2.0をリリースしたことは、彼らのことを考慮したものである。「MOSTLY AI 2.0はオンプレミスでもプライベートクラウドでも実装でき、それを使用する企業のさまざまなデータ構造に適応できる」と同社は当時記している

「当社は明らかにB2Bソフトウェアインフラ企業です」とハン氏は語る。シリーズAとBの両ラウンドで、同社はそのアプローチを理解する投資家を探し求めた。

筆者の質問に対してハン氏は、Molten Venturesは上場しているVCであり、通常の資金調達サイクルに縛られないこともかなりの重みがあることを認めている。「パートナーからこのような長期的なコミットメントを得られることは、私たちにとって非常に魅力的でした」。

Citi VenturesはCitigroup(シティグループ)のベンチャー部門であり、米国に本部を置いている。「当社は米国内のチームを大幅に拡大しており、米国内のネットワークや関係を支援可能な米国拠点の投資家を持つことは、あらゆる側面で大きな意義があります」とハン氏は語っている。

新たに2500万ドルの資金を調達し、米国でのプレゼンスを強化することで、MOSTLY AIは今後、合成データ領域の自社のセグメントで他の企業と競争するためのより多くのリソースを手にすることになる。そうした企業には、2021年9月にシリーズBで3500万ドル(約40億1000万円)を調達したTonic.ai(トニック・エーアイ)、同年10月にシリーズBで5000万ドル(約57億3000万円)を集めたGretel AI(グレテル・エーアイ)、シードラウンドを行った英国のスタートアップHazy(ヘイジー)の他、特定の垂直市場に特化したプレイヤーたちが含まれている。

「私たちはこの領域、そして市場全般でますます多くのプレイヤーが出現しているのを目にしており、そこに多くの関心があることが確実に示されています」とハン氏は語った。

画像クレジット:yucelyilmaz / Getty Images

原文へ

(文:Anna Heim、翻訳:Dragonfly)

AIでホームケア製品、食品・飲料、化粧品といった消費財の研究開発を支援するTuring Labsが約18.8億円調達

デスクワークの従業員にとってリモートワークはいまやニューノーマルとなり、これまでに多くのテック企業がこの変化に対応した事業を急ピッチで拡大させてきた。しかしご紹介するTuring Labs(チューリング・ラボ)というスタートアップは、同様の課題に対応しているものの、デスクワークではなく研究所で働く人々のために取り組むという異質なものである。同社は成長にともない、今回1650万ドル(約18億8000万円)の資金調達を達成した。

今回のシリーズAラウンドはInsight Partners(インサイト・パートナーズ)が主導し、これまでの支援者であるMoment Ventures(モーメント・ベンチャーズ)、Y Combinator(Turing Labsは2020年のコホートに参加)、そして新たな個人投資家であるMedialia(メディアリア)のCEO兼共同設立者のBorge Hald(ボルヘイ・ハルド)氏も参加している。今回の調達資金は研究開発の加速、エンジニアリングチームの拡大、事業の拡大、さらなる市場開拓を図るために活用される予定だ。

Turing Labsのプラットフォームは、研究所が新製品を作るプロセスを高速化するのを支援するというものである。消費財メーカーと協力し、ホームケア製品、食品・飲料、化粧品などのための新製法を考案するために、同社の技術が活用されている。AIを用いて新製品のためのさまざまな成分の組み合わせをシミュレーションし、実際の技術者が組み立てるより小さなサブセットを決定するのだが、今回の投資は採用や事業開発の他、同社独自の研究開発の継続のため活用される予定だという(プラットフォームにより多くの機能を追加することで、例えばパッケージや加工食品の代替材料などにも拡張していく予定)。

Turing LabsをAjith Govind(アジト・ゴビンド)氏と共同で設立したCEOのManmit Shrimali(マンミット・シュリマーリ)氏は「当初は製法に重点を置いていましたが、現在は成分やパッケージなどデジタルでシミュレーションや最適化が可能なものであれば何でも対象としています」とインタビューの中で話しており、また研究開発のあり方の変化にもチャンスが潜んでいると伝えている。「以前はプロセスの90%が手作業でしたが、現在は90%がデジタル化されています」。

また、新たなカテゴリーに進出する機会も増えているとシュリマーリ氏は話している。例えば、肉や乳製品に代わる植物由来の食品が増えていることから、まったく新しい食品をAIを活用して開発するという道が開かれているのである。

Turing Labsはすでに誰もがよく知る世界最大級の消費財メーカー数社と提携しているが、その企業名は公表されていない。今後はこのリストを拡大するとともに、すでにTuringを利用している企業との連携も進めていく予定だという。

以前Turingを紹介したときにも述べたのだが、CPG(消費者向け包装品)の世界において研究開発室は非常に重要な役割を果たしている。

製品が最終的に生産に移されるまでに、研究室では製品が開発され、テストされ、顧客、マーケティング、予算および製造部門などからの意見を受けて調整されて、その後またテストや調整が行われ、という具合に気の遠くなるような過程がある。同社が提携している大手クライアントの1社では、テストだけで4億ドル(約455億円)近くを費やしているという。

新型コロナウイルスが出現する以前から研究開発部門は大きなプレッシャーにさらされていた。予算が削減される一方で、責任を負わなければならない要求や変数の数は増えるばかりである。研究開発部門は、消費者に興味を持ってもらえるような新製品(または多くの場合、製品の増強)をスケジュール通りに生産することが求められている。膨大な量の意味不明な成分を含んだ商品については、環境や健康に関する新たな懸念から、大衆向け商品の成分をいかに簡素化し、改善するかを考えなければならなくなった。また、小規模な消費者直販ブランドが消費者の新たなテイストに合った競争力のある製品をいち早く市場に投入し、大手の競合他社を打ち負かしているのも事実である。製法の組み合わせを検討するというのは、他のすべての変数を含めて時間とコストのかかるプロセスなのである。

パンデミックがこの問題をさらに複雑にし、企業は研究所などの物理的環境で過ごす時間を減らすための方法を考えなければならなくなった。

こうしたさまざまな課題をAIで解決しようというのがTuring Labのアプローチである。複雑な計算を機械が代わりに行い、人間のチームが行うよりも速く処理するというようなよくあるアプローチとは異なり、同社はそのコンセプトを製品の製造や改良面に適用してステップを削減することにより、技術者が行うべきことを最小限にしようとしているのだ。理論的には、これによって人間が新しいイノベーションに集中することができるようになるのだが、他のAIイノベーションと同様、Turing Labsのプラットフォームが最終的にどの程度賢くなり、技術者を全プロセスから完全に切り離すことができるようになるか否かはまだ誰も知る由もない。

Insight PartnersのマネージングディレクターであるJosh Fredberg(ジョシュ・フレッドバーグ)氏は「原材料の内容を含む消費者の嗜好が急速に変化していることに加え、競争力のある独立系ブランドが多く出現していることから、CPG企業は新製品をより早く開発し、既存のポートフォリオを進化させる必要に迫られています」と声明中で伝えている。「Turing Labsは開発プロセスを自動化して結果を予測することを可能にし、CPG企業が革新的な製品をより早く市場に投入できるよう支援します。Turing LabsはCPGの組織全体で市場発見と製品開発をシステム化、高速化する能力を持っており、その能力は業界でも傑出しています。Turing Labsのチームが成長を続ける中で、ともに協力していけることを楽しみにしています」。

画像クレジット:Luis Ascui / Getty Images

原文へ

(文:Ingrid Lunden、翻訳:Dragonfly)

アトラシアンが自然言語理解のための独自のAIエンジンを開発するPercept.AIを買収

Atlassian(アトラシアン)は米国時間1月27日、Percept.AI(パーセプトエーアイ)を買収したことを発表した。Percept.AIはY Combinator(ワイ・コンビネーター)の2017年夏のバッチに参加したAI企業で、自然言語理解のための独自のAIエンジンをベースに、自動化されたバーチャルエージェントサポートソリューション(基本的にはチャットボット)を提供する。Atlassianはこのバーチャルエージェント技術を、ITチームが従業員や顧客に対してより良いサービスを提供するためのツールであるJira Service Management(ジラ・サービス・マネジメント)に統合する予定だ。

Crunchbase(クランチベース)によれば、Perceptは今回の買収に先立ちシードラウンドを実施し、Hike Ventures、Builders VC、Cherubic Ventures、Amino Captial、Tribe Capital、Y Combinatorなどから金額非公開の資金を得ていた。両社は、今回の買収の金額的詳細については明らかにしていない。

画像クレジット:Atlassian

AtlassianがJira Service Managementに多大な投資をしていることは間違いない。2020年には、企業のアセット管理を行うMindville(マインドビル)に加えて、Slack(スラック)ファーストのヘルプデスクチケッティングサービスを提供するHalp(ヘルプ)を買収した。また2021年にはAtlassianは、Jira Service Managementを強化するために、ノーコード / ローコードのフォームビルダーであるThinkTilt(シンクティルト)を買収した(これは、近年のJiraエコシステムに関する数多くの買収に続くものだ)。

AtlassianのIT ソリューション製品責任者である Edwin Wong(エドウィン・ウォン)氏は、サービスを拡大するためには買収だけに賭けているわけではないと語った。

「無機質な投資を行うだけではありません。私たちが行ってきたことは有機的に統合されているのです」とウォン氏はいう。「何かを買ってきて接続するだけではなく、もっと考え抜かれた戦略が必要です。何がフィットするかを考え、これまでに作られたものの上に構築して、1つの製品として統一された体験を生み出すのです。ですから『6つの異なるものを用意しました』と差し出して、お客様に『これらをまとめるには何が必要なのだろうか?』と考えていただく必要はありません。私たちが目指しているのは統合された体験を生み出すことなのです」。

画像クレジット:Atlassian

しかし、ITチームは、パンデミックの厳しい影響下でも、これまで以上に優れた顧客サービスを提供しなければならないというプレッシャーにさらされていることは間違いない。いまや企業顧客であっても一般消費者のような体験を求めているからだ。理想的にいけは、Percept.aiのような製品は、サポート質問の大部分を処理しつつユーザーにすばらしい体験を提供し、ITチームがより複雑なタスクに集中できるようにすることができるだろう。

それがJira Service Managementのような製品の目標であり、ウォン氏が述べたように、このサービスは現在、ほぼすべての業界から3万5000以上の顧客を集めている。

ウォン氏は、チームがPerceptに惹かれた理由として、サポートクエリの背後にある多くの文脈を理解できるエンジンの能力を挙げている。エンジンは内容、意図、感情を分析し、ユーザーのプロファイルと組み合わせて、パーソナライズされた応答を提供することができる。バーチャルエージェントが応答の限界に達すると、自動的に人間にインタラクションを移行する。チームは、ノーコードツールを使ってサービスの設定や調整を行うことができるが、これもPerceptがアトラシアンにとって魅力的である機能の1つだ。

今後その技術を、Jira Service Managementの中にネイティブに統合していく予定だ。一方、Atlassianはこのサービスの機能を拡張することも計画している。

「もう少し先を見据えた私たちのより広いビジョンは、あらゆる形態のサポートやサービスデスクのための統一プラットフォームを作ることです。それが私たちの究極の目標なのです」とウォン氏は説明する。「私たちは、そうした拡張が本当にさまざまな種類の製品、さまざまな機能をカバーすると信じています。例えばConfluence(コンフルエンス、JiraのWiki)スペースやそこに書かれた記事の知識を利用して、さまざまな質問に答えることはできないでしょうか?例えばTrello(トレロ、タスク管理)ボードなどの情報を利用することはできないのでしょうか?今回の買収はもちろん、お客様に優れたエクスペリエンスを提供するという、Atlassian全体のより広範な長期的ビジョンの一環なのです」。

今回の買収は短期間で行われたため(ウォン氏によると、両社は2021年末に話を始めたとのこと)、Percept.AIの既存顧客が今後どうなるかはまだわかっていない。

関連記事:AtlassianがHalpを買収、JiraやConfluenceとの統合を進める

画像クレジット:Peter Dazeley/Getty Images

原文へ

(文:Frederic Lardinois、翻訳:sako)

AIが自動で動画内の顔やナンバープレートにぼかし加工し匿名化、プライバシーを保護するビデオツールのPimlocが約8.7億円調達

英国のコンピュータービジョン関連のスタートアップであるPimloc(ピムロク)は、動画の匿名化を迅速に行うAIサービスを販売するために、顔やナンバープレートのぼかしを自動化したり、その他の一連のビジュアル検索サービスを提供したりするなど、事業内容を強化してきた。同社は今回、新たに750万ドル(約8億7000万円)のシード資金を調達したと発表。このラウンドはZetta Venture Partners(ゼッタ・ベンチャー・パートナーズ)が主導し、既存投資家のAmadeus Capital Partners(アマデウス・キャピタル・パートナーズ)とSpeedinvest(スピードインベスト)が参加した。

このスタートアップ企業は、2020年10月にも180万ドル(約2億1000万円)のシード資金を調達しているが、今回の資金は欧州と米国での事業拡大と、データ法制の広がりや生体認証のプライバシーリスクに関する世論の高まりへの対応に使用されるという。後者に関しては、一例として顔認識技術のClearview AI(クリアビューAI)に対するプライバシー面からの反発などを挙げている。

Pimlocは営業、マーケティング、研究開発チームを強化するとともに、動画のプライバシーとコンプライアンスに焦点を当てた製品ロードマップの拡大のために、この資金を投じると述べている。

同社が狙うビジネスニーズは、小売業、倉庫業、工場などの業界で、安全性や効率性を高めるためにビジュアルAIの利用が拡大していることに焦点を当てている。

しかし、AIを活用した職場の監視ツールの増加は、労働者のプライバシーリスクを生み、リモートでの生体認証を導入する企業にとっては、これが法的リスクや風評被害の原因となる可能性がある。

そこでPimlocは、AIがプライバシーのために機能する第三の方法を提案している。それは「生産効率を高めるために使われるビジュアルデータを匿名化し、労働者のプライバシーを優先するために役立てる」というものだ。これについて、企業と協議しているという。

Pimlocによると、同社の「Secure Redact(セキュア・リダクト)」は、SaaSとしてまたはAPIやコンテナを介して販売されており、現地のビデオワークフローやシステムに統合することができる。この製品は、データプライバシー規制(欧州の一般データ保護規則やカリフォルニア州の消費者プライバシー法など)に準拠したビデオ証拠を提供しなければならない団体で、すでに使用されているという。

Pimlocは、顧客数を明らかにしなかったものの、CEOのSimon Randall(サイモン・ランドール)氏はTechCrunchに次のように語った。「欧州と米国を中心に輸送、製造、教育、健康、自動走行車、施設管理、法執行機関など、さまざまな分野で多くのユーザーにご利用いただいています。興味深いのは、そのすべてが同じニーズを持っているということです。つまり、CCTVでも、ダッシュボードでも、装着式カメラの映像でも、いずれもデータプライバシーやコンプライアンスのために映像の匿名化を必要としているのです」。

画像クレジット:Pimloc

原文へ

(文:Natasha Lomas、翻訳:Hirokazu Kusakabe)

動画を利用する本人確認サービスのVeriffがシリーズCラウンドで約115億円を調達

本人確認サービスを提供するVeriff(ベリフ)は、Tiger Global(タイガー・グローバル)とAlkeon(アルケオン)が共同主導する1億ドル(約115億円)のシリーズCラウンドを実施した。既存投資家のIVPとAccel(アクセル)もこれに参加し、Veriffがこれまでに調達した資金総額は2億ドル(約230億円)に達した。今回の資金調達により、同社の企業評価額は15億ドル(約1724億円)となっている。この新たな資金は、従業員の増強、研究開発、販売およびマーケティングに使われる予定だ。

エストニアを拠点とするこのスタートアップ企業の「特別なソース」は、AIによる動画を使って本人確認を行うことだ。これまで、この分野にはOnFido( オンフィド)やJumio(ジュミオ)などの大手スタートアップがサービスを提供してきたが、これらの企業は動画ではなく依然として静止画に依存している。

Veriffは、この動画を用いるアプローチによって、オンライン本人確認を、物理的な対面認証よりも「より正確」にし、より多くの詐欺を防ぐことができると主張している。

同社によると、2021年の確認実績は8倍以上、米国では20倍、金融サービス事業は10倍に成長し、顧客数は150%増加したという。

VeriffのCEO兼創業者であるKaarel Kotkas(カーレル・コトカス)氏は、次のように述べている。「組織や消費者は、2021年にはこれまで以上にオンラインでの本人確認を必要としていました。リモートによる従業員の研修や、メタバースのゲームで安全な空間を構築するため、そして完全にオンラインで行う事業運営においても、デジタルにおける信頼性と透明性の確立は、非常に重要になっています」。

Tiger GlobalのパートナーであるJohn Curtius(ジョン・カーティウス)氏は次のように述べている。「現代のデジタルビジネスと消費者のための信頼性の高い本人確認ソリューションは、過去2年の間に事業運営におけるすべての業務がオンラインに移行したことで、深刻化しています。Veriffは、オンラインで信頼と安全を確保するために、業界をリードする製品を開発してきました。我々の調査と顧客から声によると、Veriffの製品性能は他社を大きく引き離しており、世の中の企業にもっと広く利用されるべきです」。

筆者はコトカス氏にインタビューし、Veriffのプラットフォームの精度を高めるためには、他にどのようなことが行われているのかを訊いてみた。「ユーザーの行動を要素として計算に入れています。3枚の写真だけで本人確認の判断をするのではなく、当社では1000以上の異なるデータポイントを分析しています。これによって、自動化の利点が得られると同時に、本人確認に対する非常に正確な判断ができるようになります」と、同氏は答えた。

また、本人確認の将来性については、金融サービス企業だけでなく、今やオンライン上のほぼすべてのサービスに本人確認が必須となっていることが後押しすると考えていると、同氏は語る。例えば、新型コロナウイルス感染拡大の影響から、今では大学の遠隔試験で本人確認が必要になることもある。

「現在、50億人の人々がオンラインで生活していますが、その全員が本人確認を始めると、年間で500億件の確認作業が発生することになります。私たちは、オンラインにおける信頼性と拡張性を高める必要がある世界に向けて動いているのです」と、コトカス氏は語った。

画像クレジット:Ian Waldie / Staff / Getty Images

原文へ

(文:Mike Butcher、翻訳:Hirokazu Kusakabe)

中国のスマート製造業に注力するAInovationが香港でIPOを申請、李開復氏やソフトバンクも支援

中国では、人工知能に金銭を支払う顧客を見つけようとする情熱が続いている。中国のコンピュータビジョンと機械学習のスタートアップ企業で、Kai-Fu Lee(カイフ・リー、李開復)氏のSinovation Ventures(シノベーション・ベンチャーズ)とSoftBank(ソフトバンク)が出資するAInnovation(エーアイノベーション、創新奇智)は、中国の巨大な製造業を自動化しようとしている。設立からまだ4年しか経っていないこのスタートアップは、香港で株式公開の申請を行っており、その目論見書では、今後数年のうちに中国の産業お青写真で重要な位置を占めるスマートマニュファクチャリングの商業的実行可能性を垣間見ることができる。

2010年代、SenseTime(センスタイム)やMegvii(メグビー)などのコンピュータビジョン企業は、中国の公的なセキュリティのインフラに顔認証技術を提供することで、大成功を収めた。しかし、競争によって価格が下がり、監視技術をめぐる米国の制裁による圧力が強まるにつれ、中国の初期のAIスタートアップ企業は多角化を模索している。SenseTimeは教育分野に進出し、Sinovation Venturesの支援を受けるMegviiは無人倉庫保管ソリューションを事業に加えた。

関連記事:米小売大手が中国企業の防犯カメラを店舗から撤去、人権侵害を指摘される

AInnovationは、AIアプリケーションの分野では若い企業に入る。目論見書によると、IBM、SAP、Microsoft(マイクロソフト)での経験を持つCEOのXu Hui(シュー・フイ)氏が共同で設立したこのスタートアップは、2021年9月までの9カ月間に、収益の半分を製造業の顧客から得ているとのこと。同社のコンピュータビジョンモジュールとカスタマイズされたサービスは、溶融した鉄の輸送(写真)、自動車の生産ラインにおける異常の検出、半導体製造での欠陥発見などの場面で使用されている。

収益の3分の1は金融サービスによるもので、残りは小売業、通信業、その他の産業から得ている。

AInnovationのような企業は、研究室で機械学習モデルを実行する博士号取得者を雇うだけでは不十分だ。文字通り自ら身体を動かし、実際に顧客の工場を訪問して、鉄鋼メーカーや衣料品メーカーにとってどのような自動化が最も良い利益を生むのかを学ぶ必要がある。そこで同社は、主要なパートナーである大手製鉄グループのCISDIおよび国有建設会社のChina Railway No.4(中鉄四局集団有限公司)と、それぞれ2つの合弁会社を設立した。

AInnovationのコンピュータビジョン技術を用いてネジの欠陥を検出する(画像クレジット:AInnovation)

AInnovationはまだ、スマートシティの先行企業ほどの収益を上げていない。2020年の売上は4億6200万元(約83億2000万円)だったが、SenseTimeは同年に34億元(約612億円)を得た。しかし、AInnovationは急速に成長している。2021年9月までの9カ月間で、その収益は5億5300万元(約99億6000万円)に達し、2020年の合計額を上回った。

とはいえ、課題もある。1つは、同社がいくつかの重要な顧客に大きく依存していることだ。2019年と2020年に同社が5つの大口顧客から得た収益は、それぞれ約26%と31%を占めている。

中国の初期のAI参入企業が顔認識に集まったのには理由がある。そのほとんどがソフトウェア事業であるため、儲かるからだ。例えばSenseTimeの利益率は、2018年の約57%から2020年には70%以上に上昇した。

AInnovationも、かつてはソフトウェアファーストの企業だった。目論見書によると、同社の売上総利益率は、2018年には63%だったが、2019年には31%、2020年にはさらに29%まで急落している。これは、同社がソフトウェアの販売を中心としていたビジネスから、より多くのハードウェア部品を含む統合ソリューションに軸足を移したことが原因だ。ハードウェアは一般的に材料費がかさむ。また、収益性が低下したのは、顧客基盤を拡大するために「競争力のある価格で提供」したためだという。AIビジネスでは、データがその燃料となる。

どちらもまだ不採算事業である。AInnovationは、2019年に約1億6000万元(28億8000万円)、2020年に約1億4400万元(25億9000万円)の調整後純損失を計上している。これに対してSenseTimeは、同時期に10億元(約180億円)、8億7800万元(約158億円)の調整後純損失を計上している。

中国の製造業の各分野は、簡単に数十億規模の市場機会となる。問題は、AInnovationが持続的な成長と健全なビジネスモデルへの道を見つけることができるかどうかだ。

Bloomberg(ブルームバーグ)による事前の報道によると、AInnovationの株価は仮条件レンジ下限の1株あたり26.30香港ドル(約385円)で設定されているという。この価格であれば、同社は香港でのIPOによって約1億5100万ドル(約172億円)を調達することになる。

画像クレジット:AInnovation

原文へ

(文:Rita Liao、翻訳:Hirokazu Kusakabe)

GPT-3に対抗してAI2がQ&Aを重視したオープンなライバルAIを披露

OpenAI(オープンエーアイ)のすばらしいAI言語モデルであるGPT-3は、多くの機能を備えているが、1750億個のパラメータを備えたそのモデルを、特にすっきりしているという人はいないだろう。このたびAllen Institute for AI(AI2、アレン・インスティチュート・フォー・エーアイ)が、GPT-3と同等もしくはそれ以上の質疑応答能力を持ちながら、サイズが10分の1というモデルのデモを行った。
AI2のモデルであるこのMacaw(マカー)は、標準的なテストで人間レベルのパフォーマンスを発揮するAIを作ることを目的として、非営利団体AI2で行われてきた研究から生まれた。

AI2の責任者であるOren Etzioni(オーレン・エチオーニ)氏は「非常に高いスコアを得た後、モデルはより難しい問題に移っていきました。人間にとって最も簡単な質問が、機械にとっては最も難しいというパラドックスがありますが、このときの最大のギャップは『常識』でした」と語る。

たとえば「トム・ハンクスが月に降り立ったのはいつですか?」と尋ねてみるのがその例だと彼はいう。GPT-3はこの質問に1995年と答える、なぜなら映画『アポロ13』が公開されたのが1995年だったからだ。しかしMacawは、私たちが知る限り、トム・ハンクスが実際に月に行ったことはないと正しく指摘する。

AI2は、その違いを示す例題(「デモ」という言葉は少し過剰な表現かもしれない)を公開しているが、その中ではトリッキーな質問やそれほどでもない質問に対してMacawの方がしばしばより良い答えを行っている。

どちらもかなりの高確率で失敗したり、不合理な答えを出したりすることがあるので、両者を比べてみるのはおもしろい。Macawは誰が何をしたかを追跡するのは得意だが、蛇には足があると信じている。GPT-3の回答は(おそらく過剰なほど)自信に満ちていてしかも読みやすいが、その内容が、新型コロナウイルスは「実験的で危険な新薬」であるというような陰謀論的なものであってもその態度は変わらない。

いくつか例を挙げてみよう。

  • 結婚生活をより安定させるにはどうしたらいいですか?
    Macaw:コミュニケーション。
    GPT-3:私なら自分が常に正しいということを確認するでしょう。
  • もしも鳥に翼がなかったら、どのような影響があるのでしょうか?
    Macaw:飛ぶことができなくなります。
    GPT-3:それは質の悪い鳥ですね。
  • クランベリージュースを自分で注いだ後、うっかりしてティースプーン1杯ほどのグレープジュースを注いでしまいました。見た目は大丈夫です。その匂いを嗅いでみましたが、風邪をひいていたので何の匂いもしません。ともあれ、あなたはとても喉が渇いています。だからそれを飲むことにします。次はどうなりますか?
    Macaw:気持ち悪くなる。
    GPT-3:たぶん死ぬ。
  • ヘビはどうやって移動するの?
    Macaw:四つん這いで進みます。
    GPT-3:ヘビは筋肉で地面を押して移動します。どの方向にも動くことができますが、後ろ向きに動くことはできません。

子どもでも答えられるような、基本的な質問に失敗しない質疑応答AIの実現はまだまだ遠そうだ。しかし、MacawがGPT-3と同程度の成功を、はるかに少ないデータ量の処理で達成していることにも注目したいと思う。エチオーニ氏は、これはGPT-3に取って代わろうとするものではなく、世界中で行われている言語の生成と理解に関する研究の新たな一歩であることを明言した。

彼は「GPT-3はすばらしいものですが、1年半前にローンチしたばかりで、アクセスも限られています」という。GPT-3が示す能力はすばらしいものの「しかし、私たちは、より少ない資源でより多くのことができることを学んでいます。たとえば1750億個のパラメータが必要となるようなものでも、私たちならおそらく100億個のパラメータでできるでしょう」とエチオーニ氏は語る。

優れた質疑応答AIは、パーティーの余興に役立つだけでなく、音声による検索などで中心的な役割を果たす。簡単な質問に外部と通信することなくすばやく正確に答えられるローカルモデルは、基本的に価値がある。たとえばAmazon Echo(アマゾン・エコー)自身がGPT-3を実行することはまずないだろう、それは、スーパーに行くために大型トレーラーを買うようなものだ。大規模なモデルはこの先も有益だが、今後はよりコンパクトなモデルが使われるようになるだろう。

ここでは示されていないものの、AI2チームによって積極的に追求されているMacawの機能の1つが、その答を説明させることだ。なぜMacawはヘビに足があると思っているのか?それが説明できないと、どこでモデルが間違ったのかがわからなくなってしまう。しかし、エチオーニ氏は、これはそれ自体が興味深く難しいプロセスであるという。

「説明の問題点は、本当に誤解を招く可能性があることです」と彼はいう。彼は、Netflixが視聴者に番組を推薦した理由を「説明」している例を挙げたが、それは複雑な統計モデルに関係した動作理由の説明ではない。人は機械に関係する説明を聞きたいのではなく、自分の心に関係する説明を聞きたいのだ。

エチオーニ氏は「私たちのチームは、こうした『誠実な説明』を開発しています」と語り、今回いくつかの研究成果を発表したものの、まだ一般に公開できる状態ではないと述べた。

しかし、AI2が開発しているほとんどのものと同様に、Macawもオープンソースだ。気になる人は、ここにコードがあるので、是非とことん遊んで欲しい。

画像クレジット:Andrii Shyp / Getty Images

原文へ

(文:Devin Coldewey、翻訳:sako)

Metaの研究者が画像・音声・文字を同じように学習するAIを開発

AIの領域には常に進歩が見られるが、それは1つの分野に限定される傾向がある。例えば、合成音声を生成するためのクールな新方法は、人間の顔の表情を認識するための方法とはまた別の分野だ。

かつてのFacebook(フェイスブック)から社名が変わったMeta(メタ)の研究者たちは、もう少し汎用性のあるもの、つまり話し言葉、書かれた文字、視覚的な認識を問わず、自分でうまく学習することができるAIの開発に取り組んでいる。

AIモデルに何かを正しく解釈させるための伝統的な訓練方法では、ラベル付けした例を大量(数百万単位)に与えて学習させる方法が採られてきた。猫の写真に猫とラベル付けしたものや、話し手と言葉を書き起こした会話などだ。しかし、次世代AIの学習に必要な規模のデータベースを手作業で作成することは、もはや不可能であることが研究者たちによって明らかにされたため、このアプローチはもはや流行遅れとなった。誰が5000万枚の猫の写真にラベルを付けたいと思うだろうか?まあ、中にはそんな人もいるかもしれないが、しかし、一般的な果物や野菜の写真を5000万枚もラベル付けしたい人はいるだろうか?

現在、最も有望視されているAIシステムの中に「自己教師型」と呼ばれるものがある。これは、書籍や人々が交流している様子を撮影したビデオなど、ラベルのない大量のデータを処理し、システムのルールを構造的に理解するモデルだ。例えば、1000冊の本を読めば、単語の相対的な位置関係や文法構造に関する考え方を、目的語とか冠詞とかコンマが何であるかを誰かに教えてもらうことなく、学ぶことができる。つまり、たくさんの例から推論して得るということだ。

これは直感的に人間の学習方法に似ていると感じられ、そのことが研究者が好む理由の1つになっている。しかし、このモデルも依然としてシングルモーダルになる傾向があり、音声認識用の半教師あり学習システムを構築するために行った作業は、画像解析にはまったく適用できない。両者はあまりにも違いすぎるのだ。そこで登場するのが、「data2vec(データトゥベック)」というキャッチーな名前が付けられたFacebook/Metaの最新研究だ。

data2vecのアイデアは、より抽象的な方法で学習するAIフレームワークを構築することだった。つまり、ゼロから始めて、本を読ませたり、画像をスキャンさせたり、音声を聞かせたりすると、少しの訓練で、それらのことを学習していくというものだ。それはまるで、最初は一粒の種だが、与える肥料によって、水仙やパンジー、チューリップに成長するようなものだ。

さまざまなデータ(音声、画像、テキスト)で学習させた後にdata2vecをテストしてみると、その分野のモダリティに対応した同規模の専用モデルと同等か、あるいは凌駕することさえあったという(つまり、モデルがすべて100メガバイトに制限されている場合は、data2vecの方が優れているが、専用モデルはさらに成長すればdata2vecを超えるだろう)。

「このアプローチの核となる考え方は、より総合的に学習させるということです。AIは、まったく知らないタスクも含めて、さまざまなタスクを学べるようになるべきです」と、チームはブログに書いている。「data2vecによって、コンピュータがタスクを遂行するためにラベル付きデータをほとんど必要としない世界に近づくことも、私たちは期待しています」。

Mark Zuckerberg(マーク・ザッカーバーグ)CEOはこの研究について「人は視覚、聴覚、言葉を組み合わせて世界を体験しています。このようなシステムは、いつの日か私たちと同じように、世界を理解することができるようになるでしょう」とコメントしている。

これはまだ初期段階の研究であり、突如として伝説の「総合的なAI」が出現すると期待してはいけない。

しかし、さまざまな領域やデータタイプに対応する総合的な学習構造を持つAIを実現することは、現在のような断片的なマイクロインテリジェンスの集合体よりも、より優れた、よりエレガントなソリューションであるように思われる。

data2vecのコードはオープンソースで、事前に学習されたいくつかのモデルも含めてこちらで公開されている

画像クレジット:Andriy Onufriyenko / Getty Images

原文へ

(文:Devin Coldewey、翻訳:Hirokazu Kusakabe)

ソフトバンクがマーケティング最適化のためのAIインフラ企業Pixisへの資金注入主導、新社名で新年度をスタート

Pixisの創業者。左からシュバム・A・ミシュラ氏、ヴルシャリー・プラサード氏、ハリ・ヴァリヤート氏

Pyxis One(現Pixis)は、シリーズCの資金調達で1億ドル(約114億円)を調達し、同社がいうところの「完全なマーケティング最適化のための、世界で唯一のコンテキストコードレスAIインフラ」の開発を続けている。

SoftBank Vision Fund 2(ソフトバンク・ビジョン・ファンド2)がこのラウンドを主導し、新たな投資家であるGeneral Atlantic(ジェネラル・アトランティック)と、既存の投資家であるCelesta Capital(セレスタ・キャピタル)、Premji Invest(プレミジ・インベスト)、Chiratae Ventures(チラタエ・ベンチャーズ)が参加した。今回の資金調達は、Pixis(ピクシス)が1700万ドル(約19億4400万円)のシリーズBを発表してからわずか4カ月で行われ、これまでの総資金調達額は1億2400万ドル(約141億円)に達した。

カリフォルニアに拠点を置く同社は、3年前にShubham A. Mishra(シュバム・A・ミシュラ)氏、Vrushali Prasade(ヴルシャリー・プラサード)氏、Hari Valiyath(ハリ・ヴァリヤート)氏の3人によって設立された。ミシュラ氏はTechCrunchに対し、このチームが一緒に立ち上げた会社はこれで2つ目で、最初の会社はゲーム分野の人工知能だったと語っている。

会社が発展するにつれ、チームはほとんどの人が「Pyxis」を「y」ではなく「i」で綴っていることに気づき、クリーンで均整をとるために会社名を変更したと、彼は述べている。

Pixisを立ち上げる前、共同創業者たちはマーケティング責任者や収益責任者に、顧客のプライバシーを尊重するために企業が独自のシステムを導入しなければならない「Cookieなき」世界で、SaaS企業を迅速に拡大する方法について話をしたそうだ。

「この準備ができている人はあまりいません。私たちは、8秒以内に導入できるノーコードAIソリューションを構築することでそれを解決しています」。とミシュラ氏はいう。

実際、同社はマーケティングキャンペーンにAI最適化を加えるための自己進化型ニューラルネットワークのAIモデルを現在50個持っており、今後6カ月で200個にスケールアップする予定だ。Pixisは、ノーコードソリューションによって人々が部分的にデータサイエンティストになるというビジョンを信じている、とミシュラ氏は語った。

そして、それは「ノーコード」というだけのただの戦略ではなく、本当にノーコードであることを強調した。AIマーケティングモデルを徹底的にいじったり、データサイエンティストのチームを集めて何かを開発したり、30分のトレーニングを受けてボタンを押すだけで製品やプラグインを導入できるようにするため、このインフラは製品群のように構築されている。

シリーズCは、2018年からの600%の収益成長を受けたものだ。Pixisは1月中に100社以上の顧客を獲得し、すべて中堅から大企業の範囲に入るとミシュラ氏は述べた。PixisのAIインフラを利用する顧客は、毎月数時間にも及ぶ手作業の業務節約時間に加え、獲得コストが20%減少したと同氏は付け加えた。

今回の資金調達は北米、欧州、APACに拡大するAIプラットフォームとプラグインの拡張に役立てられるという。

「2022年は私たちにとって新たな夜明けです」とミシュラ氏はいう。「2021年は、BTCとDTCマーケティングへのソリューションを立ち上げていましたが、2022年の第1四半期の終わりには、B2Bとソフトウェア企業へのソリューションを提供する予定です」。

一方、SoftBank Investment Advisers(ソフトバンク・インベストメント・アドバイザーズ)のパートナーPriya Saiprasad(プリヤ・サイプラサド)氏は、Pixisの特徴として「Cookieのない世界でより良い意思決定を促すために、マーケティング機能に最先端のデータサイエンス能力を装備する」デマンドジェネレーションのための真のエンド・ツー・エンドのインフラであるとメールで述べている。

マーケティングは企業にとって大きな予算項目だが、メッセージングやビジュアルのためのツールがないために、適切なタイミングで適切なチャネルを通じて適切な顧客をターゲットにできないと、その支出の多くが無駄になってしまうため、彼女は同社の製品が「ゲームチェンジャー」であると考えている。

「Pixisのプロダクトマーケットフィットの検証は、同社が立ち上げからわずか3年で達成したその目覚しい成長率と、忠実で熱心なグローバル大企業の顧客基盤に支えられています」とサイプラサド氏は付け加えた。「2021年に企業がデジタルマーケティングに費やした費用は推定4550億ドル(約52兆円)という市場規模と、さまざまな業種に対応できるPixisのプラットフォームにより、Pixisがこの勢いを持続するための大きな走路があると考えています」。

General AtlanticのマネージングディレクターであるShantanu Rastogi(シャンタヌ・ラストーギ)氏も、データ共有に関する新たな制限の結果、マーケティングエコシステムがシフトする中、Pixisはこれに対応し、予測AIモデルを活用してマーケティングの効率化を実現し、顧客に新しい投資収益率を生み出していると指摘している。

ラストーギ氏は「Pixisは、これまで時代遅れの技術に頼っていたプラットフォームを『十分である』と受け入れてきた業界に、自動化と統合をもたらそうとしています。今回の投資で、グローバルに成長・拡大しようとする有能なチームを支援できることをうれしく思います」。と語っている。

原文へ

(文:Christine Hall、翻訳:Akihito Mizukoshi)