アインシュタインのチャットボットに「声」を与えるAflorithmicのAI音声クローン技術

合成メディアの奇妙な世界から生まれたディープフェイクの一端に、耳を傾けてみてほしい。これはAlbert Einstein(アルバート・アインシュタイン)のデジタル版。有名な科学者の実際の声を録音した音声記録を元に、AIのボイスクローン技術を使って合成された声である。

この「不気味の谷」にいるアインシュタインの音声ディープフェイクを開発したのは、Aflorithmic(アフロリズミック)というスタートアップ企業だ(同社のシードラウンドについては2月に紹介した)。

関連記事:AI駆動でテキストを美しい合成音声として出力するAflorithmicが約1.4億円調達

動画に登場するアインシュタインの「デジタルヒューマン」を生み出したビデオエンジンは、もう1つの合成メディア企業であるUneeQ(ユニーク)が開発したもので、同社はウェブサイトでインタラクティブなチャットボット版を公開している。

Alforithmicによると、この「デジタル・アインシュタイン」は、会話型のソーシャルコマースが間もなく実現することを示すために作られたものだという。つまり、業界関係者が予見的に警告しているように、歴史上の人物を模したディープフェイクが、近いうちにあなたにピザを売ろうとするだろうと、手の込んだかたちで伝えているのだ。

また、このスタートアップは、ずっと前に亡くなった有名な人物にインタラクティブな「生命」を吹き込むことで、教育に役立てる可能性も見出しているという。

この「生命」とは人工的なそれに近いものという意味であり、完全に仮想上のもので、デジタル・アインシュタインの声は純粋な技術によるクローンではない。Alforithmicはチャットボットのボイスモデリングを行うために、俳優の協力を仰いだという(なぜなら、デジタル・アインシュタインが、例えば「ブロックチェーン」のような、生前の本人が夢にも思わなかったような言葉を言うとしたら、どんなふうに言うかを検討するためだ)。それによって、AIによる人工物を超えた存在ができあがる。

「これは、会話型ソーシャルコマースを実現する技術を紹介するための新たなマイルストーンです」と、AlforithmicのCOO(最高執行責任者)であるMatt Lehmann(マット・レーマン)氏は我々に語った。「克服しなければならない技術的な課題だけでなく、解消しなければならない欠陥もまだありますが、全体としては、この技術がどこに向かっているのかを示す良い方法ではないかと、私たちは考えています」。

Alforithmicは、アインシュタインの声をどのように再現したかを説明したブログ記事の中で、チャットボット版の生成に関わる困難な要素の1つに進展があったと書いている。それは、計算知識エンジンから入力されたテキストに対し、APIが応答音声を生成できるようになるまでの応答時間が、当初の12秒から3秒以下に短縮できたというものだ(これを同社では「ニア・リアルタイム」と呼んでいる)。しかし、これでもまだタイムラグがあり、ボットが退屈な存在から免れることはできていない。

一方、人々のデータやイメージを保護する法律は、生きている人間の「デジタルクローン」を作ることに法的および / または倫理的な問題を提示している。少なくとも、先に許可を得て(そしてほとんどの場合、お金を払って)からでなければできない。

もちろん、歴史上の人物は、自分の肖像が物を売るために流用されることの倫理性について厄介な質問をすることはない(今後、意思を持つ本物のクローン人間が誕生すれば話は別だが)。しかし、ライセンス権は適用される可能性があるし、現にアインシュタインの場合は適用されている。

「アインシュタインの権利は、このプロジェクトのパートナーであるHebrew University of Jerusalem(エルサレム・ヘブライ大学)にあります」とレーマン氏は言い、アインシュタインの「声のクローン」のパフォーマンスに、アーティストライセンスの要素が絡んでいることを告白した。「実際には、私たちはアインシュタインの声のクローンを作ったわけではなく、オリジナルの録音や映画から着想を得ています。アインシュタインの声のモデリングに協力してくれた声優は、彼自身がアインシュタインの崇拝者であり、彼の演技はアインシュタインというキャラクターを非常によく表現していると思いました」と、同氏は述べている。

ハイテクの「嘘」の真実は、それ自体が何層も重ねられたケーキのようなものであることがわかる。しかし、ディープフェイクで重要なのは、技術の巧拙ではなく、コンテンツが与える影響であり、それは常に文脈に依存する。どんなに精巧に(あるいは稚拙に)フェイクが作られていたとしても、そこから人々が見聞きしたことにどう反応するかによって、ポジティブなストーリー(創造的・教育的な合成メディア)から、深くネガティブなもの(憂慮すべき、誤解を招くようなディープフェイク)へと、全体的に話が変わってしまう。

「デジタル・アインシュタイン」を担当する2つの団体が拠点を置く欧州では、技術がさらに洗練されるにつれてディープフェイクが情報操作のツールになる可能性への懸念も高まっており、それがAIを規制する動きを後押ししている。

今週初めに草案がリークされた、人工知能の「高リスク」利用法を規制する汎EUの次期立法案には、ディープフェイクを特に対象とした項目が含まれていた。

この計画では、人間との対話を目的としたAIシステムや、画像・音声・映像コンテンツの生成・操作に使用されるAIシステムについて、「調和のとれた透明性ルール」を提案する見通しだ。

つまり、将来的にデジタル・アインシュタインのチャットボット(またはセールストーク)は、偽装を始める前に、自らが人工物であることを明確に宣言する必要がありそうだ。そうすれば、インターネットユーザーが、フェイクと本物を見分けるために、仮想的なフォークト・カンプフ検査を行う必要はなくなる。

しかし、今のところ、この博学な響きを持つデジタル・アインシュタインの対話型チャットボットには、馬脚を現すのに十分なラグがある。製作者も自分たちの作品を、AIを活用したソーシャルコマースのビジョンを他の企業に売り込むためのものであると明示している。

関連記事:

カテゴリー:人工知能・AI
タグ:Aflorithmic不気味の谷ディープフェイクチャットボット

画像クレジット:UneeQ

原文へ

(文:Natasha Lomas、翻訳:Hirokazu Kusakabe)

データ品質の監視を自動化するBigeye(旧Toro)がシリーズAで約18.5億円調達

企業が機械学習モデルを作る際、オペレーションチームはモデルの作成に使うデータの品質に問題がないことを確認しなくてはならない。このプロセスには往々にして時間がかかる。Bigeye(旧社名Toro)はデータ品質の監視を自動化するアーリーステージのスタートアップだ。

米国時間4月15日、同社はSequoia Capitalが主導するシリーズAで1700万ドル(約18億5000万円)を調達したと発表した。このラウンドには以前に投資していたCostanoa Venturesも参加した。Bigeyeは2020年5月にシードラウンドで400万ドル(約4億3500万円)を調達しており、今回のラウンドでこれまでの調達金額の合計は2100万ドル(約22億8500万円)となった。

2020年5月、BigeyeのCEOで共同創業者のKyle Kirwan(カイル・カーワン)氏は、シードラウンドでは人材の雇用と自動化機能の追加に集中すると述べていた。現在、同社のスタッフは11人となり、同氏はシードラウンドのゴールは達成したとしている。

カーワン氏は「我々の製品でデータ品質のメトリクスとして何を収集する必要があるかを自動で示せるようになったため、SnowflakeやAmazon Redshiftなどのテーブルを指定すれば、そのテーブルを分析しデータ品質を監視するために収集するメトリクスを提案できます。また、アラートも自動化しました」と説明する。

Bigeyeはモデルに入力するデータオペレーションの問題に特化しているとカーワン氏はいう。例えばテーブルが想定通りに更新されていない、行が足りない、重複するエントリーがあるといった問題だ。同社の製品は、こうした問題に対するアラートを自動化し、トレーニングや本番環境で使えるデータを準備するプロセスをスピードアップする。

Sequoiaのパートナーで今回の投資をリードしたBogomil Balkansky(ボゴミル・バルカンスキー)氏は、Bigeyeは機械学習のパイプラインにおける重要な部分に取り組んでいると見ている。同氏は発表の中で「Uberでデータ品質チームを率いてきたカイルとエゴール【訳者注:CTOのEgor Gryaznov(エゴール・グリャズノフ)氏】は、すべての企業にデータ品質のインサイトを常に提供するという明確なビジョンを持っています」。と述べた。

創業者チームがBigeyeを始めるにあたり、多様性のあるチームにすることを重要なゴールとして掲げ、このことを強く意識しているとカーワン氏は話す。

同氏は「ある1つの型に合う人を大勢雇うのは簡単なことです。自分たちのネットワークの中で人を見つけるのは簡単ですが、さまざまなバックグラウンド、さまざまな視点、さまざまなタイプの人物を雇用していく必要があり、(このことをよく理解して)細心の注意を払って努力したいと思っています。これが最強のチームづくりにつながるからです」と述べた。

BigeyeにはオンプレミスとSaasのソリューションがあり、Instacart、Crux Informatics、Lambda Schoolなどに有料で提供しているが、一般に公開されるのは2021年後半の予定だ。

カテゴリー:人工知能・AI
タグ:Bigeye機械学習資金調達

画像クレジット:GelatoPlus / Getty Images

原文へ

(文:Ron Miller、翻訳:Kaori Koyama)

機械学習のフィーチャーストアTectonがオープンソースの同サービスFeastを併合

機械学習のフィーチャーストアという概念を開拓したTectonが、Feastと呼ばれるオープンソースのフィーチャーストアプロジェクトの創業者とチームを組んだ。そして米国時間4月15日、同社は、オープンソースツールのバージョン0.10のリリースを発表している。

「フィーチャーストア」は、Tectonの創業者たちがUberのエンジニアだったときに考えたコンセプトだ。その後、Willem Pienaar(ウィレム・ピエナール)という名前のエンジニアが創業者のUberのブログ記事を読んでフィーチャーストアの構築について知り、そのコンセプトのオープンソースバージョンとしてFeastの構築に着手した。

Tectonの共同創業者でCEOのMike Del Balso(マイク・デル・バルソ)氏は次のように説明する。「Tectonは、フィーチャーストアを産業界に持ち込んで、最上級のエンタープライズフィーチャーストアを作ることが狙いだ。それに対してFeastはウィレム(・ピエナール)が開発したもので、私たちがUberで公開した初期の設計からヒントを得たようだ。彼が作ったFeastは、オープンソースのフィーチャーストアのスタンダードのようなものに進化し、今ではLinux Foundationの一部となっている」。

Tectonはその後ピエナール氏を雇用し、現在、彼は同社のエンジニアとしてそのオープンソースチームを率いている。同社最初の事業計画にはオープンソースのプロダクトはなかったが、今では2つのプロダクトが密接な関係にある。ピエナール氏の雇用も、理に適っていた。

「2つのプロダクトは多くの点でとてもよく似ている。類似性があって両者が共生している、ともいえるだろう。意図的な整合作業は一切必要ない。Tectonのプロダクトは、Feastにあるもののスーパーセットだ。先進的な機能が多いTectonはいわばエンタープライズバージョンで、一方Feastには実戦で鍛えられたオープンソースのフィーチャーストアがある」とピエナール氏はいう。

TectonはシリーズBで3500万ドル(約38億円)を調達した。それを報じる本誌2020年12月の記事では、フィーチャーストアについて「それはエンド・ツー・エンドの機械学習管理システムであり、そこにはデータを特徴量というものに変換するパイプラインと、それら特徴データのすべてを保存して管理する機能、および整合性のあるデータ集合をサーブする機能がある」と説明している。

デル・バルソ氏によると、ビジネスとして見た場合には、オープンソースのフィーチャーストアに寄与貢献すると会社がこれまでとは違うユーザーグループに知られることになり、また商用製品とオープンソース製品が互いに補い合って作られていく。

「私たちが気に入っている非常に強力なものとは、Feastのコミュニティに深く入り込むことによって、極めて多様で興味深いユースケースから多くを学び、Tectonのプロダクトを改良できることだ。また同様に、エンタープライズの顧客から得たフィードバックでオープンソース製品を改良できる。それは一種の交叉学習であり、フィードバックのループが理想的に回っている」とデル・バルソ氏は語る。

計画ではTectonが、Tectonの中でFeastに専念するチームへの主要なコントリビューターであり続ける。本日、同社はそのプロダクトのバージョン0.10をリリースする。

カテゴリー:人工知能・AI
タグ:Tecton機械学習

画像クレジット:Andriy Onufriyenko/Getty Images

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)

ディープフェイク動画のiOSアプリ「Avatarify」が電子透かし提供へ

ディープフェイク動画の作成は昔は大仕事だった。今や必要なのはスマートフォンだけだ。クラウドにアップせず、スマホ内で直接ディープフェイク動画を作るアプリを提供するスタートアップであるAvatarifyは、David Beckham(デビッド・ベッカム)の妻、Victoria Beckham(ヴィクトリア・ベッカム)などのセレブに利用され、アプリチャートで急上昇中だ。

しかしディープフェイク動画に共通する問題点は動画がフェイクであることを簡単に判断できるような電子透かしが添付されないことだ。Avatarifyは悪用その他の好ましくない事態を防ぐための電子透かしを近く提供開始するという。

米国に本社があるが本拠はモスクワのスタートアップAvatarifyは、2020年7月に創立されて以後、数百万回もダウンロードされている。ファウンダーによれば、2021年に入って以降だけで1億4000万本のディープフェイク動画が作成されたという。TikTokでは現在、ハッシュタグ「#avatarify」が付けられた動画の再生回数が1億2500万回に達している。ライバルには、資金豊富なSnapchatをはじめRefaceやWombo.ai、Mug Life、Xpressionなどがある。ただしAvatarifyの外部資金調達はエンジェルラウンドのみだ。

ファウンダーによれば、エンジェルラウンドで得た資金はわずか12万ドル(約1300万円)に過ぎなかったが、その後はベンチャーキャピタルを受け入れておらず、スクラッチでスタートしてたちまち1000万ダウンロードを達成し、10人足らずのチームで通年換算1000万ドル(約10億8900万円)のビジネスに成長したという。

これほど安定したビジネスを作れた理由はわかりやすい。Avatarifyは7日間の無料トライアルというフリーミアムのサブスクリプションモデルを採用している。サブスクリプション料金は年間契約の場合34.99ドル(約3800円)、週決めは2.49ドル(約270円)だ。無料で利用を続けることもできるが、動画には目に見える透かしが入る。

Avatarifyは、フリーミアムのサブスクリプションモデルを採用してるだけでなくプライバシー保護にも適した仕組みだという。動画はハッキングその他によって情報がリークされるる可能性があるクラウドにアップされることなく、スマートフォン(iPhone)上でローカルで処理される。

Avatarifyは機械学習アルゴリズムなどを利用してユーザーが選択した写真を加工し、顔をアニメーションさせたり、サウンドと同期させたりしてショート動画を作成する。ユーザーは素材写真を選び、エフェクトや音楽を選択してタップするだけでよい。Avatarifyが自動的にアニメーションさせる。成果物はInstagramやTikTokにショート動画として投稿することができる。

特にTikTokではAvatarify動画が大人気だ。ティーンエージャーは自分でダンスしなくても有名人や友達はてはペットの写真を処理してアニメ化できるからだ。苦労して自分が下手なダンスを披露するよりずっとクリエイティブなアイデアが利用できるわけだ。

Avartifyは「このアプリを使って他人になりすますような悪用をしてはならない」と警告しているが、もちろんこれを効果的に禁圧する方法はない。

共同ファウンダーのAli Aliev(アリ・アリエフ)氏とKarim Iskakov(カリム・イシャコフ)氏は、2020年4月に新型コロナウイルスによるロックダウンが強制されたときにこのアプリを開発したという。アリエフ氏はPythonでプログラムを書くのに2時間しかかからなかったという。これはZoomのフィルターを使って自分の顔の表情を別の顔にマッピングするものだった。その結果フェイクビデオをリアルタイムでZoomにストリーミングすることができるようになった。アリエフ氏はElon Mask(イーロン・マスク)氏の顔のアバターで通話に登場し、その場にいた全員が仰天したという。チームがこの動画を投稿したこころバイラルに拡散した。

ファンダーがこのコードをGithubに掲載するとすぐにダウンロード数が伸び始めたという。2020年4月6日にリポジトリを公開し、2021年3月19日時点で5万回のダウンロードを記録した。

アリエフ氏はSamsun AIセンターでの仕事を辞めアプリの開発に専念した。2020年6月28日にAvatarifyのiOSアプリが公開されるとTikTokのバイラル動画で拡散され、有償販売開始前だったにもかかわらずApp Storeのトップチャートにランクインした。2021年2月には、Avatarifyは世界の無料アプリのランキングで1位になった。2021年2月から3月までの期間では月間収益が100万ドル(約1億1000万円)を超えた(AppMagicより)

こうした成功にも関わらずAvartifyもディープフェイクビデオが持つ根本的な問題からの逃れることができていない。つまり無断で他人の顔写真を利用してポルノ動画を作成するなどディープフェイク動画の悪用問題は依然として残っている。電子透かしの提供は正しい方向への一歩だろう。

カテゴリー:人工知能・AI
タグ:Avatarifyディープフェイクアプリ電子透かし

画像クレジット:Avatarify

原文へ

(文:Mike Butcher、翻訳:滑川海彦@Facebook

機械学習モデルの作成とメンテナンスを支援するCometがシリーズAで14.1億円調達

機械学習のスタートアップへの投資が最近とても多いのは、多様な企業が多様な事業にその応用を見出そうとしているからだ。そうした顧客企業におけるモデルの長期の継続的開発を、最後にはプロダクション(本番稼働)に行き着く実験的なプロセスで支援するCometが、米国時間4月8日にシリーズAで1300万ドル(約14億1000万円)を獲得したことを発表した。

Scale Venture Partnersがそのラウンドをリードし、これまでの投資家であるTrilogy Equity PartnersとTwo Sigma Venturesがこの投資を支援した。Crunchbaseのデータによると、Cometの調達総額はこれで2000万ドル(約21億8000万円)近くになる。

投資家たちの目に映じたものは、売上が前年比で500%ほど伸びた企業だ。そう語る共同創業者でCEOのGideon Mendels(ギデオン・メンデルス)氏は、次のように述べる。「このところ、追い風が吹いていた。プロダクトに関しては、弊社が実験管理と呼んでいるものに注力して、実際にモデルの追跡調査を行ってきた。そこで調べるものは、モデルに入ってくるデータと、学習のプロセスをコントロールするハイパーパラメータであり、それらを調べることによってチームのデバッグとモデルの現状理解を助ける」。

今回の資金調達に加えて同社は、モデルをポストプロダクションまで見届ける同社プラットフォームの拡張プロダクト、Comet Model Production Monitoring(Comet MPM)を発表した。

これに関してメンデルス氏は「モデルのプロダクションをモニタリングするプロダクトは、要するにモデルのポストプロダクションにフォーカスするものです。私たちの最初のプロダクトは、訓練の間に複数のオフライン実験がモデルとしてどのようにして作られるかに着目したが、このMPMではこれらのモデルが初めてプロダクションに入って以降にフォーカスする」と説明する。

関連記事:機械学習のモデルの管理を効率化するComet.mlが約5億円を調達

Scale Venture PartnersのパートナーであるAndy Vitus(アンディ・ヴィータス)氏は、Cometのようなライフサイクルを管理するツールには今後、大きな市場があると考えている。「エンタープライズソフトウェアの未来を牽引するものは機械学習とAIだ。そうなれば、企業がモデルのライフサイクルに対する完全な視野とコントロールを確保することが絶対的に欠かせない」とヴィータス氏は声明で述べた。

同社は成長にともなって、ニューヨークのオフィスに加えてイスラエルに新たなエンジニアリングハブを開設した。オフィスは現在、閉鎖しているが、メンデルス氏によると、パンデミックが落ち着いたら、リモートと通勤の両方を混ぜたハイブリッドオフィスにしたいという。

「オフィスはニューヨークとテルアビブの両方に置く計画だが、オフィスで仕事するのが嫌な人はそれでも良いし、週に2日だけオフィスに来るのでもいい。いずれにしても、世界中からの雇用は続けていく」とメンデルス氏は語った。

カテゴリー:人工知能・AI
タグ:Comet機械学習資金調達

画像クレジット:Westend61/Getty Images

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)

少ない計算機資源で機械学習モデルをエッジで展開するためにDeepliteが6.6億円のシード資金を調達

機械学習アプリケーションを展開する際の問題点の1つは、高い計算能力を必要とし、コストがかかる傾向があることだ。モントリオールに拠点を置くスタートアップのDeeplite(ディープライト)は、モデル全体のサイズを縮小し、より少ないリソースのハードウェアで動作させる手段を提供することで、この状況を変えたいと考えている。

カナダ時間4月13日、同社は600万ドル(約6億6000万円)のシード資金調達を発表した。ボストンを拠点とするベンチャーキャピタルのPJCがこのラウンドを主導し、Innospark Ventures、Differential Ventures、Smart Global Holdingsが参加した。またSomel Investments、BDC Capital、Desjardins Capitalも参加している。

DeepliteのCEOで共同創業者のNick Romano(リック・ロマーノ)氏によると、同社の目標は、実行に大量の計算能力と大量のメモリを必要とし、速いペースで電力を消費する傾向のある複雑なディープニューラルネットワークを、少ないリソースでより効率的に実行できるようにすることだという。

「私たちのプラットフォームは、そうした学習モデルを新しいフォームファクターへと変換し、制約のあるエッジハードウェアに展開することができるのです」とロマーノ氏は説明する。それらのデバイスは、携帯電話やドローン、あるいはRaspberry Pi(ラズベリーパイ)のような小さなものにすることも可能だ。つまり、開発者は、現在のほとんどのケースでは不可能な手段でAIを導入することができるのだ。

同社が開発したNeutrino(ニュートリノ)というプロダクトは、モデルの展開の仕方や、モデルを全体のサイズを小さくし実運用に必要なリソースを削減するために、どの程度の圧縮を行うべきかを利用者が指定することを可能にする。基本アイデアは、極めて限られたリソースの下で、機械学習アプリケーションを実行しようというものだ。

最高製品責任で共同創業者のDavis Sawyer(デイビス・ソーヤー)氏は、同社のソリューションが活躍するのは、機械学習モデルが構築されてトレーニングが終わり、実運用の準備が整った後だという。ユーザーはモデルとデータセットを提供し、より小さなモデルをどのようにビルドするかを決めることができる。そのためには、許容範囲内で精度を多少落とす可能性もあるが、主に行われるのは、圧縮レベルの選択(すなわちどれだけモデルを小さくするか)だ。

「より安価なプロセッサーへ展開できるように、圧縮することでモデルのサイズを小さくすることができます。中には、200MBが11MBになったり、50MBが100KBになったりする事例もあります」とソーヤー氏は説明する。

PJCで今回の投資を担当しているRob May,(ロブ・メイ)氏は、チームならびに、スタートアップが開発しようとしている技術に感銘を受けたという。

「AI、特に深層学習をリソースに制約のあるデバイスに展開することは、AI人材やノウハウが乏しい業界で幅広い課題となっています。エッジAIが主要なコンピューティングパラダイムとして成長し続ける中で、Deepliteの自動化されたソフトウェアソリューションは、大きな経済的利益を生み出すでしょう」とメイ氏は声明の中で語っている。

この会社のアイデアは、モントリオールにあるインキュベーターTandemLaunch(タンデムローンチ)にルーツがある。Deepliteは2019年半ばに会社として正式に立ち上げが行われ、現在の従業員は15名だが、2021年中にその数を倍増させる予定だ。会社を創業するにあたり、創業者たちは多様性と包括性のある組織を作ることを重視していると、ロマーノ氏はいう。

彼は「私たちは、確実に多様で包括的な方法で、適切な人材を見つける戦略を採用しています。それが組織のDNAなのです」と語る。

この先可能になったときには、モントリオールとトロントに従業員同士のハブとなるオフィスを設置する予定だが、オフィスに出社する必要はない。

「私たちがすでに議論済ですが、基本的にはみんなが自由に出入りできるようにし、かつてのように大きなオフィススペースを必要とするとは考えていません。皆、自分の都合に合わせて、リモートやバーチャルで仕事をすることができるようになります」とロマーノ氏はいう。

カテゴリー:人工知能・AI
タグ:Deeplite機械学習資金調達エッジAIカナダ

画像クレジット:Andrii Shyp / Getty Images

原文へ

(文:Ron Miller、翻訳:sako)

インディーズ映画制作者にAIを活用したVFXを提供するWonder Dynamicsが2.7億円を調達

最近の映画作品には必ずと言っていいほど視覚効果が必要とされているが、インディペンデントクリエイターには、最高のCGを手に入れるための資金やノウハウが不足していることが多い。VFXエンジニアのNikola Todorovic(ニコラ・トドロヴィッチ)氏と俳優のTye Sheridan(タイ・シェリダン)氏が設立したWonder Dynamics(ワンダー・ダイナミクス)は、AIを活用することで、予算の少ない映画制作者でもそうしたプロセスを利用できるようにすることを目指している。このたび同社が、その実現のために250万ドル(約2億7000万円)を調達した。

同社の設立は、2017年にシェリダン氏とトドロヴィッチ氏がRodrigo Garcia(ロドリゴ・ガルシア)監督の映画「Last Days in the Desert」の撮影現場で出会ったことがきっかけとなった。彼らは、大規模なスタジオ映画で利用されていたツールを、誰でも使えるようにすることにチャンスがあると考えたようだ。

Wonder Dynamicsは、そのツールが正確には何をするものなのかについては、とても口が堅い。Deadline(デッドライン)ニュースでMike Fleming Jr(マイク・フレミング・ジュニア)氏は、その限定的なデモを見た上で「ほどほどの予算で世界を創造する分野の、どのような部分で価値を発揮できるかがわかります。対象のプロセスを、すばやくしかも従来のコスト構造の何分の1かで、行うことができるようになるでしょう」と語った。だがそのコメントを読んでも何かが詳しくわかったよう気はあまりしない。

シェリダン氏とトドロヴィッチ氏はWallace Pro(ウォーレス・プロ)という名のこのシステムについて、仕上げや特定の効果ではなく、ある種のVFXの煩雑な作業を代行してくれるものだと説明した(彼らは私が送った質問に2人で答えてくれた)。

「私たちは、CGキャラクターやデジタルワールドを含むコンテンツのプロダクションとポストプロダクションの両方のプロセスを、大幅に高速化するAIプラットフォームを構築しています。プラットフォームの目的は、プロセスの『客観的』な部分を自動化して、アーティストに創造的な『主観的』作業を任せることで、こうしたプロダクションに関連するコストを削減することです」と彼らは語っている。「こうすることで、予算を上回るビジョンを持つ映像制作者に、より多くの機会を与え、力を与えることができればと考えています。多くは説明しませんが、このシステムはアーティストの具体的なニーズに応じて、映画制作の3つのステージ(プリプロダクション、プロダクション、ポストプロダクション)すべてに適用することができます」。

こうしたことから、彼らのシステムはワークフローを改善するものだと思われる。それを使うことで広く使われているエフェクトを実現するための時間が短縮され、そのために必要な費用が削減されるのだ。はっきりさせておきたいのは、これはWonder Dynamicsが別途開発中の、映画プロダクションの過程でバーチャル・インタラクティブ・キャラクターを作成するための、特定目的の製品(間違いなく同社の初期アプリケーションではあるが)とは違うものだということだ。

この技術は小規模なテストが行われているが、2021年の後半にはプロダクションに投入できる機能を備える予定だ。「この技術を一般に公開する前に、この技術を使用する最初の映画制作者を厳選して、高いレベルの映画が制作できるかどうかを確認したいのです」と彼らはいう。第一印象は大切だからだ。

今回の250万ドル(約2億7000万円)のシードラウンドにはFounders Fund、Cyan Banister、Realize Tech Fund、Capital Factory、MaC Venture Capital、Robert Schwab(ロバート・シュワブ)氏が参加した。シェリダン氏とトドロヴィッチ氏は「テクノロジーと映画の交差点にいる私たちは、この2つの産業が将来的にどれだけお互いに依存するかを理解している投資パートナーを得たいと思っていました」と語る。「Founders Fundと並んで、MaC Venture CapitalやRealize Tech Fundにも協力してもらえたことは幸運でした。両ファンドのおかげで、シリコンバレーとハリウッドのベテランを組み合わせたユニークなファンドを得ることができました」。

ご想像のとおり、Wonder Dynamicsはこの資金を、エンジニアリングとVFXチームの規模を拡大し、製品のさらなる開発と拡張を行う……それがどういう製品であるにせよ。

まあ彼らのアドバイザリーボードがきちんと機能していれば、間違いを犯すことは難しいだろう。彼らは「私たちは、非常に幸運なことに、AIと映画の両方の分野から最も優秀な人材を迎えることができました」と彼らは語っているが、それは決して誇張ではない。現在のアドバイザリーボードに含まれているのは、Steven Spielberg(スティーブン・スピルバーグ)氏とJoe Russo (ジョー・ルッソ)氏(映画制作とイノベーションに関する明らかな天才)、UCバークレー校ならびにGoogleのAngjoo Kanazawa(アンジュ・カナザワ)氏とMITのAntonio Torralba(アントニオ・トラルバ)氏(ロボットと自律性に関する長年のAI研究者)、そして「会社をどのように前進させるかを考えているときに、豊富な知識を提供してくれる」映画界や金融界の数多くの人たちだ。

AIは多くのハイテク企業や企業の内部に深く組み込まれて、その業界ではしっかりとした収益源となっているが、クリエイター主導の映画やテレビの世界では、まだ縁遠い概念のままだ。それでも、「The Mandalorian(マンダロリアン)」の撮影に使用されたILMのStageCraft(ステージクラフト)のようなハイブリッド制作技術は、従来の3Dモデリングやゲーム制作に使用されていた技術が、映画制作にも十分適用できることを示している、それどころか場合によってはライブ配信さえも可能なのだ。NVIDIA(エヌビディア)やAdobe(アドビ)といった先駆者たちが示しているように、AIはますます世界の一部になってきていて、それが映画に取り込まれるのは必然のように思える。たとえそれが正確にはどのような形になるかを今いうのは難しいとしても。

関連記事:「マンダロリアン」シーズン2撮影用のリアル空間を創り出す巨大な高解像度LEDディスプレイをILMが公開

カテゴリー:人工知能・AI
タグ:映画VFX動画撮影 / 動画編集Wonder Dynamics資金調達エンターテインメント

画像クレジット:Wonder Dynamics

原文へ

(文:Devin Coldewey、翻訳:sako)

動画制作のために既存の楽曲を映像に合わせて自在に調整する「Dynascore」をYext共同創業者の新スタートアップが発表

Yext(イエクスト)の共同創業者でCEOを務めるHoward Lerman(ハワード・ラーマン)氏は、Wonder Inventions(ワンダー・インベンションズ)という新しいスタートアップを起ち上げ、米国時間4月8日にその最初のプロダクト「Dynascore(ダイナスコア)」を正式に発表した。

まずはDynascoreに注目してみよう。ラーマン氏によると、彼と彼のチームは、ますます需要の増えているビデオコンテンツが、しばしばストックミュージックに依存しているという問題を解決するために、このプロダクトを作り上げたという。ストックミュージックは、その性質上、特定のビデオや長さに合わせて作られていないため、映像にうまくフィットしなかったり、プロデューサーが音楽に合わせてビデオを編集しなければならなくなることがある。「曲を3秒だけ切り詰めて映像と組み合わせることなんてできない」からだ。

しかし、Dynascoreは、既存の音楽をどんな長さの映像にも対応させることが可能だ。また、音楽を調整して、トランジション、ポーズ、エンディングを好きな場所に配置することもできる。

ラーマン氏と彼のチームは、フィットネスのCMにさまざまな音楽を合わせ、CMの長さやトランジションの位置を調整して、その効果を実証してみせた。その度にDynascoreは、CMに適した新しいバージョンの楽曲を生成していく(ただし、映像に適していない楽曲を選んでしまった場合は、いくら調整しても無駄になってしまうという印象を受けた)。

そのために、Dynascoreはまず、曲を吟味して「音楽的に意味のある最小単位」にまで分解する。この単位は「morphone(モーフォン)」と呼ばれる。そして仕様に応じて、同社が「musicoherence(ミュージコヒーレンス:音楽的整合性)」と呼ぶものが最大化するように、これらのモーフォンを組み立てる。つまり、基本的に1つの実際の曲として聞こえるようにするのだ。

画像クレジット:Dynascore

ラーマン氏は、Dynascoreの技術はゼロから音楽を作ろうとするものではないと強調する。代わりにDynascoreは、人間が作曲した曲を用いる。そのために、パブリックドメインの名曲を集めたMasterworks(マスターワークス)と、約1000曲のオリジナル曲が用意されている。

「世の中には、AIを使って作曲する会社がたくさんあります」と、ラーマン氏は語る。「彼らはバッハやモーツァルト、ベートーヴェンの曲を使ってAIに学習させますが、そこから出てくる曲はゴミみたいなものです【略】。私たちが気づいた決定的なブレークスルーは、AIが映画の脚本や物語を書けないのと同じように、コンピューターは音楽を書けないということです。しかし、AIは、人間の耳が反応するように音楽を再構築することはできます」。

Dynascoreの価格は、無料トライアルの後、月額19ドル(約2080円)からとなっている。MacおよびWindows用のデスクトップアプリの他、映像編集ソフト「Adobe Premiere Pro(アドビ・プレミアプロ)」の機能拡張としても提供されている。Developer APIも構築されており、ビデオビルダーのBiteable(バイタブル)やマーケティング制作ツールのRocketium(ロケッティアム)など、他のアプリケーションとの統合も進められている。

Dynascoreは、Wonder Inventionsの最初の製品に過ぎず、同社では今後もさまざまな製品を開発していくと、ラーマン氏は語っている。

画像クレジット:Dynascore

「私たちは、たった1つのアイデアのためにWonder Inventionsを始めたわけではありません」と、ラーマン氏はいう。「Wonder Inventionsは、私たちがこれまでに出会った中でも最もクリエイティブで優秀な20人の熟練した発明家であり、彼らが相乗効果を発揮して多くの製品を開発していくことになるでしょう」。

ラーマン氏自身は、YextのCEOを続けながらWonder Inventionsの会長を務めており、これをフルタイムの仕事と表現している。クールなものを作るというその先に、会社としての統一されたビジョンがあるのかという質問には「30年前に人々がビジネスを始めるといえば、それは会社のことでした。今は会社を始めるといえば、それは製品のことです」と答え、ベンチャーキャピタルが単一のスケーラブルなアイデアを重視する傾向にあることを指摘した。

「Dynascoreに出資するベンチャーキャピタルはいないと思います。あまりにも風変わりなものですし、TAM(獲得可能な最大市場規模)を見て、『これが数十億ドル(数千億円)規模のカテゴリーになるとは思えない』という人もいるでしょう」と、ラーマン氏は続けた。彼自身はこの評価に必ずしも異論があるわけではないとしつつ「最初の製品としてはすばらしいものになるでしょうし、さらにヒットする製品が出てくるでしょう」と付け加えた。

関連記事:

カテゴリー:人工知能・AI
タグ:YextWonder Inventions音楽制作Dynascore

画像クレジット:maxkabakov / Getty Images

原文へ

(文:Anthony Ha、翻訳:Hirokazu Kusakabe)

AIチャットボット「りんな」を手がけるrinnaが日本語特化のGPT-2大規模言語モデルをオープンソース化

AIチャットボット「りんな」を手がけるrinnaが日本語特化のGPT-2大規模言語モデルをオープンソース化

AIチャットボット「りんな」などを手がけるrinna(リンナ)は4月7日、日本語に特化したGPT-2の大規模言語モデルを構築し、GitHubおよびNLPモデルライブラリー「HuggingFace」において、トレーニングコードと言語モデルをオープンソースソフトウェアとして公開した。

また今回公開したモデルは、GPT2-mediumと定義される中規模サイズのものという。今後、パフォーマンスとコストのトレードオフに基づいてユーザーおよび研究者が最善の選択を行えるよう、異なるサイズのモデルも公開する予定。異なるデータでトレーニングした新しいモデルの公開も計画している。

rinnaの研究チームが開発している大規模な言語モデルは、すでに同社プロダクトに広く使用されているという。同社は今後も、異なるテキストスタイルや異なるデータ量を含む、より高精度でより大規模な言語モデルの研究開発を続け、AIチャットボットの能力を高めるとしている。また、日本語の研究コミュニティのために、これらのモデルのオープンソース化を行う。

日本語GPT-2モデルの機能

言語モデルとは、言語データの機械学習を基に、会話や文章の「人間が使う言葉らしさ」を確率としてモデル化したもの。GPT-2の場合は、単語レベルの確率の組み合わせから文の確率を計算する言語モデル(自己回帰言語モデル)を採用している。

例えば、「確率(吾輩は猫である) = 確率(吾輩) × 確率(は|吾輩) x 確率(猫|吾輩,は) × 確率(で|吾輩,は,猫) × 確率(ある|吾輩,は,猫,で)」のような方法で推定を行う。この能力を使って、GPT-2は「吾輩は猫で」という接頭辞(Prefix)を与えられたとき、確率の推定から次にくる単語として「ある」を選択し、文章を自動生成する。

今回rinnaが公開した日本語GPT-2モデルは、一般的な日本語テキストの特徴を有した高度な日本語文章を自動生成できる。ユーザーおよび研究者は、特定のテキストデータを微調整して、このモデルから独自のモデルを作成することも可能としている。

例えば、Prefixとして「誰も到達していない人工知能の高みへ、ともに」という文章が与えられたとき、特定のコンテキスト(デモ1:講演の感想、デモ2:書籍の紹介)で応答文を生成するように、微調整できるという(掲載した画像のデモは生成する文章の文字数上限を設定しており、実際に生成される全文ではない)。

デモ1:講演の感想のコンテキストで文章生成

デモ1:講演の感想のコンテキストで文章生成

デモ2:書籍の紹介のコンテキストで文章生成

デモ2:書籍の紹介のコンテキストで文章生成

rinnaの日本語GPT-2モデルの特徴

rinnaの日本語GPT-2モデルは、トレーニングデータとしてCC-100のオープンソースデータを使用しているという。

またNVIDIA「Tesla V100 GPU」を用いて、70ギガバイトの日本語テキストを約1カ月の長期間にわたってトレーニングしたそうだ。その結果同モデルは、約18 perplexityという性能を達成した。この「18perplexity」は、GPT-2モデルが前に与えられた単語から次の単語を予測するときに、正しいものを含む18のオプションだけを残せるという性能を意味するという。モデルは十分にトレーニングされており、汎用性があるとしている。

rinnaは、Microsoft(マイクロソフト)のAI&リサーチ部門でAIチャットボットの研究を行っていたチームがスピンアウトして2020年6月に設立したAI開発企業。ディープラーニング技術を活用し、AIが文脈に応じた会話文を自動生成して人間と自然に会話する「共感チャットモデル」、AIが話し声や歌声で豊かな感情表現を可能にする「音声合成システム」などの技術を発表している。

これらの最新技術は、同社運営のAIチャットボット「りんな」や、会話内容や音声表現をカスタマイズしてキャラクター性を持たせたAIチャットボット「AIキャラクター」の開発に応用しており、企業のマーケティングなどに採用されているという。

同社は、製品開発のための自然言語処理(NLP)の実験過程で、日本語に特化したGPT-2の大規模言語モデルを構築。日本語のNLP研究コミュニティに貢献するために、開発した言語モデルと、研究者が自分のマシンで実験結果を再現するためのトレーニングコードを、GitHub、およびNLPモデルライブラリHuggingFaceで、オープンソースとして公開した。

関連記事
ウイルスの突然変異予測からClubhouse話者識別まで、今、人工知能に期待されていること
Copy.aiのAI利用記事作成システムは「使える」レベルの驚異的な出来、日本語も対応
テキストアドベンチャー「AI Dungeon」のLatitudeが「無限の物語」を生み出すゲーム制作のために3.5億円調達
OpenAIのDALL-Eは言葉による指示で「それらしい」画像を作り出す
LINEがOpenAI「GPT」・Google「T5」同様の超巨大汎用言語モデルをNAVERと共同開発、世界初の日本語特化
日本語音声合成向けに東京式アクセントを自動推定する自然言語処理ソフト「tdmelodic」がオープンソース化
OpenAIがテキストベースのAI機能利用が簡単になる汎用APIを開発
マイクロソフトはOpenAIと協力してAzure上に世界第5位となるスーパーコンピューターを構築
OpenAIは非常に優れたテキストジェネレータを開発したが、そのままリリースするのは危険すぎると考えている

カテゴリー:人工知能・AI
タグ:OpenAI(組織)自然言語処理 / NLP(用語)GPT / Generative Pretrained TransformeGPU(用語)ディープラーニング / 深層学習(用語)Microsoft / マイクロソフト(企業)日本(国・地域)

AIにシンプルな可観測性を持たせるイスラエルのAporiaがシード資金5.5億円調達

機械学習のモデルは、与えるデータの量や質で良し悪しが決まる。特に訓練のときにそういえるが、モデルはプロダクションの質も左右する。現実の世界では、新たな事象が起きるたびにデータそのものが変わり、データベースやAPIの報告やデータ保存の小さな変化でも、モデルの反応に影響することがある。そんなときMLのモデルは平然と間違った予測を与え、エラーを投げないため、そういうシステムではデータのパイプラインを監視することが絶対に欠かせない。

そしてそこに、Aporiaのようなツールが登場する。テルアビブに本社のある同社は米国時間4月6日、同社のMLモデル監視プラットフォームに500万ドル(約5億5000万円)のシード資金を調達したことを発表した。投資家はVertex VenturesとTLV Partnersだ。

画像クレジット:Aporia

Aporiaの共同創業者でCEOのLiran Hason(リラン・ヘイソン)氏は、イスラエル国防軍に5年間在籍し、その後はずっとAdallomのデータサイエンスチームにいた。セキュリティ企業の同社を、2015年にMicrosoftが買収した。買収の後、彼はベンチャー企業Vertex Venturesに入り、2019年にAporiaを始めるまでそこにいた。しかし今、Aporiaが解決しようとしている問題に彼が初めて出会ったのは、Adallomにいたときだ。

Adallomでの経験に関して「私は機械学習のモデルのプロダクションアーキテクチャを担当していました。だから、モデルをプロダクションに持ち込んだときに起きるありとあらゆるサプライズを初めて体験したのは、そこででした」とヘイソン氏は語る。

ヘイソン氏の説明によると、Aporiaの目標はエンタープライズによる機械学習モデルの実装を容易にし、AIの力を責任あるやり方で利用することだという。

「AIはとても強力な技術だが、従来のソフトウェアと違いデータへの依存が極めて大きい。AIのもう1つのユニークなところは、とてもおもしろいことだが、失敗するときに黙って失敗することだ。例外もエラーも何も出ない。だからAIは実に厄介であり、特に一旦プロダクションに入れば、モデルの訓練時のようなデータサイエンティストによる完全なコントロールがないため、なおさら厄介です」とヘイソン氏は語る。

しかもヘイソン氏によると、プロダクションシステムはサードパーティーのベンダーからのデータに依存しているかもしれないし、そのベンダーがある日、誰にもいわずにデータのスキーマを変えるかもしれない。そうなると、モデルの信頼性は完全に壊れる。銀行の顧客のローンが債務不履行になるという予測もできなくなり、数週間か数カ月後に実際に不履行になってから気づくことになる。

Aporiaは絶えず、入ってくるデータの統計的特性を調べ、それが訓練セットからあまりにも乖離してきたらユーザーに警報する。

そしてAporiaがユニークなのは、ユーザーにほとんどIFTTTやZapier的なグラフィカルなツールを提供して、モニター(監視系)のロジックをセットアップさせることだ。納品時にはモニターの50ほどの組み合わせであらかじめ構成されており、それらの楽屋裏での仕事ぶりを完全に可視化する。また企業はこれらのモニターの振る舞いを、特定のビジネスケースやモデルに合わせて微調整できる。

最初チームは、ジェネリックなモニタリングソリューションを構築できると考えていた。しかしチームが悟ったのは、そんなものを目指したら非常に複雑な仕事になるだけでなく、これからモデルを構築するデータサイエンティストが、モデルの仕事の仕方と必要事項をモニタリングのソリューションから正確に知らなければならない。

TLV Partnersの創立パートナーであるRona Segev(ロナ・セゲフ)氏は、「プロダクション(本番時)のワークロードのモニタリングは、ソフトウェア工学の実践としてすでに確立しており、機械学習を同じレベルでモニタリングすることもかなり前に確立しています。Aporiaのチームには強力なプロダクションエンジニアリングの経験があり、そのために彼らのソリューションはシンプルで安全で堅牢なものとして傑出しています」と語る。

カテゴリー:人工知能・AI
タグ:Aporia機械学習イスラエル資金調達

画像クレジット:Aporia

原文へ

(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)

とにかく時間がかかるAIモデルの構築とトレーニング、展開をサポートする台湾のMLOpsの「InfuseAI」が約4.7億円調達

AIモデルの構築とトレーニングには時間がかかり、さらに組織のワークフローへの展開にも時間がかかる。ここにMLOps(Machine Learning Operations、機械学習オペレーション)の企業が参入し、AIテクノロジーをスケールする顧客を支援するチャンスがある。米国時間4月5日、台湾を拠点とするMLOpsスタートアップのInfuseAIがシリーズAで430万ドル(約4億7000万円)を調達したと発表した。このラウンドを主導したのはODMメーカーのWistron Corporationで、Hive Ventures、Top Taiwan Venture Capital Group、Silicon Valley Taiwan Investmentsが参加した。

InfuseAIは2018年に創業した。同社によれば台湾でのMLOpsソリューションの市場規模は年間3000万ドル(約33億円)で、調査会社のCognilyticaは2025年までにグローバルでおよそ40億ドル(約4400億円)の市場に成長すると予測している。InfuseAIの顧客には台湾最大クラスの銀行であるE.SUN(玉山銀行)やSinoPac Holdings、Chimeiなどがある。

InfuseAIは機械学習モデルのトレーニング環境、クラウドまたはオンプレミスのクラスタコンピューティング(Kubernetesのコンテナオーケストレーションなど)、チーム向けコラボレーションツールを含むプラットフォームであるPrimeHubというターンキーソリューションで、モデルの展開と管理を支援する。もう1つ別のプロダクトとして、AIモデルのトレーニング、展開、アップデート、監視ができるPrimeHub Deployがある。

Hive Venturesの創業者でマネージングパートナーのYan Lee(ヤン・リー)氏は報道発表で「製造業、ヘルスケア、金融などの企業がAIのオペレーションやモデルの展開をスケールしたいと考える中で、開発者とデータサイエンティストがシームレスにコラボレーションできるInfuseAIのようなプラットフォームが求められています。InfuseAIは、企業の採用サイクルの中で使われるプラットフォームとソフトウェアに力を入れるという我々の投資の方針にぴったりと一致しています」と述べた。

カテゴリー:人工知能・AI
タグ:InfuseAI資金調達機械学習台湾MLOps

画像クレジット: shulz / Getty Images

原文へ

(文:Catherine Shu、翻訳:Kaori Koyama)

「チャットコマース」と「接客DX」のZealsが総額18億円を調達、株式上場の準備を開始

「おもてなし革命」を掲げ、「チャットコマース」と「接客DX」を展開するZeals(ジールス)は4月1日、第三者割当増資および金融機関からの融資、コミットメントライン契約締結とを合わせて総額18億円の資金調達を発表した。引受先は、Zホールディングス傘下のZ Venture Capital、電通グループ、HAKUHODO DY FUTURE DESIGN FUND(博報堂DYグループのCVC博報堂DYベンチャーズが運営するファンド)、ジャフコ グループ。またジールスは、株式上場の準備を開始した。

今回調達した資金は、事業領域拡大に伴う投資および全職種における採用活動の強化、プロダクトの開発体制構築、マーケティング活動への投資などにあてる。

「チャットコマース」と「接客DX」のZealsが総額18億円を調達、株式上場の準備を開始

同社は、チャットボットの技術をマーケティングに生かした「チャットコマース」と、チャットボットをビデオ接客ツール・予約システムといった一連の接客サービスと連携させる「接客DX」を展開。これら事業は非接触・非対面でのコミュニケーションが求められる時代に、日本が世界に誇る「おもてなし」をデジタル化することであり、その挑戦を加速すべく資金調達を実施したという。

チャットコマースは、チャットボットと会話しながら商品が購入できるサービスで、導入先は約400社、エンドユーザーはのべ430万人、会話分析データ数は4億5000におよぶという(2021年3月現在)。資産化したデータを活用することで、ユーザーに寄り添ったコミュニケーションを可能とし、顧客のマーケティング戦略に貢献しているとした。

テクノロジーの力で新たな顧客体験と産業モデルの構築を目指す「接客DX」は、無人化や効率化を図るためのツールではなく、AIと人の統合ソリューションという。オンラインでも感動や温かみのある接客体験を実現することを可能とし、旅行業界や自動車業界への導入事例をはじめ、様々な業界から注目を集めているそうだ。

関連記事
LINEトーク上で決済まで完結する“チャットコマース”拡大へ、チャットボット開発のZEALSが3.5億円を調達
会話でニーズを“あっためる”、チャットボット広告のZEALSが4.2億円調達
チャットボットだけではダメ――CRMを加えて新展開のZEALSが約8000万円を調達
メディア向けボット開発運用ツール「BOT TREE for MEDIA」が正式ローンチ

カテゴリー:人工知能・AI
タグ:資金調達(用語)Zeals(企業)チャットボット(用語)日本(国・地域)

グーグルが個人の書類をデジタル化して重要な情報を抽出するアプリ「Stack」を公開

米国時間3月30日、Google(グーグル)の社内インキュベーターであるArea 120がStackという最新のプロジェクトを公開した。Stackは書類やレシートなど家中に散らばっている紙をデジタル化し、自動でGoogleドライブに保存するアプリだ。さらにこのアプリはスキャンした書類の名前と適切なカテゴリー、つまり「スタック」(束)を推測する。

Stackで請求書やレシート、身分証明書など、さまざまな大きさの書類をスキャンし、PDF化して整理できる。そしてファイルに含まれる重要な情報がAIテクノロジーで詳細に読み取られる。

Stackのアイデアを考えたのは、EdTechのスタートアップで2018年にグーグルに買収されたSocraticの共同創業者であるChristopher Pedregal(クリストファー・ペドレガル)氏だ。

関連記事:Googleがモバイル学習アプリSocraticを買収してiOS版を再提供

Socraticではグーグルのコンピュータビジョンと言語理解テクノロジーを活用して高校生の学習を支援していたとペドレガル氏はいう。同氏はグーグルでこのテクノロジーを書類の整理にもっと活用するにはどうすればいいかと考え始めた。このアイデアを実験するために、同氏はMatthew Cowan(マシュー・コーワン)氏と組んだ。2人はまず、膨大な書類を分析するAIテクノロジーを手がけるGoogle CloudのDocAIチームで仕事をした。

2人は企業向けのDocAIのテクノロジーを個人の書類にも応用できると考え、これがStackの開発につながった。

StackアプリはAndroid版が米国で公開された。書類の写真を撮るとアプリが自動で書類に名前を付け、適切なカテゴリーのスタックに入れる。カテゴリーには請求書、銀行、家、身分証明書、入国、保険、法律、医療、ペット、レシート、税金、旅行、クルマ、仕事などがある。

1件の書類をスキャンする際に複数のページを含めるとStackは書類内のページをすべてOCR処理するので、全文を検索できる。重要な書類にすぐアクセスできるように星をつける機能もある。

写真を撮ってすばやく書類をデジタル化する機能は目新しくはない。例えばMicrosoftは何年も前からOffice Lensを提供している。しかしStackでは請求書の「期限」や「合計金額」「口座番号」といった重要な情報を書類の中から認識できるようになる予定だ。認識された情報が取り出されて後から見つけやすくなる。

書類のタイトルだけでなく全文を検索して必要な情報を見つけられる。Stackの書類を守るためにGoogleドライブと同様に指紋か顔で保護したり、スキャンした書類をすべて自動でGoogleドライブに同期することもできる。

アプリは現在Android版が公開されている。ダウンロードは無料でアプリ内購入もない。iOSなど他のプラットフォームにもStackを展開するかどうかは、ユーザーのフィードバックで決める予定だ。

カテゴリー:人工知能・AI
タグ:GoogleArea 120スキャン

画像クレジット:Google

原文へ

(文:Sarah Perez、翻訳:Kaori Koyama)

名古屋大学発AIスタートアップのトライエッティングが3.5億円を調達、東急不動産HDと業務提携

名古屋大学発AIスタートアップのトライエッティングが3.5億円を調達、東急不動産HDと業務提携

名古屋大学発AIスタートアップのトライエッティング(TRYETING)は3月30日、第三者割当増資およびデットファイナンス(借入金)による総額約3億5000万円の資金調達を発表した。引受先は、東急不動産ホールディングス(東急不動産HD)が取り組むTFHD Open Innovation Program、エンジェル投資家。デットファイナンスは三菱UFJ銀行から。

また、東急不動産HDグループのDX推進および新規事業創出を目的に、東急不動産HDと業務提携を行ったと発表した。

2016年6月設立のトライエッティングは、多種多様なアルゴリズムを搭載するノーコードAIクラウド「UMWELT」を主とした「知能作業」を自動化する名古屋大学発AIスタートアップ。また自動シフト作成AIクラウド「HRBEST」はじめ、AIを活用した需要予測、在庫生産管理、マテリアルズインフォマティクスなどでも実績を持つという。

東急不動産HDとの業務提携については、UMWELTを活用することで、同グループの様々な業務のDX化およびグループの幅広い事業領域へのAI活用による新規事業創出を目指す。

TFHD Open Innovation Programは、東急不動産HDがベンチャー企業やスタートアップへの支援や協業の体制を充実させ、新たなグループシナジーの創出と渋谷を中心とした街の活性化を加速するために2017年に設立したプログラム。

関連記事

ノーコードビジネスインテリジェンスサービスのy42が3.2億円のシードラウンドを実施
コードレスデータベースのAirtableがシリーズEで約290億円調達、評価額は約6300億円に
ノーコードの自動化ツールZapierがノーコード教育サービスとコミュニティのMakerpadを初めての企業買収で合併
マイクロソフトがExcelの数式からヒントを得たオープンソースの新ローコード言語「Power Fx」発表
ローコードに注力するOutSystemsが1兆円の評価額で158.8億円を調達
コード不要でさまざまなeコマースツールを利用可能にするPipe17が約8.5億円調達
ノーコードのE2Eテスト自動化プラットフォーム「Autify」がモバイルアプリ対応版を提供

カテゴリー:人工知能・AI
タグ:資金調達(用語)トライエッティング(企業)名古屋大学(組織)ノーコード(用語)日本(国・地域)

ウイルスの突然変異予測からClubhouse話者識別まで、今、人工知能に期待されていること

2021年2月に開催された「『自然言語処理(NLP)』の可能性 -コロナ禍のウイルス対策から、感情を理解する音声認識まで-」というイベントで、AppierのAIチーフサイエンティストであり、台湾国立精華大学准教授でもあるMin Sun(ミン・スン)氏が登壇、昨今のAI技術のトレンドやそのユースケースについて解説した。今回はそのレポートをお届けする。

ミン氏は、世界での人工知能に関する論文を学会で多数発表しており、2015年から2017年までCVGIP(Computer Vision Graphics and Images Processing)より最優秀論文賞を3年連続で受賞している。今回、ミン氏は、新型コロナウイルス関連でのAIの活躍と、AI系でトップクラスの学会であるVirtual NeurIPSで近年注目されている自然言語処理技術の2点について語った。

新型コロナウイルス関連において、AIはフェイクニュース検知だけでなく、医療分野でも活躍している。ウイルスの突然変異検知や新薬生成では、GoogleのDeepMindによって開発された人工知能プログラムAlphafoldが注目されている(2020年にはバージョン2が開発されている)。また、生物医学領域においてタンパク質構造を記憶することで異変のある配列を持つアミノ酸を検知し、新型コロナウイルスの突然変異の判別や予測が可能だという。さらにX線結晶学を組み合わせることで、従来より5万倍早い速度で抗ウイルス薬を検証できるとのこと。

患者が重度の場合、検証、対策はしやすいが、軽度や無症状患者の場合、ウイルスの突然変異は予測が難しく、軽度や無症状患者を介した爆発的拡大は防ぎづらい。しかしAIによる突然変異検知が進むことで、このパンデミック防止も防げるのではないかと考えられている。

自然言語処理技術の話題について、ミン氏は2つの技術を紹介した。トップクラスの学会であるNeurIPSの2020年開催分でBest Paperにも選ばれた、GPT-3(Generative Pretrained Transformer)という文章生成言語モデルが現在、注目されている。これはElon Musk(イーロン・マスク)氏やMicrosoftが出資する非営利団体OpenAIが制作しており、一つ前のモデルであるGPT-2と比較すると、事前学習に使用されるテキストデータは約1100倍となる45TB、パラメータ数は約117倍の1750億個と、データセットが飛躍的に大きくなっている。事例を少し与えただけで、続きの文章をまるで人間が書いたかのように自然に生成してくるとエンジニアの間で話題になった。

そんなGPT-3を超えると注目を集めているのが、Googleの研究者たちが集結するGoogle Brain Teamが発表した、1兆個を超えるパラメータを持つことができると言われているNLP AIモデル、Switch Transformerだ。その特徴は、処理のところどころにゲーティングネットワークを置き、与えられた処理を最も効率的に行ってくれそうなエキスパートと呼ばれる特化型FFN(Feed Forward Network)に聞きに行くこと。FFNは順伝播型ニューラルネットワークと訳され、一方向に処理を進める。戻りがないため再帰型と比較し処理が速くなるが、これによって従来より7倍以上の事前トレーニングの高速化が可能だと言われており、実際、研究者たちがSwitch Transformerを用いて、一部の単語をマスクした状態で欠落した単語を予想するなどのトレーニングを行ったが、不安定性がないという。

Real time Voice Cloningの操作画面キャプチャ

Min Sun(ミン・スン)氏

自然言語処理能力の向上は、音声解析分野での期待が大きい。コロナ禍で自宅で過ごす時間が多くなり、ポッドキャストや音声SNSのClubhouseの利用者は増加。従来、話者が複数で長時間録音された音声データの書き起こしは要素が多すぎることもあり難しいとされてきたが、大規模処理モデルを用いれば、その処理や新たな音声コンテンツの作成も期待できるという。例として、Real time Voice Cloningを使用することで、リアルタイムに音声をコピーし、別の話者の声に変換することもできるという。

今後もAIの進化、そしてAIが叶える未来に期待が膨らむ。

カテゴリー:人工知能・AI
タグ:Appier新型コロナウイルス自然言語処理

コンピュータビジョンを活用した建設現場自動監視プラットフォームの香港「viAct」が約2.2億円調達

香港を拠点とするviActは、コンピュータビジョン、エッジデバイス、モバイルアプリを組み合わせたAIベースのクラウドプラットフォームで建設現場を24時間監視できるようにしている。米国時間3月24日、同社はSOSVとVectr Venturesが共同で主導したシードラウンドで200万ドル(約2億1800万円)を調達したことを発表した。このラウンドにはAlibaba Hong Kong Entrepreneurs Fund、Artesian Ventures、ParticleXも参加した。

2016年に創業したviActはアジアとヨーロッパで建設業界の30社以上の企業にサービスを提供している。今回の資金はR&D、プロダクト開発、東南アジア諸国への事業拡大に使われる予定だ。

このプラットフォームではコンピュータビジョンを使って潜在的な危険箇所や建設の進捗状況、機材や建材の場所を検出する。そしてリアルタイムでモバイルアプリにシンプルなインターフェイスのアラートが送られる。共同創業者でCEOのHugo Cheuk(ヒューゴ・チュク)氏はTechCrunchに対し、アラートは「騒々しく動きの多い環境で仕事をしているため詳細なダッシュボードを見るのが難しい」ことの多い技術者用にデザインされていると説明した。

現場の監視のためにviActと契約した企業はコロナ禍でのソーシャルディスタンスの基準を守らなくてはならないため、viActは企業がすぐに利用を開始できるようにZoomでのトレーニングを提供した。

チュク氏によれば、東南アジアではインドネシアとベトナムで最初に利用されたという。スマートシティと新しいインフラストラクチャを作る政府の計画により、新たな建設プロジェクトが今後5〜10年間で増えるからだ。デベロッパーがAIベースのテクノロジーを取り入れたいと考えることから、今後シンガポールにも進出するという。

報道発表の中で、SOSVのパートナーでChinacceleratorのマネージングディレクターであるOscar Ramos(オスカー・ラモス)氏は「コロナ禍でデジタルトランスフォーメーション(DX)が加速し、建設など古くからある業界は生き残りに不可欠な変革を急いでいます。viActは業界の価値を上げるプロダクトを作り、しかも顧客からの信頼を得て採用を加速しています」と述べた。

カテゴリー:人工知能・AI
タグ:viAct資金調達香港建設コンピュータービジョン

画像クレジット:viAct

原文へ

(文:Catherine Shu、翻訳:Kaori Koyama)

機械学習のモデルをデバイスごとに最適化してスピードを上げるOctoMLがシリーズBで30億円相当を調達

シアトルのスタートアップOctoMLは、オープンソースのコンパイラーフレームワークプロジェクトApache TVMを利用する機械学習の加速化プラットホームを提供している。同社は今日(米国時間3/17)、AdditionがリードするシリーズBのラウンドで2800万ドルを調達したことを発表した。以前からの投資家であるMadrona Venture GroupとAmplify Partnersもこのラウンドん参加し、これで同社の調達総額は4700万ドルになった。同社のこの前の調達は2020年の4月で、そのときはAmplifyがリードするシリーズAのラウンドが発表された。

TVMの作者たちがTVMを商用化するために作ったOctoMLは、デベロッパーが持ち込んだモデルのパフォーマンスを、使用するクラウドやエッジデバイスに合わせて最適化する。OctoMLの共同創業者でCEOのLuis Ceze氏はブラジル出身で、氏によるとシリーズAを調達してから同社は、一部のアーリーアダプターを同社のSaaSプラットホーム「Octomizer」へオンボーディングしてきた。


画像クレジット: OctoML

氏によると、「まだアーリーアクセスだが待機者リストへの登録はすでに1000名近い。今回の資金調達に踏み切ったのは、それも大きな要因だ。シリーズBは先買であり、新株も含め既存の株が対象ではない。私たちは、新たな資金の調達を開始するタイミングを計画していた。シリーズAの資金は、今ごろやっと支出を開始したばかりで、ほとんど残っている。でも今は成長が急激で有料顧客も予想より多いから、市場開拓や、顧客成功チームの編成、エンジニアリングチームを拡張して新しい機能を作っていくなど、新たな資金を要する課題が至近距離内に見えてきた」、という。

Ceze氏によると、TVMの周辺にも強力な成長の兆しがあり、昨年はバーチャルカンファレンスに約1000名が参加した。同社の顧客ベースは、待機者リストに載ってる企業も含めて、非常に多様な業界にまたがっている。防衛産業や金融サービス、ライフサイエンス、自動車会社、そしてさまざまなスタートアップなど、きわめて多種多様だ。

また、OctoMLは最近、顧客でもあるMicrosoftや、Qualcomm、AMDなど業界の大物と組んでオープンソースのコンポーネントの構築と、同社のサービスをもっと広範なモデルに対して最適化する作業に取り組んでいる。広範なモデルという言葉には、もっと大きなモデルという意味も含まれている。

関連記事: Deep Science: Using machine learning to study anatomy, weather and earthquakes(未訳、有料記事)

エンジニアリングという点ではCezeによると、これまでのようにモデルの最適化とチューニングだけでなく、訓練の工程も視野に入れている。MLのモデルの訓練は、あっと言う間に費用がかさむから、その工程のスピードアップは節約に貢献する。だからそれは、OctoMLにとっても売りやすいサービスだ。Ceze氏によると、この方面でのプランは、人びとが自分のMLの訓練とその結果としてのモデルを最適化できる、エンドツーエンドのソリューションを提供し、そしてそれらのモデルを彼らが選んだプラットホームへプッシュする。今現在、そのユーザーはOctomizerが作る出力を自分でデプロイしなければならない。しかしそのデプロイのサポートはすでに、OptoMLのロードマップにある。

Additionの創業者であるLee Fixel氏が、投資家としての見方を語る: 「LuisとOctoMLのチームに初めて会ったとき、彼らがMLのモデルのデプロイのやり方を変えようとしていることが分かった。彼らにはビジョンがあった。そして大企業に対してもMLの変化を推進できる才能と技術もあった。6か月前にOctomizerをローンチしてからは、デベロッパーやデータサイエンティストたちがMLのモデルのパフォーマンスを上げようするとき必ず使うソリューションになりつつある。同社の今後の成長をサポートしていくことが楽しみだ」。

関連記事: 機械学習モデルをさまざまなハードウェアに合わせて最適化するOctoMLが16億円相当を調達

(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)

画像クレジット: VCG/VCG/Getty Images

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

AI利用記事作成システムのGPT-3は驚異的テクノロジーだった

TechCrunchは先程、AI利用のライティングサービスを提供するCopy.ai資金調達ラウンドに成功したことを取り上げた。このスタートアップはGPT-3を利用してエンタープライズ・ユーザーの記事、文章作成プロジェクトを支援する。GPT-3はGenerative Pre-trained Transformer 3の(生成的事前学習トランスフォーマー)の頭文字で、OpenAIが開発したAIシステムだ。これはユーザーからテキストを受け取りユーザーに代わって非常に多様な文章を生成することができる。

Copy.aiの資金調達ラウンドを取材する際に私はAIによる文章作成を実際に試してみた。その結果、非常に魅力的なアイデアだと感じた。以前からコンピュータによる文章作成の自動化に対していわれない恐怖感などはもっておらず、むしろ好奇心を抱いていた。インタビューしたときにCopyチームは「GPT-3は優れたAIライティングツールです」と主張したので興味を持ったわけだ。

この好奇心を満たすためには実際に使ってみるのが手っ取り早い。そこで今朝、CopyのライバルであるHeadlimeと比較しながら利用してみた。結論から言えば、CopyのチームがGPT-3テクノロジーをベースに作り上げたプロダクトにはすばらしい能力があるという印象を受けた。

GPT-3はもちろん提供された素材を拡大して記事を作成できる。 しかしこのテクノロジーはそれ以上のことができる。 GPT-3を搭載したHeadlimeアプリは十分に中程度の出来栄えと評価できる記事を書くことができた。それだけでなく、素材を取材したときに私の頭の中にあったが、提供した素材そのものでは触れいなかったコンセプトが表現されていた。

このあたりは微妙な部分でうまく説明するのが難しい。Headlimeを初めて使用したときにGTP-3が自らどういう判断を下したのか実例を見てもらうしかないだろう。現在の株式市場のトレンドについてわざと素材の事実だけを提供してシステムがそれをどう処理するか試してみた。

 

つまりカルシウム含有量の高い棒に肉をくっつけた二足動物である私は、シリコン素材のコンピューターより知的に圧倒的に優れていることが証明きるのではないか思ったわけだ。実のところ、素材情報には最低500文字が必要とわかり、規定の長さを埋めるために少しばかり無駄口をきいた。

 

さあ次のステップだ。ボタンを押すと私が作成を求めている記事のタイトルの候補がいくつか表示された。正直なところどれもかなり的確だった。

 

このあたりで私は「これはいいんじゃないかな?」と思い始めた。

最初の候補がいいと思ったので見出しが気に入ったのでそれを選び、作業を進めた。次は記事のリード部分をまとめる作業だ。普段なら頭を使う作業だかこの場合はクリックするだけだ。

 
ここで提示された別の選択肢は以下の通り。

 

これも悪くなかった。

印象的だったのはそれぞれの選択肢が単に言葉づかいの細部を変えただけのものではなかったことだ。システムに私が入力したかなりいい加減な500文字の異なる部分に焦点を当て構文レベルから異なる文章となっていた。GPT-3にはもう少し良い素材を与えるべきだったのではないかと感じた。システムは非常に頑張っていたが、実は私はそうではなかった。
 
リード部分を確定した後、ある種のCMS的なものが登場し、リード部分の後に本文を書くことを要求された。私はすでにシステムの謙虚な下僕状態で喜んで引き受けたが、すぐにシステムが私の執筆を止め、後を引き継ぐと申し出た。

 
無料トライアルだったので2クレジットというのがいくらに相当する処理量なのかまったく判断でできなかったが、ともあれWrite for meというボタンを押した。その結果が次の記事だ。

 
私はダッシュを含むわかりにくい文章を素材として入力してしまったが、このソフトはどう処理したか見ていこう。さすがにダッシュには手こずったようだが、すぐに元に戻り、「金利の上昇によってベンチャーキャピタルのような非伝統的でリスクの高い投資クラスは魅力を失う」と正しく論じた。私は仰天した。

私はこの後もGPT-3のテクノロジーやベースにした製品をさまざまな角度から試していくつもりだ。レポートを期待していただきたい。しかし今はとりあえず立ち止まって新しい有望なテクノロジーを発見した喜びをシェアしたい。正直、これはすごい。新しいテクノロジーに驚かされたのは久々だ。GPT-3、よくやった。きみはすごいぞ。

画像:Possessed Photography ( Unsplash (Image has been modified)

原文へ

カテゴリー:
タグ:

(文:Alex Wilhelm 翻訳:滑川海彦@Facebook

企業向けノーコードAIプラットフォームのNoogataがシードラウンドで約13億円を調達

米国時間3月16日、企業向けノーコードAIソリューションを提供する2019年創業のNoogataが、シードラウンドで1200万ドル(約13億円)を調達したと発表した。このラウンドを主導したのはTeam8で、Skylake Capitalが参加した。NoogataはColgateやPepsiCoなどの企業に利用されている。Noogataは現在、eコマース、小売、金融サービスを対象としているが、今回調達した資金で製品開発を推進し新たな業界に拡大したいとしている。

Noogataのプラットフォームでは、事前にほとんどが設計されたAI構築用ブロックが提供され、企業のデータウェアハウス、SalesforceやStripeなどのデータソースといった他社ツールに接続できる。例えばeコマースの販売業者はNoogataプラットフォームからの提案で価格設定を最適化でき、実店舗ではある店舗にどのような品揃えをするかの計画を立てるのに役立つだろう。

画像クレジット:Noogata

Noogataの共同創業者でCEOのAssaf Egozi(アサフ・エゴジ)氏は次のように語る。「データチームはデジタルトランスフォーメーションの中心であり、影響力を持つにはデータチームがデータの価値を自由に利用できることが必要だと確信を持っています。信頼性が高く最新で、関連性があり継続的で説明可能なインサイトや予測にアクセスできなくてはなりません。Noogataは、企業のデータ環境とシームレスに統合してアクション可能なインサイトや予測、提案を生成する、状況に対応できるビジネス向けブロックを提供して、データの価値の可能性を広げます。ユーザーはセルフサービスの分析やデータソリューションでAIを活用して、従来のビジネスインテリジェンスをはるかに超えることができます」。

画像クレジット:Noogata

最近、この分野のスタートアップが多すぎるほどであることは明らかだ。データの急増、そしてデータウェアハウスの利用により、企業は機械学習ベースで予測をするためのデータを得られるようになった。しかし、人材が足りないことも多い。予測モデルをゼロから作れるデータサイエンティストや開発者が不足しているため、この分野でノーコードやローコードのサービスを構築するスタートアップが増えるのは当然と言えるだろう。例えば資金を潤沢に調達しているAbacus.aiは、Noogataとほぼ同じ市場を対象としている。

Team8のマネージングパートナーであるYuval Shachar(ユバル・シャハー)氏は「Noogataは意思決定のためにクラス最高のノーコードデータ分析プラットフォームを求める巨大な市場のニーズに対応する上で申し分ない位置にいます。同社の革新的なプラットフォームにより、複雑でコストのかかる社内開発や限界のある既製のベンダーソリューションの必要はなくなります。AIを利用してデータの価値を自由に利用できるようにする同社の手腕はゲームチェンジャーです。しかも創業チームは優秀で、私はNoogataが大成功を収めることは間違いないと思っています」と述べている。

カテゴリー:人工知能・AI
タグ:Noogata資金調達ノーコード

画像クレジット:Weiquan Lin / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Kaori Koyama)

会話型AIからプライバシー重視のフェデレーテッドラーニングに拡大するスペインのSherpaが約9.3億円調達

スペインのビルバオに本社を置くSherpaは、スペイン語話者向けの音声デジタルアシスタントと予測検索を早くから開発していたスタートアップだ。そのSherpaが新たな取り組みのために資金を調達した。新たな取り組みとは、企業を対象とするプライバシーファーストのAIサービスだ。

同社は850万ドル(約9億2800万円)を調達し、創業者でCEOのXabi Uribe-Etxebarria(シャビ・ウリベ – エトシェバリア)氏はこの資金で既存の会話型AIと検索サービスに加え、フェデレーテッドラーニング(連合学習)モデルに基づくプライバシー重視の機械学習プラットフォームを引き続き開発していくと述べた。スペインの保健行政が初期ユーザーとしてSherpaのサービスを利用し、新型コロナウイルス感染症(COVID-19)に関する情報を分析して国内の救急医療機関の需要とキャパシティを予測していた。

今回の資金はApax DigitalマネージングパートナーのMarcelo Gigliani(マルセロ・ギリアーニ)氏、British Airways会長のAlex Cruz(アレックス・クルーズ)氏、スペインの投資会社であるMundi VenturesとEkarpenから調達した。今回はすでに完了していたシリーズAの1500万ドル(約16億3800万円)の追加だ。ということは、Sherpaは現在、さらに大規模なシリーズBも調達中であると考えられる。

会話型AI事業に失速が見えてきた中で、フェデレーテッドラーニングサービスの構築と商用化に方針転換することになった。

Sherpaはスペイン語の音声アシスタントで早い時期に注目を集めた。同社のアシスタントが初めて登場したのは、AppleのSiriやAmazonのAlexaなどが英語圏以外の市場への取り組みをそれほど強力に進めていない時期だった。

同社サービスのユーザー数は2019年時点で500万人を超えた。同社の会話型AIと予測検索サービスを利用している顧客には、スペインのメディア企業のPrisa、Volkswagen、Porsche、Samsungなどがある。

しかしウリベ – エトシェバリア氏は、アシスタント事業は現在も着実に成長してはいるものの難しい事実に直面したと語る。それは英語の音声アシスタント大手は結局スペイン語を追加し、大手が会話型AIへの投資を継続していけばSherpaがこの市場に長くとどまるのは不可能だろうということだ。

同氏は「どこかの企業と大きな取引をするのでない限り、我々がAmazonやAppleなどと闘っていくことはできないでしょう」という。

こうしてSherpaは、自社のAIエンジンを活用する新たな方法を探り始めた。

ウリベ – エトシェバリア氏は、同社の予測検索サービスを生産性向上アプリケーションに拡張するにはどうすればいいかと検討を始めたときにフェデレーテッドプライバシーが浮上したという。

同氏は「完璧なアシスタントはメールを読み、取るべき行動を理解できるでしょう。しかしこの動作に関してはプライバシーの問題があります」と説明する。同氏はある人から、アシスタントにメールの扱い方を「教える」手段の1つとしてフェデレーテッドラーニングを検討するよう助言を受けた。「我々が20人のスタッフを投入すれば、メールを読んで返信するようなものが作れるのではないかと思ったのです」という。

ウリベ – エトシェバリア氏によれば、Sherpaが開発したプラットフォームは予想より出来が良く、メールに優先順位をつけるだけでなくもっと利用できそうだと1年後に判断したという。つまりプライバシーに配慮して機密データから機械学習モデルをトレーニングするエンジンとして製品化し、販売するということだ。

このようなアプローチをしているのはSherpaだけではない。GoogleのTensorFlowもフェデレーテッドラーニングを活用しているし、Fate(Tencentのクラウドコンピューティングセキュリティ専門家が貢献している)や、フェデレーテッドラーニングのオープンソースライブラリであるPySyftも同様だ。

Sherpaは機密保持契約を交わした上でヘルスケアなどの分野でいくつかの企業と連携している。ウリベ – エトシェバリア氏は、近い将来に通信、小売、保険などの分野の顧客を公表する予定だと述べた。

カテゴリー:人工知能・AI
タグ:Sherpa音声アシスタント資金調達スペイン

画像クレジット:Jose A. Bernat Bacete / Getty Images

原文へ

(文:Ingrid Lunden、翻訳:Kaori Koyama)