エンタメやAR/VRで人気のAI音声・合成発話「ボイススキン」を手がけるLOVOが約4.9億円調達

「ボイススキン」は、AIベースの音声アシスタントで非常に人気のある機能となっている。Alexaのようなサービスで得られる、役には立つが、無味乾燥でロボットのような発話音声といった、より退屈な側面のいくつかをパーソナライズするのに効果を発揮する。さまざまな企業が自社のサービスを横断して利用したり、サードパーティが作成や応用の目的で使用できるようなボイススキンを構築しているスタートアップが、その成長を促すために資金調達を進めている。

カリフォルニア州バークレーを拠点とする人工知能(AI)音声および合成音声ツール開発企業のLOVOは今週、韓国のKakao Entertainment、Kakao Investment、LG GroupのITソリューションアフィリエイトであるLG CNSが主導するプレシリーズAのラウンドで450万ドル(約4億9000万円)を調達した。

以前の出資者であるSkyDeck Fundと、DoorDashの財務担当副社長Michael Kim(マイケル・キム)氏もこのラウンドに参加している。

調達した資金は、人工知能と合成音声の研究開発を推進し、チームを成長させるために使われる。

「機械学習、人工知能、プロダクト開発からマーケティング、ビジネス開発に至るまで、あらゆる分野で人材を大量に採用する計画です。資金はGPUやCPUなどのリソースの確保にも充てられます」と共同創業者でCOOのTom Lee(トム・リー)氏はTechCrunchに語った。

2019年11月に設立されたLOVOには、共同創業者でCEOのCharlie Choi(チャーリー・チョイ)氏とCOOのリー氏を含めて17人が在籍している。

同社は、LOVOのAIモデルをさらに改良し、AIの音声機能を強化し、現在の市場に存在するあらゆるものを凌ぐより良いプロダクトを開発する計画だとリー氏は語っている。

「私たちの目標は、人々の心と感情に触れるようなAIの音声を提供する世界的リーダーになることです。コンテンツ制作における制約を民主化したいと考えています。私たちは音声関連のあらゆるもののプラットフォームになることを望んでいます」とリー氏は続けた。

LOVOのミッションにより、企業や個人のコンテンツクリエイターは、マーケティング、Eラーニング、カスタマーサポート、映画、ゲーム、チャットボット、拡張現実(AR)、仮想現実(VR)で使用するためのボイスオーバーコンテンツを生成することが可能になる。

「1年少し前にローンチして以来、ユーザーは私たちのプラットフォーム上で500万以上の音声コンテンツを作成してきました」と共同創業者でCEOのチョイ氏は語る。

LOVOは2020年に最初のプロダクト「LOVO Studio」をリリースしている。個人や企業が欲しい音声を見つけたり、ボイスオーバーコンテンツを制作、公開したりするための使いやすいアプリケーションだ。開発者はLOVOのVoiceover APIを利用して、自分たちのアプリケーションに統合された形で、テキストをリアルタイムでスピーチに変換できる。ユーザーは、LOVOのDIY Voice Cloningサービスを使って15分のスクリプトを読むだけで、自分のAI音声を作ることができる。

LOVOは200以上のボイススキンを所有しており、ユーザーのさまざまなニーズに適した言語、スタイル、状況に基づいて分類された音声を提供している。

リー氏によると、世界のテキスト読み上げ(TTS、text to speech)市場は30億ドル(約3300億円)と推定され、ボイスオーバー市場は100億ドル(約1兆1000億円)前後になるという。2021年8月に公開されたResearch Interviewerのレポートでは、世界のTTS市場は2020年の19億4000万ドル(約2127億円)から2028年までに56億1000万ドル(約6151億円)増加すると予測されている。

LOVOはすでに5万人のユーザーを獲得しており、米国のJ.B.Hunt、Bouncer、CPA Canada、LGCNS、韓国のSinhan Bankなど50社以上の企業顧客がいるとリー氏は述べている。

LOVOの4つのコアマーケットは、マーケティング、教育、映画およびゲームなどのエンターテインメント、そしてAR / VRであるとリー氏は語る。Saw(ソウ)シリーズの最新作である映画「Spiral(スパイラル:ソウ オールリセット)」には、LOVOの声が出演しているという。

韓国のエンターテインメント企業からの最新の資金調達を受けて、LOVOはエンターテインメント業界にさらなる相乗効果をもたらすことが期待されている。

Kakao EntertainmentのCEOビジョンオフィスの副社長であるJ.H. Ryu(J.H.リュウ)氏は「LOVOとKakao Entertainmentのエンターテインメント垂直分野、特にウェブ小説や音楽における将来の取り組みとの相乗効果に期待しています」と述べ「AI技術はオーディオコンテンツの新しい市場への扉を開きつつあり、個人の声が知的財産や資産として有効に活用される未来が期待されます」と言い添えた。

SkyDeck Fundの創設パートナーであるChon Tang(チョン・タン)氏は次のように述べている。「オーディオは情報の一形態として独自の魅力を持っていますが、特に大規模に生産するには困難が伴います。LOVOの人工知能ベースの合成プラットフォームは、品質とコストにおいて他のクラウドベースのソリューションよりも一貫したパフォーマンスを示しています」。

LOVOはまた、国際市場へのさらなる進出を準備している。「当社は米国、英国、カナダ、オーストラリア、ニュージーランドで強力なプレゼンスを確立しており、その他の欧州、南米、アジアからもシグナルを受けています」とリー氏は語る。LOVOは韓国にオフィスを構えており、近いうちに欧州への進出を予定していると同氏は付け加えた。

画像クレジット:LOVO

原文へ

(文:Kate Park、翻訳:Dragonfly)

【コラム】AIイノベーションの推進と規制を同時に実現するために欧州委員会はどうすればよいのか

2021年4月、欧州委員会は人工知能(AI)の利用を規制する初の法案を提案した。この提案に対しては、規制がヨーロッパ連合(EU)におけるAIのイノベーションにブレーキをかけ、米国や中国とのAI分野のリーダーシップ争いの足かせになるという批判が続出した。

例えばAndrew McAfee(アンドリュー・マカフィー、マサチューセッツ工科大学スローンマネジメントスクール主任研究員)は、Financial Timesに「EU propose to regulate AI are only going to hinder innovation(EUの規制提案はIAイノベーションを妨げる)」とする記事を寄稿している。

GDPR(EU一般データ保護規則)を振り返っても、EUの個人情報保護に関する思想的リーダーシップは、必ずしもデータ関連のイノベーションに直結しなかったが、欧州委員会(EC)はこれを念頭に批判を予期しており、規制案と同時にAIに関する新たな協調的計画を発表して、AIのイノベーションに真剣に取り組もうとしている。

AIに関する新たな協調的計画には、EUがAIテクノロジーでリーダーシップを取るための取り組みが盛り込まれている。では、規制とイノベーション促進政策のコンビネーションは、AIのリーダーシップの加速を促進するための要素として十分なのだろうか。

AIイノベーションは適切な規制によって加速する

規制とイノベーションの両方の改善を目標とした今回の組み合わせは、よく練られてはいるものの、問題もある。すなわち、イノベーション促進に関してはR&D(研究開発)のみに焦点を当てていて、規制の対象となる「高リスク」なユースケースにおけるAI利用の促進についてはカバーされていないのだ。

これは見逃せない欠落である。多くの調査研究で、特に利用促進のインセンティブと、適切に設計された法的拘束力がある規制が同時に施行されると、実際にイノベーションが加速される、という結果が出ている。ECはこの研究結果を採り入れて、AIイノベーションのリーダーとなるべきである。

高リスクなAI規制とイノベーションへの投資

今回のEC規制の主目的は「高リスク」なAIシステムに新たな要件を課すことにある。「高リスク」には、遠隔生体認証、公共インフラ管理、雇用・採用、信用度評価、教育などに使用されるAIシステムや、救急隊員の派遣などさまざまな公共部門におけるユースケースが含まれる。

この規制では、これらの高リスクなシステムの開発者に対してAI品質管理システムの導入、すなわち、高品質なデータセット、記録保持、透明性、人による監視、正確性、堅牢性、セキュリティに関する要件に対処できる管理システムの導入を要求している。また、高リスク未満のAIシステムの開発者には、同様の目標を達成するための自主的な行動規範の作成が奨励されることになる。

この提案の創案者は、明らかに規制とイノベーションのバランスを認識していたと思われる。

まず、この提案では、高リスクとされるAIシステムを限定している。なんとなく高リスクと思われがちな保険などのAIシステムは除外し、雇用や融資など、すでにある程度の規制・監視が行われているAIシステムはほとんどが網羅されている。

次に、この提案は大まかな要件を定義しているが、具体的な方法については規定していない。また、厳格な規制ではなく、自己申告に基づくコンプライアンスシステムを取り入れている。

最後に、協調的計画には、データ共有のためのスペース、試験・実験設備、研究・AIエクセレンスセンターへの投資、デジタルイノベーションハブ、教育への投資、気候変動、医療、ロボット工学、公共部門、法執行機関、持続可能な農業のためのAIといったターゲットを絞ったプログラム的な投資など、R&Dを支援する取り組みが大量に盛り込まれている。

しかし、この提案には、他の分野の規制と組み合わせてイノベーションを加速させてきた利用促進に対する配慮が欠けている。

イノベーション促進の前例:米国のEVインセンティブ

では、規制を行いながら、AIイノベーションのさらなる加速を促進するために、ECはどうすれば良いのだろうか。そのヒントとなるのが、米国のEVインセンティブだ。

米国がEV生産の先駆者となることができたのは、起業家精神と規制、そして市場創造のための優れたインセンティブの組み合わせがあったからである。

Tesla(テスラ)は「EVの先陣は魅力的で高性能なスポーツカーであるべきだ」という識見に基づいて、EV産業を活性化させた。

CAFE基準(企業別平均燃費基準:自動車の燃費規制。車種別ではなくメーカー全体で、出荷台数を加重した平均燃費を算出し、規制をかける基準)による規制は、より効率的な自動車を開発するための動機となり、EVを購入する際の手厚い税額控除は、本来あるべき競争の激しい市場力学を妨げることなく、EVの販売を直接促進した。CAFE基準による規制、税額控除、そしてTeslaのような起業家精神に富んだ企業の組み合わせで、技術革新が大きく促進され、EVのモーターは内燃機関よりも安価になると予想されている。

AIインセンティブの正しい理解:推進するべき3つの取り組み

ECでも、AIで米国のEVと同様のことを実現することができる。具体的には、ECは現行の規制に以下の3つの取り組みを追加し、組み合わせることを検討すべきであろう。

新しい規制に準拠した高リスクのAIシステムを構築または購入する企業に対して、税制上のインセンティブを設ける。ECは、経済的・社会的な目標を達成するためにAIを積極的に活用しなければならない。

例えば一部の銀行では、AIを活用し、信用情報の少ない個人の信用力をより適切に評価すると同時に、銀行業務にバイアスを発生させない取り組みを行っている。これは、行政との共通の目標であるファイナンシャル・インクルージョン(金融包摂)を向上させるものであり、両者の利益が一致するAIイノベーションを示すものである。

ECの法制化にともなう不確実性をもっと軽減する。これは、AIの品質管理や公正さに関する、もっと具体的な基準を策定することで、EC自体がある程度実現できる。しかし、AIテクノロジーを提供する企業やユーザーグループが連携して、これらの基準の遵守に向けた実用的なステップを構築できれば、さらに大きな価値があるだろう。

例えばシンガポール金融管理局は、Veritasという銀行、保険会社、AIテクノロジープロバイダーのための業界コンソーシアムを組織し、FEAT(Fairness, Ethics, Accountability and Transparency、公平性・倫理・説明責任・透明性)のガイドラインで同様の目標を達成している。

法が要求するAI品質管理システムの導入を加速するために、これらのシステムを構築または購入する企業に対する資金提供を検討する。この分野では、ブラックボックスモデルの説明可能性、データやアルゴリズムのバイアスによる潜在的な差別の評価、データの多大な変化に対するAIシステムの耐久性のテストとモニタリングなど、学術的にも商業的にも重要な活動がすでに行われている。

ECは、このようなテクノロジーを広く普及させるための条件を整えることで、イノベーションを加速させ、新しい規制への持続的な準拠も確保するという2つの目的を同時に達成することができるはずだ。

ECが積極的に不確実性を軽減して高リスクのAIの使用を規制しながら促進し、AIの品質管理技術の使用を奨励すれば、EU市民を確実に保護しながら、AIイノベーションの世界的なリーダーになることもできるだろう。EUが世界の模範となれるよう、成功を期待している。

編集部注:本稿の執筆者Will Uppington(ウィル・アッピントン)氏は、TruEraのCEO兼共同設立者。

画像クレジット:PhonlamaiPhoto / Getty Images

原文へ

(文:Will Uppington、翻訳:Dragonfly)

Hmcommと岡本工業がAI異音検知プラットフォームFAST-D応用し多軸自動旋盤のドリル破損を音で検知するシステム開発

Hmcommと岡本工業がAI異音検知FAST-Dを応用し多軸自動旋盤のドリル破損を音で検知するシステム開発

産業技術総合研究所(産総研)発スタートアップとして音声処理技術の研究開発を行うHmcomm(エイチエムコム)は10月20日、ビル配管工事や金属旋削加工などを手がける岡本工業と共同で、精密金属加工に使用する多軸自動旋盤のドリルの破損を、AI異音検知プラットフォーム「FAST-D」で検知するシステムの自社内導入を目的とした開発と、金属加工業者向け販売を目指したセンシングシステム開発の開始を発表した。

これまで岡本工業では、精密金属加工事業で使用する多軸自動旋盤機のドリルの破損を、振動や画像で検知する試みを重ねてきたが、なかなかうまくいかなかった。そこで、Hmcommのノイズ処理技術や音響処理技術を使ったところ、初めて有用なデータが取得できたという。そこで使用された「FAST-D」は、AI異音検知の学習モデルの作成や管理が自動的に行えるHmcommのクラウドサービス。Hmcommの知見をもとにした機械学習アルゴリズムにより、短期間に異音検知を現場導入できるというものだ。

Hmcommと岡本工業がAI異音検知FAST-Dを応用し多軸自動旋盤のドリル破損を音で検知するシステム開発

今後はこのシステムにIoTを組み合わせ、ドリルの破損が検知されるとPLC経由で停止信号を発して速やかに機械を停止させる仕組みを構築し、2022年春には製品化して販売することを目指し、実証実験を行うとしている。

AI異音検知とは、機械やモノ、生物が正常稼働している場合の音と、異常な状態になっている場合の発する音を機械学習させることで、安定的なモニタリング、異常発見、予兆検知などに役立てる技術。人が音を聞いて正常か異常かを判断する場合は、判断基準があいまいでバラツキが発生するケースや、熟練の技が必要になるなどの課題があるが、異音検知により人手によらない定量的な分析が可能となる。

音による異音検知は、工場インフラの異常検知、機械音検知、非破壊検査をはじめ、足音や防犯、ヒトの発する音や動物の鳴き声など、幅広い業種・業態で利用可能という。

Hmcommと岡本工業がAI異音検知FAST-Dを応用し多軸自動旋盤のドリル破損を音で検知するシステム開発

コンピュータービジョンにとどまらず企業の非構造化データを管理するClarifaiが68億円調達

Clarifai(クラリファイ)は、開発者、ビジネスオペレーター、データサイエンティストの日常に人工知能を導入し、モデル開発の自動化と高速化を実現を目指している。

Matt Zeiler(マット・ザイラー)氏は2013年、ニューヨークを拠点とし、コンピュータービジョンに特化した同社を創業した。2016年の3000万ドル(約34億円)のシリーズB以来、画像、ビデオ、テキスト、オーディオデータファイルといった企業の非構造化データを対象とした新機能や製品を展開している。

新機能には、自然言語処理、音声認識、スキャン、そして2020年発表した自動データラベリング機能「Scribe」などがある。また、高出力サーバーからカメラ、ドローンまで、さまざまなローカルハードウェアを使用して、データストリームの上にAIを重ねる「Edge AI」機能も展開している。同社は、10月20日に開催される深層学習の年次カンファレンス「Perceive 2021」で、さらに多くの情報を公開する予定だ。

こうした活動の中で、またこれらを継続すべく、Clarifaiは10月15日に6000万ドル(約68億4000万円)のシリーズCラウンドを発表した。New Enterprise Associatesが主導し、既存の投資家からMenlo Ventures、Union Square Ventures、Lux Capital、LDV Capital、Corazon Capital、NYU Innovation Venture Fund、新規の投資家としてCPP Investments、Next Equity Partners、SineWave Ventures、Trousdale Capitalが参加した。今回のラウンドで、同社の資金調達総額は1億ドル(約114億円)に達した。

「私たちは、追加の資金調達をせずに、なんとか長い間を過ごしてきました」とザイラー氏はTechCrunchに語った。「当社は、コストを抑えて効率的に運用しながら、収益を大きく伸ばしてきました。そして、チャンスを迎え、資金を調達しました」。

そのチャンスには、優れた法人向け販売チームを立ち上げることも含まれていた。会社設立当初は市場が未成熟だったため、中小企業や個人への販売から始めた。現在では、市場の成熟化に伴い、フォーチュン500の企業と取引を行っている。

同社にとって「非構造化データ」とは、画像や動画、テキストなど、人間の脳は得意とするが、コンピューターは苦手とするデータのことだ。実際、企業のデータの95%は非構造化データであり、Clarifaiに「大きなチャンス」をもたらしているとザイラー氏は話す。

そうしたシグナルを大企業が市場に発するようになったタイミングで、シリーズCを実現した。また、同社はSnowflakeと提携し、Snowflakeが最近リリースした非構造化データ支援とClarifaiを連携させるための統合を行った。

「Snowflakeは、構造化データに関して1000億ドル(約11兆円)規模のビジネスを展開していますが、今は非構造化データにも取り組んでいます」とザイラー氏は付け加えた。「顧客がSnowflakeでデータを保存している場合、そこから価値を得ることができますが、それを意味のあるものにするためにはClarifaiのAIが必要です」。

Clarifaiの製品パイプライン。画像クレジット:Clarifai

一方、同社は2020年1年間で収益を2倍以上に伸ばし、ユーザー数も13万人を突破した。今回のシリーズCの資金調達により、現在100人のグローバルチームの規模を来年までに倍増させる計画だ。

また、営業やマーケティング、国際的な事業拡大にも投資する。同社は、すでにエストニアにオフィスを構えているが、ザイラー氏は多くの顧客を獲得しているオーストラリア、インド、トルコも視野に入れている。また、最初の顧客を獲得したばかりのEdge AI製品にも引き続き取り組む。

今回の投資の一環として、NEAのパートナーであるAndrew Schoen(アンドリュー・ショーン)氏がClarifaiの取締役会に加わる。同社は数年前から注目されていたが、ショーン氏は当時、投資には早すぎると感じていた。

「最初の頃、AIの風は構造化データを中心に吹いていました。データの90%は非構造化でしたから、これはすぐに手に入る果実だと言えました」とショーン氏は語った。「エコシステムが成熟した今、企業は構造化データからできる限りのことを絞り出したことがボトルネックになっていることに気づきました。今、企業の手元には使えない非構造化データが残り、それがきちんと整理されていません。Clarifaiは、この問題を解決することを目的としています」。

ショーン氏は、ClarifaiがAIと機械学習を解明し、民主化すると考えている。同社は早くから非構造化データに着目していたため、アーリーアダプターを獲得することができた。現在ではこの分野をリードしている。

さらにショーン氏は、同社の収益予測は過去12カ月の間に変曲点を迎え、ビジネスは「順調に成長している」という。

「Clarifaiはこれまで、顧客を獲得し、市場を教育しなければなりませんでした。今では市場に対して自社の製品をプッシュするのではなく、プル型になっています。企業側がソリューションを探し、Clarifaiが適切な製品だと見ているのです」と付け加えた。

画像クレジット:Yuichiro Chino / Getty Images

原文へ

(文:Christine Hall、翻訳:Nariko Mizoguchi

アプリケーション開発に誰もが容易にAIを導入できるようにしたいSpice AIはMicrosoftスピンオフ

シアトルのSpice AIは、開発者が自分のアプリケーションの中でAIを容易に利用できるようにする。同社は今日(米国時間10/14)、100万ドルのシード資金を調達したことを発表した。

言うまでもなく大きなラウンドではないが、投資家たちの顔ぶれには目を見張るものがある。それらは、Madrona Venture GroupとPicus Capital、TA Ventures、そしてエンジェルはGitHubのCEO Nat Friedman氏とMicrosoft AzureのCTO Mark Russinovich氏だ。このプラットホームを支えるチームもそうそうたるメンバーで、CEOのLuke Kim氏はMicrosoftに10年いてAzureではIncubationsチームを共同で作り、エンジニアリングのチームを率いてDaprを創業した。またCTOのPhillip LeBlanc氏は、Azure Active DirectoryとVisual Studio App Centerで仕事をし、GitHub対応を担当した。

チームによると、AIをアプリケーションに組み込むことは今日ですら難しすぎる仕事だ。Microsoft時代にKim氏は、ニューロフィードバックの個人的プロジェクトを始めた。このような療法をもっと利用しやすくするために彼は、脳波のデータの時系列を分析するAIシステムを作ろうとしたが、それが今だに非常に難しいことを悟った。

彼曰く、「超難しくて、しかもおかしい。Microsoftにいたんだから、必要なリソースはすべてある。でもサイドプロジェクトをやろうとすると、リソースはどこにもない。しかも、どちらのケースでも、AIやMLをアプリケーションに統合することはすごい難関だった」。

彼によると、最近の10年間でAIは大きく進歩したが、その進歩を取り入れてインテリジェントなソフトウェアを作る技術はまだまだ未熟だ。


画像クレジット: SpiceAI

「このような状態を克服することが、AI技術にとって最後の1マイルだ、と思った。光ファイバーも、実際に家庭に普及するまでに何年もかかった。MLをアプリケーションで使いこなせるようになるためにも、同じことが言える。そのギャップを填めて開発者にとってとても容易な技術にすることを、目指している」、とKim氏は言う。

彼によると、Spice AIを創るにあたってDaprから学んだことが多かったが、Next.jsでVercelがやっていることなども参考になった。

今となっては、これらすべてが当たり前と思えるかもしれない。なぜなら、今や多くのスタートアップがAIの敷居を下げることを目指している。でもKimが主張するのは、彼らがやっているのは主にAIの可用性を容易にすることであり、データ分析やビジネスインテリジェンス(BI)に多くの人が容易にアクセスできることを目指している。しかしSpice AIがやろうとしているのは、開発者がAIをアプリケーションに楽に統合できるようにすることだ。だから同社のターゲットはデータサイエンスのチームではなく、プロのデベロッパーだ。

Spice AIのシステム構築でおもしろいのは、報酬関数を重視していることだ。つまり開発者は、アルゴリズムが何を目指して自分を最適化していくのかを指定できる。エアコンを制御するアプリケーションなら、消費電力を低くしたい。オーストリアのリテイラーと共に試行しているプロジェクトなら、顧客のオーダーの理想的なピックアップ(拾い上げ)位置を見つけたい。それは、つねに至近の場所とは限らない。運転時間やアイテムの可用性などの変項に依存するだろう。

同社はSpicerackと名付けたパッケージマネージャーも作っている。それによって開発者はマニフェストと自分の報酬関数を公開し、他の開発者が自分のユースケースで再利用できるようにする。

このようなプロジェクトの常として、Spice AIのチームもそのアイデアをオープンソースのプロジェクトとしてローンチしている。今後リリースする商用バージョンではエンタープライズのサポートも入ってくるが、チームはクラウドサービスのバージョンや、エンタープライズが自分のモデルをホストできるためのプライベートなレジストリも考えている(それを同社はSpicepodsと呼んでいる)。

Madrona Venture Groupのパートナーで最近までMicrosoft CloudのGM/COOだったAseem Datar氏はこう言っている: 「Madronaは10年近く、インテリジェントなアプリケーションに投資してきたが、AIの開発を既存のワークフローにシームレスに導入して、開発者が高品質なアプリケーションの構築を加速するという、LukeとPhillipのビジョンは刺激的だ。これはまだ始まったばかりであり、今後の彼らの旅路に同行できることはエキサイティングだ。このような有能なチームと初日から一緒に仕事をしてビジョンの実現に寄与できることはすばらしい」。

(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)
画像クレジット: Spice AI

[原文へ]

アプリケーション開発に誰もが容易にAIを導入できるようにしたいSpice AIはMicrosoftスピンオフ

シアトルのSpice AIは、開発者が自分のアプリケーションの中でAIを容易に利用できるようにする。同社は今日(米国時間10/14)、100万ドルのシード資金を調達したことを発表した。

言うまでもなく大きなラウンドではないが、投資家たちの顔ぶれには目を見張るものがある。それらは、Madrona Venture GroupとPicus Capital、TA Ventures、そしてエンジェルはGitHubのCEO Nat Friedman氏とMicrosoft AzureのCTO Mark Russinovich氏だ。このプラットホームを支えるチームもそうそうたるメンバーで、CEOのLuke Kim氏はMicrosoftに10年いてAzureではIncubationsチームを共同で作り、エンジニアリングのチームを率いてDaprを創業した。またCTOのPhillip LeBlanc氏は、Azure Active DirectoryとVisual Studio App Centerで仕事をし、GitHub対応を担当した。

チームによると、AIをアプリケーションに組み込むことは今日ですら難しすぎる仕事だ。Microsoft時代にKim氏は、ニューロフィードバックの個人的プロジェクトを始めた。このような療法をもっと利用しやすくするために彼は、脳波のデータの時系列を分析するAIシステムを作ろうとしたが、それが今だに非常に難しいことを悟った。

彼曰く、「超難しくて、しかもおかしい。Microsoftにいたんだから、必要なリソースはすべてある。でもサイドプロジェクトをやろうとすると、リソースはどこにもない。しかも、どちらのケースでも、AIやMLをアプリケーションに統合することはすごい難関だった」。

彼によると、最近の10年間でAIは大きく進歩したが、その進歩を取り入れてインテリジェントなソフトウェアを作る技術はまだまだ未熟だ。


画像クレジット: SpiceAI

「このような状態を克服することが、AI技術にとって最後の1マイルだ、と思った。光ファイバーも、実際に家庭に普及するまでに何年もかかった。MLをアプリケーションで使いこなせるようになるためにも、同じことが言える。そのギャップを填めて開発者にとってとても容易な技術にすることを、目指している」、とKim氏は言う。

彼によると、Spice AIを創るにあたってDaprから学んだことが多かったが、Next.jsでVercelがやっていることなども参考になった。

今となっては、これらすべてが当たり前と思えるかもしれない。なぜなら、今や多くのスタートアップがAIの敷居を下げることを目指している。でもKimが主張するのは、彼らがやっているのは主にAIの可用性を容易にすることであり、データ分析やビジネスインテリジェンス(BI)に多くの人が容易にアクセスできることを目指している。しかしSpice AIがやろうとしているのは、開発者がAIをアプリケーションに楽に統合できるようにすることだ。だから同社のターゲットはデータサイエンスのチームではなく、プロのデベロッパーだ。

Spice AIのシステム構築でおもしろいのは、報酬関数を重視していることだ。つまり開発者は、アルゴリズムが何を目指して自分を最適化していくのかを指定できる。エアコンを制御するアプリケーションなら、消費電力を低くしたい。オーストリアのリテイラーと共に試行しているプロジェクトなら、顧客のオーダーの理想的なピックアップ(拾い上げ)位置を見つけたい。それは、つねに至近の場所とは限らない。運転時間やアイテムの可用性などの変項に依存するだろう。

同社はSpicerackと名付けたパッケージマネージャーも作っている。それによって開発者はマニフェストと自分の報酬関数を公開し、他の開発者が自分のユースケースで再利用できるようにする。

このようなプロジェクトの常として、Spice AIのチームもそのアイデアをオープンソースのプロジェクトとしてローンチしている。今後リリースする商用バージョンではエンタープライズのサポートも入ってくるが、チームはクラウドサービスのバージョンや、エンタープライズが自分のモデルをホストできるためのプライベートなレジストリも考えている(それを同社はSpicepodsと呼んでいる)。

Madrona Venture Groupのパートナーで最近までMicrosoft CloudのGM/COOだったAseem Datar氏はこう言っている: 「Madronaは10年近く、インテリジェントなアプリケーションに投資してきたが、AIの開発を既存のワークフローにシームレスに導入して、開発者が高品質なアプリケーションの構築を加速するという、LukeとPhillipのビジョンは刺激的だ。これはまだ始まったばかりであり、今後の彼らの旅路に同行できることはエキサイティングだ。このような有能なチームと初日から一緒に仕事をしてビジョンの実現に寄与できることはすばらしい」。

(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)
画像クレジット: Spice AI

[原文へ]

ソシオネクストが深層学習を用いたSLAM処理を大幅に高速化、画像認識による自律制御がエッジ機器でも可能に

ソシオネクストが深層学習を用いたSLAM処理を大幅に高速化、画像認識による自律制御がエッジ機器でも可能に

SoC(システム・オン・チップ)の設計開発を行うソシオネクストは10月12日、自動運転車やロボットなど自律制御を行う装置に欠かせないSLAM(自己位置推定と環境地図作成を同時に行う)処理に必要な時間を、従来技術の約1/60に短縮できる手法を開発したことを発表した。これは、東北大学大学院情報科学研究科システム情報科学専攻、岡谷貴之教授の研究ブループとの共同研究によるもの。

SLAMは、自動車などではLiDAR(ライダー:レーザーで画像検出と測距を行うシステム)を用いたものと、カメラ映像で行うVisual SLAMとに大別される。Visual SLAMは、安価なカメラで行えることと、画像処理技術が発達したことから応用が広がっている。さらに深層学習を使った画像認識技術の発展もこれを手伝っている。

しかし、深層学習による画像処理では、画像から抽出された3次元点群と観測データをすり合わせて画像の正確な3次元復元を行うバンドル調整(BA。Bundle Adjustment)という、膨大な計算処理が必要となる。そのため、エッジ機器のようなCPU処理能力に制約のある環境では、Visual SLAMは難しかった。

そこでソシオネクストの研究チームは、「グラフネットワーク(Graph Network。GN)を用いた推論による近似計算手法」を提案。これにより従来方式(g2o)と比較して「計算量を抑えた推論処理」が可能となり、処理時間は1/60となった。

ソシオネクストが深層学習を用いたSLAM処理を大幅に高速化、画像認識による自律制御がエッジ機器でも可能に

計算量が減ったことで、CPUの負担や、それにともなうシステムの消費電力も抑えられる。そのため小さなエッジ機器でも高度なVisual SLAM処理が可能となり、応用の範囲が大きく広がる。ソシオネクストでは、この新しい推論手法による処理効率の向上を、画像認識以外の新しい顧客アプリケーションへの応用も検討すると話している。

AIチップメーカーのHailoが約155億円調達、エッジデバイスにおけるAIモジュールの機会を倍増させる

世界的に半導体が不足するなか、AIチップ業界のスタートアップが、その技術に対する需要の高まりに対応するため、大規模な資金調達を発表した。スマートシティ、小売環境、産業用機器、次世代自動車システムなど、AIワークロード用にカスタマイズされたエッジデバイス用チップを製造しているHailo(ハイロ)が、シリーズCラウンドで1億3600万ドル(約155億円)を調達した。同社に近い情報筋にTechCrunchが確認したところ、今回の投資はHailoのバリュエーションを約10億ドル(約1140億円)とみているという。

このラウンドはPoalim EquityとGil Agmonが共同でリードした。Hailoの会長であるZohar Zisapel(ゾハー・ジサペル)氏、ABB Technology Ventures(ATV)、Latitude Ventures、OurCrowdの他、新たにCarasso Motors、Comasco、Shlomo Group、Talcar Corporation、Automotive Equipment(AEV)社も出資した。Halioの累計調達額は約2億2400万ドル(約255億円)になった。

約1年半前の6000万ドル(約68億円)のシリーズBに続くラウンドだ。同社は約1年前、Intel(インテル)やNVIDIA(エヌビディア)に対抗するHailo 8チップを搭載した最新のAIモジュールを発表した。

関連記事
イスラエルのAIチップメーカーHailoがNECなどから約64億円調達
テルアビブ拠点のHailoがエッジデバイス用新AIモジュールでインテルやグーグルに挑戦

共同創業者でCEOのOrr Danon(オア・ダノン)氏はインタビューで、最近、市場での関心が非常に高まっており、前四半期だけで、Hailoが取り組むプロジェクトの数が100件に倍増したと話した。今回のラウンドを受け、需要増加に応えて規模を拡大すると同時に、プロセッサーの用途にあわせたカスタマイズを継続する。

「現在、Hailo 8を市場に投入していますが、その効率の良さに人々は非常に喜んでいます」と同氏はいう。同社のエッジチップの独自性は、既存のリソースに適応してカスタムニューラルネットワークを動作させるよう設計されている点にある。そのため、同様のタスクを実行するためにデータセンターのコンピューターで必要とされる同等の処理能力より高速であるだけでなく、より少ないエネルギーで動作する。「私たちはこのサービスを拡大していきたいと考えています。そのために、ソフトウェアにも投資しています」と話す。

今回の資金調達は、2021年のチップ業界の複雑な状況の中で実施された。

パンデミックの影響で、一部の分野では旺盛な需要があったものの(例えば、コンシューマー環境では、活動が制限されている時期にユーザーはより良いデバイスへの乗り換えを始めた)、他の分野では活動が大幅に低下し(例えば自動運転車などの野心的なプロジェクト)、全体的に生産が大幅に減速した。

Hailoのようなエッジデバイスを扱う企業にとっては、より効率的でコスト効率の高いシステムをアピールするチャンスだ。ユーザー自身のニューラルネットワークや、TensorFlowおよびONNXなどの人気のある開発フレームワークと統合できることも後押しする。

ダノン氏によると、Hailoは自動車などの一部の分野で需要が軟化しているが、同社のビジネスの幅広さにより、全体的な需要は引き続き増加している。自動車分野は、一時期盛り上がり、その結果としてしばらく落ち込んでいたが、復調しつつある。

例えば、完全自動運転車を対象とするプロジェクトの数は減ったかもしれないが、半自動運転システムに取り組むプロジェクトはまだ数多くあり、それがHailoのビジネスにつながっていると同氏は話す。

「企業は今、現実的な展開を模索し始めており、現実的な課題に直面しています」と同氏はいう。「自動運転車に自動車専用の高速道路を走らせる必要はないかもしれませんが、それでも新しいタスクを学ぶ必要はあります」。

また、産業界や小売業界(エッジデバイスが、セキュリティシステム・自動レジ向けのコンピュータビジョンアプリケーションや、分析に使用されている)、さらには交通機関が今後もビジネスの主要な原動力となるスマートシティなどからも強い関心が寄せられているという。

投資家が同社に投資するのは、現在のビジネスのためだけでなく、今後のチャンスのためでもある。

「今後数年間で、AIは新たなビジネス価値を生み出し、これまでのユーザーエクスペリエンスを再構築する決定的な機能となるでしょう。AIベースの機能を市場に投入する能力は、企業の成功と失敗の分ける決定的要因となることが増えていきます」と語るのはMooly Eden(モーリー・イーデン)氏だ。同氏は、Intelに40年近く勤務し、直近ではイスラエル事業の社長を務めた後に退社した。現在はHailoの取締役を務める。「Hailoの革新的で超効率的なプロセッサー・アーキテクチャーは、従来のコンピューティング・ソリューションに挑戦し、新しいタイプのワークロードを処理する新しい種類のチップに対する需要増加に対応します」。

画像クレジット:Hailo

原文へ

(文:Ingrid Lunden、翻訳:Nariko Mizoguchi

JAXA認定スタートアップ「天地人」が宇宙ビッグデータを活用した土地評価エンジン「天地人コンパス」体験版を提供開始

JAXA認定スタートアップ「天地人」が宇宙ビッグデータを活用した土地評価エンジン「天地人コンパス」の無料体験版を提供開始

JAXA認定の宇宙領域スタートアップ天地人は10月11日、宇宙ビッグデータを活用した土地評価エンジン「天地人コンパス」の無料体験版「天地人コンパス Demo」の提供開始を発表した。宇宙ビッグデータを実際の事業に応用する体験ができる。

天地人コンパスは、宇宙から土地を評価するサービス。衛星写真だけでなく、降水量などの気象情報、3D地形情報、地表面温度などの地球観測衛星からのデータを活用して、土地の解析、可視化、データ提供を総合的に行うというものだ。世界中あらゆる場所のデータを取得でき、利用者が持っているデータを組み合わせた複合的な分析も可能。農業や都市開発など様々な用途に対応でき、宇宙から稲の栽培環境をモニタリングする「宇宙ビッグデータ米」プロジェクトや、キャンプ場の候補地探し、複数の土地の類似性を気象の観点から評価するプロジェクトなどに使われている。

「天地人コンパス Demo」では以下の機能が体験できる。

  • ピンポイント評価機能:地上データでは観測が難しい場所について、土地の状況・環境を過去からさかのぼり評価し、適地の探索や、未来のリスクを可視化する。サンプルエリア内と特定の期間に限り、任意の場所の気象の遷移や土地の情報を閲覧できる

  • 広域土地評価機能:ビジネスや農業に最適な場所探しや、災害や自然環境変化を分析できる。分析の元となる地図情報を重ね合わせることも可能。分析例として、農作物の高温障害リスクの分析、仮想の米の品種(天地人米)を栽培条件を仮設定し地表面温度と土壌から生産適性度をスコア化するといったものがある

「天地人コンパス Demo」サービス詳細

  • 料金:無料
  • 提供開始日:2021年10月11日
  • 対応ブラウザー:Google Chromeを推奨、PCのみ対応

評価が行えるサンプルエリアは、日本の都市部、山間部、平野部に限定される。特設サイトからアクセスすれば無料で利用できる。

コーセーが5年後と10年後のシワのレベルを予測するウェブサービスを開発、未来のシワを予測する数理モデル応用

コーセーが5年後と10年後のシワのレベルを予測するウェブサービスを開発、未来のシワを予測する数理モデル応用

コーセーは10月11日、現在の顔写真から将来のシワの状態を予測するウェブサービスを開発し、10月12日から展開すると発表した。これは、2021年2月に開発を発表した、将来のシワの状態を予測する数理モデルを応用したもの。

このウェブサービスは、コーセーのデジタルカウンセリングツール「KOSÉ HADA mite」(コーセーハダミテ)の一機能として提供される。「皮脂量」と「年齢」を入力し、スマートフォンやタブレットで顔写真を撮影すると、「今日」「5年後」「10年後」のシワレベル(目尻のシワの目視評価値)が8段階で予測され、将来のシワ発生リスク(6段階)と肌タイプの分析、最適なお手入れ方法のアドバイスが示される。

このツールに応用されている数理モデルは、情報システム研究機構 統計数理研究所 医療健康データ科学研究センター(野間久史准教授)との共同研究により開発したもの。また、コーセー研究所で7年間蓄積してきた、22歳から60歳の日本人女性社員48名の肌情報データを基に構築されたという。コーセー研究所では、水分量、経皮水分蒸散量、皮脂量、肌色の明るさ、肌色の赤み、肌色の黄みがシワレベルと強い相関関係があると予測しデータを取得していたが、個人差などの要素を考慮した推定が可能なマルチレベルモデルを用いて分析したところ、シワレベルに大きく関連する要因は、年齢、肌色の明るさ、肌の赤み、皮脂量の4つに絞り込まれた。これにより、個々の年齢と肌の状態からシワレベルを定量的に予測することが可能となった。コーセーが5年後と10年後のシワのレベルを予測するウェブサービスを開発、未来のシワを予測する数理モデル応用

今後は「美容カウンセリングやセルフ診断などに応用することで、お客さまが実感できるシワ予防のサービスや商品開発に繋げていきます」とのことだ。

もうビデオ会議用の服装に悩まずにすむ!? 東京大学が体形・姿勢にリアルタイムで対応する仮想試着システムを開発

もうビデオ会議用の服装に悩まない!? 東京大学が体形・姿勢にリアルタイムで対応する仮想試着システムを開発

東京大学大学院情報理工学系研究科創造情報学専攻五十嵐健夫研究室は10月8日、多様な体形や姿勢にリアルタイムで対応する高品質な仮想試着システムの開発を発表した。オンラインショップなどでも仮想試着や、体を動かしても違和感のない映像が作られるため、ビデオ会議に仮想衣服を着用して参加するといったことが可能になるという。

既存の仮想試着システムの研究には、3D CGを用いたものや、画像ベースのものがある。しかし、CGでは写実的な画像の生成が難しく、画像ベースのものは、1つの深層学習モデルで異なる衣服の試着画像を生成するため、リアルタイムで高品質な画像を生成するのが難しい。それに対して、五十嵐健夫研究室が提案するシステムは、「特定の衣服の画像の生成に対象を絞って深層学習モデルを構築」するという手法でこれらの問題を克服した。

大まかな処理の流れはこうだ。試着者は、特別な柄の服(計測服)を着てカメラの前に立つと、深度センサー付きカメラで撮影される。その色と深度情報から、試着する服の画像が、服の部分と体の部分に分けられる。次に試着服の部分の領域分割を行い、画素の値に対応するラベル付き画像に変換される。そこから、深層学習モデルの一種である画像変換ネットワーク(画像を入力すると色づけなどの変換を施した画像が出力される)を使って試着する服の画像が生成される。それを試着者の体の画像と合成する。

ここで使われる画像変換ネットワークは、膨大な量の入力画像で訓練する必要があるが、入力画像と出力画像は、体形と姿勢が同一でなければならないため、人を使って行うのが極めて難しい。そこで同研究室では、この目的のために、人の体形(胴体の厚さと横幅)や姿勢を数値的に制御できるロボットマネキンも開発した。

もうビデオ会議用の服装に悩まない!? 東京大学が体形・姿勢にリアルタイムで対応する仮想試着システムを開発

写真左3枚が体形の変化。右4枚が姿勢の変化

これにより、計測服を着た試着者の画像から、衣服のサイズやポーズに応じた衣服の詳細な変形の様子をリアルタイムで画像に生成できるため、オンライショップでの試着や、テレビ会議で仮想的な衣服を着るといった応用が可能になる。今後は、長袖と半袖など構造的に大きく異なる衣服への対応、光源などが異なる撮影条件での制御、より自由度の高いマネキンの開発、生成画像向上のための計測服の最適化などに取り組んでゆくとしている。もうビデオ会議用の服装に悩まない!? 東京大学が体形・姿勢にリアルタイムで対応する仮想試着システムを開発

この研究結果は、10月10日にバーチャル開催されるるユーザーインターフェース分野の国際会議「ACM UIST 2021」にて発表される予定。

デジタルサンプルとAI需要予測によりアパレル業界サプライチェーンの変革を目指すGOOD VIBES ONLYが5.5億円調達

デジタルサンプルとAI需要予測によりアパレル業界サプライチェーンの変革を目指すGOOD VIBES ONLYが5.5億円調達

GOOD VIBES ONLY(グッドバイブスオンリー)は10月8日、第三者割当増資および融資による総額約5億5000万円の資金調達を発表した。引受先はマルイグループ、SMBCベンチャーキャピタル、豊島株式CVC、Sun Asterisk、セレス、スタイレム瀧定大阪。

2018年4月設立のGOOD VIBES ONLYは、デジタルサンプルとAI需要予測を活用することで、アパレル業界におけるサプライチェーンの変革を目指すスタートアップ。アパレルにおける全商流を一気通貫させたビジネスモデルを構築し、自社D2Cブランドも6ブランド展開。他社のブランドプロデュースも多数請け負っているという。

調達した資金は、既存アパレル業界へのDX導入を加速させるためのデジタルサンプルプラットフォームの開発、中国、アジア圏内への展開を目的とした採用・マーケティング強化にあてる。来春には3Dデータを軸にしたアパレルのプラットフォームをスタートさせる。

デジタルサンプルは、サンプル費用の削減だけでなく、従来のサンプル生産方式から30日以上のリードタイムを短縮し、実物サンプルを生産することなくSNSなどでの訴求投稿、EC商品画像として活用することで撮影販管費の削減と効率化、サスティナブルな取り組みにもつながるという。

またSNSに投稿された画像は、AI需要予測により事前需要(予測点数)を可視化し、これまで人の感覚や前年比実績に基づく属人化された発注・生産体質を変革させ、シームレスに製品生産までを一気通貫したシステム提供を行うことが可能となるとしている。

 

「強力なAI」誕生へのカウントダウン

スタートアップとマーケットの週刊ニュースレター「The TechCrunch Exchange」へようこそ。
みなさん、お元気でお過ごしだろうか。週末はゆっくりと休んでリラックスできただろうか。

今回は楽しい話題だ。もちろん、後の方にはいつものようにベンチャーキャピタルのラウンドやメモなどが並んでいる。だがその前に、AIについて話そう。

先週私は、機械知能をもう少し確かなものにするために活動している2つの企業と話をする機会があった。1つはハードウェア、もう1つはソフトウェアを扱う企業だ。

まずハードウェアの方は、IonQ(イオンキュー)のPeter Chapman(ピーター・チャップマン)氏に話を聞いた。IonQは、最近SPACで上場した量子コンピューティング企業だ。チャップマン氏と私は、償還やその他のSPAC絡みの瑣末な問題を掘り下げる代わりに、大部分の時間をSFと「強力なAI」の本当の意味について費やした。

簡単に言えば「強力なAI」とは今のAlexa(アレクサ)の動作原理とは異なるものだ。チャップマン氏によれば、Alexaは、エンジニアがクエリに対して可能な限り多くの応答をコード化することで動作している。このやり方はある程度は拡大できる。しかし、強力なAIは自分でコードを書くことができなければならないとチャップマン氏は語り、これは人間の手で書かれた質問と回答の組み合わせとは根本的に異なるという。

このためには量子トピックがふさわしいとチャップマン氏はいう。なぜなら、量子コンピューティングは強力なAIが必要とする種類のコード生成に非常に優れているからだ。そして重要なのは、無数の確率を同時に解析し、その中から選択することも得意なことだ。

量子コンピューターは実用化の初期段階にあり、IonQ(閉じ込めたイオンを使用していることから名付けられた)のような企業が、この新しいコンピューターの時代の到来を先導しているのだ。量子コンピューティングが主流になれば、単なるMLモデルではない大規模なAIにもっと近づくことができるはずだ。

さて、ソフトウェアの方は、Intrinio(イントリニオ)のCEOであるRachel Carpenter(レイチェル・カーペンター)氏と電話で話した。彼女の会社は、APIから利用可能な巨大なファイナンシャルデータセットを構築した。金融オタクとしては、ワクワクする話だ。Intrinioが気になるかどうかは、読者がこれまでSECの書類を読むのにどれだけの時間を費やしてきたかによって決まるだろう。

だが、このスタートアップは、Thea(シーア)という名のAIサービスも開発している。これは、ニューラルネットワークを、テキストを理解できる独自の自然言語処理マシンに織り込むことで機能するAIサービスだ。膨大な量の財務報告書を解析したいと考えている者にとっては、これはすばらしい製品アイデアだ。

カーペンター氏と話していて印象的だったのは、Theaは最初、広いインターネット上でトレーニングを受けていたということだ。つまり単なる金融言語解析ツールではなく、それ以上のことができるということだ。

CEOによれば、現在同社はTheaの焦点を金融のニッチに置いているという。しかし、Intrinioが部分的にでもオープンソースのサービスを使用して複雑なものを立ち上げることができるなら、今後数年のうちにTheaのようなインテリジェントシステムがより多く市場に登場する可能性がある。それを商用化されつつある量子コンピューティング技術と融合させると、もしかしたら、いつの日か、実際の人工知能に近づけるのかもしれないと思えてくる。

そう、私たちは生まれるのが50年ほど早すぎたのだ。

VCあれこれ

予想通り、第3四半期のベンチャーキャピタルの状況は、まったくもって正気の沙汰ではなかった。びっくり仰天。前代未聞。好きなように呼んで欲しい。

そしてこれまでのところ、第4四半期もまったく同じ状況のように見える。たとえば:

  • フォーブスのAlex Konrad(アレックス・コンラッド)氏によれば、Notion(ノーション)が評価額100億ドル(約1兆1200億円)で2億7500万ドル(約308億6000万円)の資金調達ラウンドを行ったとのことだ(アレックスの最近の活躍は目覚ましい)。これは事実上のフリーキャピタルなのだ。それはなぜか?Notionは自社の2.75%の株式を2億5000万ドル(約280億5000万円)以上で売却したばかりだ。希薄化の観点から資本効率を考えれば、それは……安い。特に、収益の大きさを心配して実際には数字を公表していないスタートアップにとっては。Notionは今回のラウンドの前でも、前回のラウンドの大部分をまだ銀行に残したままだった。つまり同社は、少なくとも300億ドル(約3兆4000億円)のエグジットを果たすことに賭けるために、多額の資金を用意していた投資家たちから、2億5000万ドル(約280億5000万円)を調達したのだ。この先どうなるかを見守りたい。
  • そして先週、Modern Treasury(モダン・トレジャリー)は8500万ドル(約95億4000万円)のシリーズC調達を行った。ここでは、この「ペイメントオペレーション」フィンテック企業の価値が20億ドル(約2244億円)以上と評価されている。同社は2021年の初めにシリーズB調達を行ったが、PitchBookのデータによるとその際の評価額はおおよそ3億ドル(約337億円)だった。それは、とてもとても短い期間での価値創造だ!しかし、この数カ月間に見てきたことを考えると、かなり納得できるものでもある。

つまり、2021年の第2、第3四半期に比べて、第4四半期が減速しているようには見えないということだ。もし2022年が2021年のベンチャーキャピタルの総額を上回ることがないとすれば、このような投資が再び見られるのは何年後になるだろうか。

あとどれくらい生きている必要があるのやら。

ではまた。

画像クレジット:Nigel Sussman

原文へ

(文:Alex Wilhelm、翻訳:sako)

心と体はどのように進化し成功するのか、スタンフォード大学がAI生物でシミュレーション

人工知能は、プログラムされた心を持ち、デジタルな空間に浮かんでいる実体のないものと考えられがちだ。だが人間の心は体と深く結びついている。今回紹介する、仮想生物がシミュレーション環境でタスクを実行する実験は、AIが心と体を与えられることで、何らかの恩恵を受ける可能性を示唆している。

スタンフォード大学の科学者たちは、私たちが未開の状態から道具を使う類人猿へと進化する際の、物理的・精神的な相互作用について興味を持っていた。脳が身体の機能から影響を受けたり、またその逆の現象も起きたりするのだろうか。実際には、これは以前から指摘されていたことだ(1世紀以上前から指摘されていた)。確かに、モノをつかむことのできる手を使うほうが、それほど分化していない付属器官を使うよりも、より早く物体を操作することを学ぶことができることは明らかだ。

同じことがAIにも言えるかどうかは、開発がより構造化されているので直ちにはわからない。とはいえ以下のような考えがもらたす疑問には説得力がある。つまり、AIが初めから世界に適応するように進化していけば、AIはよりよく学び世界に適応できるのではないだろうか。

今回科学者たちがデザインした実験は、何十年も前から進化アルゴリズムのテストに使われてきたシミュレーション環境に似ているところがある。仮想空間を設定して、そこにシンプルなシミュレートされたクリーチャー(生物)を配置する。この段階では複数の連結された幾何学的形状がランダムに動くだけだ。そんな千匹のうごめく個体の中から、一番遠くまでのたうちながら移動した10匹の個体を選び出し、そこから千匹のバリエーションを作り出して、それを何度も繰り返す。ほどなく、ひと握りの多角形が仮想表面を、まずまず滑らかに横切って歩くようになる。

しかし、それはもう古い話だ。研究者たちが説明するように、シミュレーションをより堅牢で可変的なものにする必要があった。単に歩き回る仮想的な生物を作るのではなく、それらの生物が行動をどのようにして学習したのか、そして他の個体よりも良く学習したり速く学習したりするものがあるのかを調べようとしているのだ。

それを確かめるために、研究チームは、以前のものと同様のシミュレーションを作成しunimals(ユニマルス、universal animal=「普遍的な動物」の意、果たしてこの用語が市民権を得られるかどうか)と呼ばれる生物たちを、まずは歩くことを学ばせるためにシミュレーションに投入した。このシンプルな形状たちは、球状の「頭」と数本の枝状の関節を持つ手足を持ち、それらを使っていくつものおもしろい歩き方を編み出した。ある個体はよろめきながら前進し、ある個体はトカゲのような関節歩行を身につけ、ある個体は陸上のタコを思わせるようなバタバタとした、しかし効果的なスタイルを身につけた。

見よこの動き!(画像クレジット:スタンフォード大学)

ここまでは以前の実験と同じだが、似ているのはそこまでだ。

これらのユニマルスの中には、起伏のある丘や低い障壁を乗り越えることが強いられる、いわば異なる母星で育ったものもある。そして次の段階では、これらの異なる地形出身のユニマルスが、しばしば言われる「逆境こそが適応力の母」という言葉が正しいかどうかを観察するために、より複雑な課題で競い合った。

論文共著者のAgrim Gupta(アグリム・グプタ)氏は「この分野の先行研究のほとんどは、単純な平地でエージェントを進化させてきました。さらに、環境との直接的な感覚運動の相互作用を通じて、エージェントの制御や行動が学習されていないという意味では、学習は行われていません」とTechCrunchに説明した。「この研究は初めて、段差、丘、尾根のある地形のような複雑な環境で、進化と学習を同時に行い、複雑な環境での操作を可能にするものです」。

各環境の上位10匹のユニマルは、新しい障害物の出現、ボールをゴールに運ぶ、箱を丘に押し上げる、2つの地点の間をパトロールするといった課題が与えられた。ここでは「グラディエーター 」(ローマの剣闘士)たちが、真にバーチャルな根性を発揮したのだ。変化に富んだ地形の上を歩くことを学んだユニマルは、平地で育ったユニマルよりも、新しい作業を早く覚えて上手にこなすことができた。

画像クレジット:スタンフォード大学

米国時間10月6日、学術誌「Nature」に掲載された論文で著者らは「要するに私たちが発見したのは、進化は学習速度の速い形態を急速に選択することで、初期の祖先が一生の後半で学んだ行動を、子孫が一生のうちで早い段階で発現させることを可能にしていることです」と述べている。

単に速く学習することを学んだだけでなく、進化の過程で、より速く適応し、より速く学習を生かすことができるような体型が選択されたのだ。平坦な場所では、タコのようにジタバタしても同じように早くゴールできるかもしれないが、坂道や尾根では、スピード、安定性、適応性に優れた体型が選択された。この体をグラディエーターの闘いの場に持ち込んでみると、苦境を乗り越えたユニマルスたちは競争に強かった。彼らの汎用性のある身体は、頭で考えたことを実践するのに適しており、ジタバタするだけの競争相手にすぐに大差をつけた。

3Dの棒人間がバーチャルな地形を疾走するGIFを多少楽しめること以外に、これは何を意味するのだろうか。論文によると、この実験は「環境の複雑さ、形態的な知性、制御タスクの学習可能性の間に、学習と進化がどのように協力して高度な関係を作り出すのかについて、科学的な洞察を得るための、大規模な仮想実験を行うための扉を開くものです」ということだ。

例えば、4本足のロボットで階段を上るような、比較的複雑なタスクを自動化したいとしよう。動きを手動で設計したり、カスタムメイドのものとAIが生成したものを組み合わせたりすることもできるが、一番の解決策は、エージェントが自分の動きをゼロから進化させることだろう。この実験は、身体とそれをコントロールする心を連動させて進化することに、潜在的に大きなメリットがあることを示している。

コーディングに精通していれば、自分のハードウェア上ですべての操作を行うことができる。研究グループが、すべてのコードとデータをGitHubに無償で公開しているからだ。そして、ハイエンドのコンピューティングクラスターやクラウドコンテナも用意しておこう。なにしろ「デフォルトのパラメーターでは、16台のマシンでコードを実行することを想定しています。各マシンが72個以上のCPUを持つことを確認してください」とのことなので。

関連記事:かくれんぼで遊んでいたAIが道具の使い方やルールの破り方を自分で発見

画像クレジット:Stanford

原文へ

(文:Devin Coldewey、翻訳:sako)

AI開発のデータ不足を物理学を利用して作成した合成データで解決するRendered.ai

必要なデータを得ることができないため、ソフトウェアを提供するプロダクトやサービス、その企業が麻痺してしまうことがある。この問題を解決するために、創業2年のデータスタートアップRendered.aiは、人工衛星や医療、ロボティクス、自動車などの業界向けに合成データを作っている。

大きな意味では、合成データとは現実世界から集められるデータではなく人工的に作られるデータのことだ。Rendered.aiのCEOであるNathan Kundtz(ネイサン・クンツ)氏は最近のインタビューでこ「私たちが合成データという言葉を使うとき、実際に意味しているのは、工学的にシミュレートされたデータセットです。特に物理ベースのシミュレーションに重点を置いています」と語っている。

デューク大学で物理学の博士号を取得したクンツ氏は、衛星アンテナ開発会社であるKymeta Corporationを率いて宇宙産業に従事していた。Kymetaを退社した後、クンツ氏は他の小さな宇宙関連企業と仕事をするようになったが、彼は「ニワトリが先か、卵が先か」の問題に気づいた。

例えば、ある企業が衛星用の新しいセンサーを開発し、商品化のための資金を探しているとする。この企業は、そのセンサーが有用な知見を生み出すことができることを投資家に示す必要があるが、その洞察を得るためには、衛星を打ち上げて大量のデータを収集する必要がある。

「このデータへのアクセスがないことが、人工知能の妨げになっていました」とクンツ氏はいう。

投資家の関心

その「アクセス」を作り出すRendered.aiのアプローチは、投資家たちの関心を集めた。同社はSpace CapitalがリードしTectonic VenturesとCongruent Ventures、Union Labs、そしてUncorrelated Venturesが参加する600万ドル(約6億7000万円)のシードラウンドを調達した。

Rendered.aiは、物理ベースのアプローチの採用で、純粋に生成的な手法で合成データを作成する競合他社とは一線を画してる。競合他社は、純粋に生成的な手法で合成データを作成する。一般的には、敵対的生成ネットワーク(Generative Adversarial Network、GAN)と呼ばれるAI技術を用いて合成データのシミュレーションを行い、改良を加えていく。クンツ氏によると、新興産業ではデータがほとんどない、GANの有用性は限られているという。

企業がデータを取得する際には、コストがかかり、困難で、時間のかかる作業になるなどさまざまな要因がある。これらの問題は、合成開口レーダーで生成された画像のように、RGBでない画像の場合はさらに厄介になる。

では、物理学はこの新たな情報の生成という問題をどのように解決するのだろうか。クンツ氏は、「物理学の知識、例えば光が物体とどのように相互作用するかを支配する方程式を通して、これらのアルゴリズムを作成するプロセスに新しい情報を導入することができます。例えば、光が物体とどのように相互作用するかを支配する方程式などです」と述べている。

開発者のツールキット

Rendered.aiが開発したプラットフォームには、ノーコードの設定ツールや、顧客がデータセット上のパラメータをエンジニアリングして微調整するためのAPI、データセットのイントロスペクションやデータ分析のためのツールセットなどが含まれている。また、衛星画像など、顧客が興味を持つ特定のアプリケーションのためのスターターコードも提供している。同社はこれを「Platform as a Service」と呼ぶ。

Rendered.aiの顧客がシステムを使用するためには一定の専門知識が必要だが、その量は日に日に減少しており、資金の一部はプラットフォームを使用するために必要なスキルセットを継続的に低下させるために使用されるとクンツ氏はいう。

「私たちが目指しているのは、ブラウザーのボタンをクリックできる人なら誰でも合成データを生成でき、単なる合成データではなく、必要なタイプの合成データを実際にコントロールして、それを他の機械学習のワークフローに導入できることです」とクンツ氏はいう。

しかし、Rendered.aiは全知全能ではないため、合成データセットをもっと有効にし、アルゴリズムの機能性を良くするために必要なパラメータは事前にはわからない。そこで同社は試行錯誤の繰り返しと対話を重視して、顧客がアルゴリズムのギャップを見つけ、その盲点を理解できるようにしている。

クンツ氏によると、彼の考えでは合成データが現実データを完全に置換することはありえないが、現在の人工知能アプリケーションのますます深刻なギャップを填めることはできる。Googleのような企業は数兆の画像と山のようなデータセットに私企業としてアクセスできるが、Rendered.aiの顧客のデータ能力が、その状態にわずかに接近できるだけでも貴重だ。

Rendered.aiにはすでにひと握りの顧客がいるが、現状まだまだベータであるため、資金はプラットフォームへのアクセスを広げ、また特定業種の特定タイプのデータを作るために投じたいという。

画像クレジット:Rendered.ai

原文へ

(文:Aria Alamalhodaei、翻訳:Hiroshi Iwatani)

名古屋大学発、物流AIスタートアップ「オプティマインド」のルート最適化システム「Loogia」を佐川急便が全国的に導入

名古屋大学発、物流AIスタートアップ「オプティマインド」のルート最適化システム「Loogia」を佐川急便が全国的に導入

「ラストワンマイル配送におけるルート最適化サービス」の開発と提供を行うオプティマインドは10月4日、ルート最適化サービス「Loogia」(ルージア)の佐川急便への導入を開始した。佐川急便が集配業務で仕様する情報端末と、リアルタイムで最適な集配手順の決定を行うLoogiaをAPI連携し、ドライバー業務の効率化を図る。

Loogiaは、オプティマインドが開発し運営しているラストワンマイルのルート最適化クラウドサービス。ラストワンマイルとは、物流においては、顧客の手に届けるまでの最後の配達段階のことを言う。このラストワンマイル固有の制約条件を加味したアルゴリズム、地図ネットワークの分析、加工、ビッグデータの学習モデル構築といった独自のノウハウを活かしたサービスとなっている。配送情報を入力すると、40以上の「現場制約」を考慮した最適ルートを計算する。GPSなどから実際の走行データを読み込むことで、精度の高いルートの算出が可能とのことだ。

佐川急便では、配送ドライバーは、出発前に集配先の位置から集配順序やルートを決めているが、今まではドライバーの勘と経験によるところが大きかった。そこをシステム化することで集配順とルートが自動計算される。また、再配送など集配状況が変化した際にも自動でルートが再計算されるため、新人ドライバーも熟練ドライバーも変わりなく、業務が効率化される。

オプティマインドと佐川急便は、2020年8月、14日間の実地検証を行った。時間指定のものも含めて80個の荷物を習熟度の異なるドライバーに配達させ、従来の方法と、Loogiaを使った方法とで比較したところ、Loogiaを使ったほうは、ベテラン、新人とも、ルート組み時間、配送業務時間、走行距離が短縮された。名古屋大学発、物流AIスタートアップ「オプティマインド」のルート最適化システム「Loogia」を佐川急便が全国的に導入

この結果を踏まえ、2020年11月から12月にかけて、全国500名のドライバーに試験導入を実施。すると、とくに新人や習熟度の低いドライバーに有効性が示され、そうした経験の浅いドライバーから継続利用の要望が強く寄せられたことから、全国導入が決まった。

さらにこの試験導入により、Loogiaをドライバー端末に搭載する際の操作性や、配送業務におけるドライバーノウハウのアルゴリズム化といった課題が顕在化した。今後も、課題解決に向けた検討を続けてゆくという。

24時間信頼できるAIの構築を目指しAI品質保守の自動化ツールを提供するCitadel AIが1億円調達

24時間信頼できるAIの構築を目指しAI品質保守の自動化ツールを提供するCitadel AIが1億円調達

「24時間信頼できるAIをあなたに」をビジョンに、AIの品質保守の自動化ツールを提供するCitadel AIは10月4日、シードラウンドにおいて合計1億円の資金調達を実施したと発表した。引受先は、東京大学協創プラットフォーム開発(東大IPC)、ANRIがそれぞれ運営するファンド。現在創業期ソフトウェアエンジニアの募集を進めており、調達した資金をベースにエンジニアリングチームを拡充し、2022年の商用化サービスに向け開発を加速化する。

2020年12月設立のCitadel AIは、米Google Brainの元AIインフラ構築責任者が開発をリードするスタートアップ。東京を拠点としつつ、インターナショナルなチームを構築しており、グローバルな市場を狙っているという。

同社提供の「Citadel Radar」(β版)は、顧客のAIの品質を自動モニタリングし、AIの入出力の異常を自動検知・ブロックの上、人間が理解できる形で可視化する機能を搭載したシステム。現在大手製造メーカー、システムインテグレータやAIベンチャー企業など10社以上で試験利用を開始しているそうだ。24時間信頼できるAIの構築を目指しAI品質保守の自動化ツールを提供するCitadel AIが1億円調達24時間信頼できるAIの構築を目指しAI品質保守の自動化ツールを提供するCitadel AIが1億円調達24時間信頼できるAIの構築を目指しAI品質保守の自動化ツールを提供するCitadel AIが1億円調達

従来のソフトウェアの場合、そのロジックが外部環境の影響を受けて変化することはなく、システムの性能や品質を監視するさまざまなツールも提供されている。一方AIの場合、外部環境の影響を受けやすい特性があるにも関わらず、AI固有のリスクから顧客を守る仕組みが確立されていない。

Citadel AIは「24時間信頼できるAIをあなたに」をビジョンに、開発時から運用時まで、自動化を通じてこの課題をエンドツーエンドで効率的に解決するソリューションを提供することで、企業や社会をこうしたリスクから守るとしている。

Citadel AIは、AIが誤認識・誤判断し、ビジネス上の損失やコンプライアンス問題として顕在化する前に、異常を自動検知しAIの品質を保つことは、今後のビジネスにとって非常に重要と指摘。AIの社会実装が進む中、同社システムは、これからの社会・企業経営にとって必須としている。

現場に「使える」AI・アルゴリズムを提供するALGO ARTISがシリーズAエクステンション完了、合計調達額5.28億円に

現場に「使える」AI・アルゴリズムを提供するALGO ARTISがシリーズAエクステンション完了、合計調達額5.28億円に

AI(アルゴリズム)のコンサルティングおよびソリューションを提供するALGO ARTISは9月30日、2021年7月に続くシリーズAエクステンションラウンドにおいて、第三者割当増資による資金調達を2021年9月に完了したと発表した。新たな引受先は、東京大学エッジキャピタルパートナーズをリードインベスター、K4 Ventures、みやこキャピタル。シリーズAラウンドにおける合計調達額は5億2800万円となった。調達した資金は、エンジニアといった人材の獲得費用にあて、プロダクト開発を促進し主要事業の成長をさらに加速させる。

ALGO ARTISは「社会基盤の最適化」というミッションを掲げ、コンサルティング・デザイン・システムの力を活用して優れた最適化AI(アルゴリズム)を現場に導入し、継続的に価値を提供することを目指す事業を展開している。

プラントやロジスティクスのスケジュール管理をはじめとする幅広い社会基盤の管理業務を対象としており、現場で継続的に利用されるよう、入念なヒアリングとコンサルティングを経てアルゴリズム・デザイン・機能を設計・実装している。また、実装の過程ではプロトタイプを提供し実際に利用してもらうことで、机上では把握できない課題を抽出し、改善を繰り返すことでスムーズな現場への導入を実現しているとのこと。

ビジュアル検索「Googleレンズ」アップデート、グーグルがAIで画像とテキストを1つのクエリにまとめる新検索方法を近々導入

2021年5月、Google(グーグル)は年次開発者会議「Google I/O」において「Multitask Unified Model(MUM)」と呼ばれる新しいAIマイルストーンを紹介した。この技術はテキスト、画像、動画など、さまざまな形式の情報を同時に理解し、トピック、コンセプト、アイデアの間の洞察やつながりを導き出すことができる。同社は米国時間9月29日、MUMを自社製品で活用する方法の1つとして、ビジュアル検索「Googleレンズ」のアップデートを発表した。

Googleレンズは、携帯電話のカメラを使って、リアルタイム翻訳、植物や動物の識別、写真からのコピー&ペースト、カメラのファインダーに写っているものと類似したアイテムの検索、数学の問題の手助けなど、さまざまなタスクを実行できる同社の画像認識技術だ。

近い将来、Googleは、MUMの機能を活用してGoogleレンズをアップグレードし、視覚的な検索にテキストを追加して、ユーザーが見ているものについて質問できるようにするという。

実際には、この機能は次のような使い方ができる。例えば、気に入ったシャツの写真をGoogle検索で表示した後、レンズのアイコンをタップして、同じ柄のもの、だが今度はソックスをGoogleに探してもらうことができる。そこに「この柄のソックス」とでもタイプ入力することで、テキスト入力だけでは難しい、関連性のあるクエリをGoogleに指示することができる。

画像クレジット:Google

 

これは、現在のGoogleが苦手としているタイプのクエリ、つまり、言葉だけでは説明しにくい、あるいは異なる方法で説明できるような、探しているものに視覚的要素がある場合には、特に有効だ。画像と言葉を1つのクエリにまとめることで、Googleはより適切な検索結果を提供できる可能性がある。

別の例では、自転車の部品が壊れてしまい、修理のヒントをGoogleで検索する必要があるとする。しかし、その部品が何という名前なのかはわからない。修理マニュアルを調べる代わりに、自転車の壊れた部分にGoogleレンズを当てて「修理する方法」と入力してみることができる。そうすれば、助けになりそうな動画の瞬間に直接つながるかもしれない。

画像クレジット:Google

Googleは、このようなAIを活用した取り組みは、新しい検索の仕方を可能にすることで、自社製品をエンドユーザーにとって「より役に立つ」ものにする方法だと考えている。同社は、検索の一部に携帯電話のカメラを利用することで、コアなユースケースの多くが他のプロパティに移行し始めている市場での存在感を維持しようとしている。例えば、今日、ショッピングの検索は多くの場合、直接Amazon(アマゾン)で始まる。また、iPhoneユーザーは、携帯電話で何か特定のことをしたいとき、Siri、Spotlight、App Store、またはネイティブアプリに助けを求めることが多い。そしてApple(アップル)は、Google検索に代わる独自の検索サービスを開発している。iOS 15でアップデートされたSpotlight検索では、Google検索に頼らず、ユーザーが必要とする情報に直接アクセスできるようになった。

Googleは、Google検索やビデオ検索においてもMUMを活用していくと、29日開催されたライブイベント「Search On」で発表した。

なお、Googleレンズのアップデートは今後数カ月のうちに実施される予定だという。そのためには、新しいAIモデルを導入する際には必ず実施される「厳格なテストと評価」を行う必要がある、と同社は述べている。

画像クレジット:Google

原文へ

(文:Sarah Perez、翻訳:Aya Nakazato)

東京大学がシンクロダンスの練習支援システムSyncUp発表、コンピュータービジョン技術でポーズ・動きのズレ可視化

東京大学がシンクロダンスの練習支援システム「SyncUp」発表、コンピュータービジョン技術でポーズ・動きのズレを可視化

SyncUpインターフェース全体図。画面上部左にダンス動画、上部右はポーズのズレを可視化する動画上にオーバーレイを示している。掲載写真の例では、左腕がダンサー間で大きくずれているため、赤色のオーバーレイが表示されている。また画面下部では、ポーズと動きのタイミングのズレをグラフで示したものがユーザーに提示している

東京大学大学院工学系研究科の矢谷浩司准教授、周中一(ジョウ・ツォンガイ。Zhongyi Zhou)氏、徐安然(ズ・アンラン。Anran Xu)氏は9月28日、コンピュータービジョン技術を応用したシンクロダンスのポーズのズレを可視化する練習支援システム「SyncUp」(シンクアップ)の構築を発表した(SyncUp: Vision-based Practice Support for Synchronized Dancing)。

SyncUpは、コンピュータービジョン技術により抽出されたスケルトンデータをもとに、体の各部位の相対的な位置の差異を定量的に検出することで、ダンサー間のポーズの類似性を推定する。またシンクロダンスでは、常に全員が同じ動きをするとは限らない。その場合はどれだけ同期性が高いかシンクロ感が出る。そこで、各ダンサーがどのタイミングで体の部位を動かしているかも定量的に推定するアルゴリズムを実装しているという。つまり、体の動きとタイミングの両方の差異がわかる。

特別な機器は必要とせず、ダンスの練習動画をアップロードするだけで使えるため、アマチュアのダンサーにも気軽に利用できるとのことだ。タイミングや動きのズレは、グラフ化されると同時に、実際の動画の上にオーバーレイとしてズレている体の部位やズレの程度が示される。

東京大学がシンクロダンスの練習支援システム「SyncUp」発表、コンピュータービジョン技術でポーズ・動きのズレを可視化

オーバーレイの例。ポーズのズレの大きさに応じて色が変化する。赤色に近い色ほど、ズレが大きいことを示す

実験を行った結果、SyncUpの認識結果がダンサーの主観的な評価とおおむね一致したとのこと。練習の効率が上がるほか、ダンサー同士のコミュニケーションが円滑になるという。また実験では、この技術を応用して、うまく踊れた部分だけを自動抽出し、ハイライト動画を生成してSNSなどで公開する方法の可能性も確認された。

同研究科では、SyncUpを「人々の芸術的表現を支援する人工知能技術の新しい応用を示すもの」としている。