グーグルが発話障がい者のための音声認識・合成アプリ「Project Relate」 をテスト中

Google(グーグル)が、発話障がいがある人たちにコミュニケーション手段を提供するAndroidアプリの開発で、テスターなどの協力者を求めている。Project Relateと名づけられたプロジェクトおよびアプリは、音声の書き起こしと合成を提供し、言葉の理解をサポートする。

Project Euphonia」がこのプロジェクトの始まりで、TechCrunchは2019年に発表されたときに取り上げ、その後の研究についても触れている。その研究開発努力のリーダーはGoogleの研究科学者Dimitri Kanevsky(ディミトリ・カネフスキー)氏で、彼自身も発話能力に障害があり、その体験者としての知識をAIを用いるソリューションに持ち込んだ。現在、このプロジェクトの主要パートナーでアプリのユーザーでもあるAubrie Lee(オーブリー・リー)氏はマーケティングのチームにも所属しておりアプリの命名者でもあるが、筋ジストロフィーのため自分の言葉を人やアプリに理解してもらうのが難しい。彼女の様子は動画で見ることができる。

シンプルな事実として、AIによる音声認識は、人の発話を正しく理解できるようになるために大量の録音された発話を必要とするが、しかしそれらのデータは多くの場合、健常者の発話パターンに偏っている。訛りや変わったアクセントのある発話はAI用の教材として使われていないことが多いから、それらの理解もできない。発話障がいの人びとの喋りが含まれていることは、さらに稀だ。そこで、通常の音声認識デバイスを彼らは使えない。

第三国などで特殊なアクセントで喋られる英語の理解は最近改善されているが、しかし障害などで個人によって強烈なクルのある発話パターンを集めて分析するのはとても難しい。声は人によってみな違うが、脳卒中や重度傷害などで相当特殊なパターンになってしまった発話を機械学習のシステムに正しく理解させるのは困難だ。

関連記事:インドやフィリピンなどアクセントが異なる英語の認識が向上した音声認識モデル「Speechmatics」

Project Relateの中核にあるのは、障がい者のための改良された音声書き起こしツールだ。その「Listen」ファンクションはユーザーの発話をテキストに変換する。それをどこかにペーストして、他の人が読むことができる。「Repeat」は、入力された発話を繰り返すが、2度目はやや聞き取りやすく加工されている。「Assistant」は書き起こしをGoogleアシスタントに転送して、音楽の再生や天気予報など単純なタスクをやらせる。

その能力を実現するためにGoogleはまず、できるかぎり多くのデータを集め、ボランティアによる100万以上の発話サンプルをデータベースに収めた。それらを使って、音声認識AIの基底的インテリジェンスとでも呼ぶべきものを訓練する。機械学習システムの例にもれず、これもまたデータは多ければ多いほど良いが、個々のユースケースに対応できるためには、特異なデータが多いほど良い。

 

Google ResearchのプロダクトマネージャーであるJulie Cattiau(ジュリー・カティアウ)氏は、TechCrunch宛のメールでこんな説明をしてくれた。

ターゲットのオーディエンスが必要とするものを事前に想定することを避けたかった。そのための最良の方法は、このプロダクトを利用すると思われる人たちと一緒になって作ることです。そうした人たちの最初の集団をテストに参加させることにより、アプリケーションが多くの人の日常生活の中でどのように役に立つかを、良く理解できました。どれほど正確であるべきか、どこを改良すべきかを理解してから、広範なオーディエンス向けに拡張しました」。

同社は、日常生活の中でこのアプリを試用してくれる、第一ラウンドのテスターを募集している。最初のステップではフレーズを集めて記録し、それを発話のモデルに組み入れて多様な発話パターンに対応する。このやり方なら自分の日常生活にも役に立ちそうだ、と思った方はボランティアに応募できる。あなたも、このアプリの改良に貢献できるだろう。

画像クレジット:incomible/iStock

原文へ

(文:Devin Coldewey、翻訳:Hiroshi Iwatani)

5〜15歳対象のオンライン読書教育「ヨンデミーオンライン」のYondemyが1億円調達、教材拡充・保護者向けアプリを開発

スマートニュース子会社スローニュースがノンフィクション特化のサブスク型サービス「SlowNews」で立花隆作品配信

児童向けオンライン読書教育の習い事サービス「ヨンデミーオンライン」を提供するYondemyは11月9日、第三者割当増資による総額1億円の資金調達を実施したと発表した。引受先はXTech Ventures、D4V、W ventures、F Ventures。

調達した資金は、ヨンデミーオンラインへの開発投資と人材採用にあて、児童UX・保護者UXそれぞれの改善と組織体制の強化へと活用する予定。具体的には、児童向けウェブアプリにおける新機能開発や動画コンテンツなどの教材拡充、保護者向けウェブアプリの開発、今後の組織拡大を見据えた人材採用などへと投資し、事業基盤・経営基盤を強化することで、中長期的な成長を加速する。

ヨンデミーオンラインは、5~15歳を対象とした月額定額制のオンライン読書教育の習い事サービス。「児童それぞれの興味・読む力に寄り添った選書指導」「『本の楽しみ方』などが学べるチャット形式の対話型学習コンテンツ」「ゲーミフィケーションやコミュニティを活かしたモチベーション設計」の3点を特徴とする。

また同サービスの「AI司書ヨンデミー先生」では、好み・興味に合わせるだけではなく自然にステップアップしていけるように本を薦めるという。独自分析した1000冊以上の児童書データについて、ヨンデミー講師の選書ノウハウを再現した独自開発アルゴリズムにより活用しているそうだ。これにより、読む前の本を手に取るきっかけ作りから、読んだ後のコミュニティでの感想シェアや親子の会話まで、児童の読書体験サイクルを一気通貫で支え、習慣化をサポートする。

さらに、学校では教わることのない本の楽しみ方や感想の書き方を学べるレッスンを提供。レッスンは選択式のクイズ形式になっており、文字入力の必要がない上24時間いつでも受講可能。読書をより楽しくするため、読んだ本の表紙や獲得したバッジを蓄積することで読書へのモチベーションを高めるゲーミフィケーション要素も備える。ヨンデミー生同士による感想シェアにより、読書意欲を刺激すると同時に、新たな本との出会いも生み出すとしている。

2020年4月設立のYondemyは、「日本中の子どもたちへ豊かな読書体験を届ける」というミッションを掲げる、現役東大生によるスタートアップ。「読書を習う」という新しい文化を広めるとしている。習い事の選択肢として「読書」が当たり前にある社会を作ることで、読書教育を通じて日本中の児童を「自立した読み手」へと育て、1人1人の一生にとって読書がかけがえのない武器となることを目指す。

Landing AIがデータセントリックMLOpsツールで次世代AIを実現するため約64.5億円の資金を確保

Landing AI(ランディングAI)は、主力製品の発売からわずか1年余りで、製造業者がより簡単かつ迅速に人工知能システムを構築・導入できるツールの開発を続けるために、5700万ドル(約64億5000万円)のシリーズA資金を獲得した。

元GoogleとBaiduのAI第1人者であるAndrew Ng(アンドリュー・ン)氏が立ち上げた同社は、AIとディープラーニングを応用して製品の欠陥をより迅速かつ正確に見つけることができる目視検査ツール「LandingLens」を開発した。

ン氏は、産業界はAIの構築にデータセントリック(=データ中心)アプローチを採用すべきだと述べている。これは、メーカーがAIモデルに何をすべきかを教えるためのより効率的な方法を提供するもので、マウスを数回クリックするだけで高度なAIモデルを1日足らずで構築できるノーコード / ローコード機能を備えている。

「我々はデータセントリックAIのムーブメントをキックオフし、他の企業がそれを話題にし始めたことを非常に喜ばしく思っています」。と同氏はTechCrunchに語った。「製造業では、工場ごとに異なることをしているので、多くのマンパワーを雇うことなく、1万社のメーカーが1万種類のモデルを作るのをいかに支援するかが問題になります」。

創業者兼CEOのアンドリュー・ン氏(画像クレジット:Landing AI)

マッキンゼーの調査によると、AIは2030年までに世界の経済に13兆ドル(約1470兆円)の実現価値を生み出すと予想されている。ン氏は、さまざまなAIモデルを構築することが依然として困難であるため、まだその多くが実現されていないと語る。

同氏は、Landing AIがこれらのモデルを構築するためのコードを解明したと考えており、製品のマーケットフィットを確認し、製品をより良くするためにチームを拡張できるようにしたいと考え、シリーズAラウンドを調達した。

インダストリアルIoT(IIoT)に特化した投資会社であるMcRock Capitalがこのラウンドを主導し、Insight Partners、Taiwania Capital、Canadian Pension Plan Investment Board(CPP Investments)、Intel Capital、Samsung Catalyst Fund、Far Eastern GroupのDRIVE Catalyst、Walsin Lihwa、AI Fundが参加した。

Landing AIは製品の構築に向けて前進しているが、ン氏は、同社がデータセントリックAIムーブメントの初期段階にあることから、さらなる進歩を遂げ、まだ不足している技術を革新していきたいと述べている。

例えば、以前、3億5千万のデータポイントを持つ音声認識システムを構築した際、それだけ多くのデータポイントのために発明されたAI技術は、欠陥を見つけるための画像が限られている製造現場ではうまく機能しないことがわかったという。データセントリックな動きの一環として、50枚以下の画像を活用して、何が欠陥なのかを明確に示すことで、ドメインエキスパートを支援するツールを開発している。

ン氏は次のように述べている。「当社はこれが機能する段階に達しており、すべてをスケールアップしたいと考えています。どうやってレシピを解読してAIを他の業界に持っていくか、何年も前から関心を持ってきましたが、データセントリックAIでようやくそれが実現しつつあります」。

画像クレジット:Landing AI

原文へ

(文:Christine Hall、翻訳:Aya Nakazato)

ナイキのアスリート革新方法「ナイキスポーツリサーチラボ」とは

アマチュアスポーツ向け映像分析ツールのSPLYZAが約2.5億円調達、SPLYZA Teamsの機能追加や新製品開発・マーケ強化

8年前、Nike(ナイキ)はナイキスポーツリサーチラボ(NSRL)を拡張することを決意した。その当時、NSRLは本社の向かいにあるミアハムビルディングに入っていた。

現在NSRLは当時の5倍の規模となり、新設のレブロン・ジェームズ・イノベーションセンターの最上階で研究を行っている。このセンターは非常に広く、そのためアスリート、研究者、イノベーターたちが私たちの日々着用する製品の開発を共同で行うことを可能にしている。

研究者は、サッカーのスター選手であるMegan Rapinoe(ミーガン・ラピノー)氏や、世界最速のマラソンランナーであるEliud Kipchoge(エリウド・キプチョゲ)氏について、両足のミリ単位の違いから足が地面につくたびにどれくらいの力が地面に伝えられているかまで、あらゆることを研究しガイドラインを作成する。そしてクリエーターがそれを元にパフォーマンスを強化することの可能なアパレルや靴をデザインする。アスリートはナイキの科学者のサポートを受けながらトレーニングし、自分自身や自分の身体についてより深く知ることで、パファーマンスの向上に役立てている。

しかし、NSRLはただ単に世界のエリートアスリートのためだけに研究を行っているのではない。NSRLは、街の公園のコンクリートコートでバスケットボールをしている人や、一般のランナー、ナイキの「最もタフなアスリート」フィルムで強調されているような、妊婦や新しく親になった人向けの研究も行っているのだ。

ナイキのエクスプロア・チームスポーツ・リサーチラボ副所長のMatt Nurse(マット・ナース)氏は、ナイキが他社に先駆けてより深い理解をより速く追求しようとすることはたびたびあるという。

「ビックデータといった科学や、機械学習およびAIを使用した観察を通し、よいパフォーマンスを引き出すためのさまざまな新案を見出そうとしています」。

ナース氏によると、ラボを訪れる人の80%から85%はさまざまな体の特徴を持つ、多様なバックグラウンドの一般アスリートだという。ナイキは、この新しい環境で何千人もの人をラボに迎え入れる計画で、これを通し新しい知見を得、開発の速度を高めようとしている。

ナイキは最近、メディアの人々を招待し、ナイキ製品の開発のためにアスリート、研究者、イノベータが一丸となって取り組んでいる様子を取材者自身に体験してもらう取り組みを行った。

レブロン・ジェームズ・イノベーションセンターの入り口(画像クレジット:Rae Witte )

75万平方フィートのレブロン・ジェームス・イノベーションセンターの入り口は、データとデザインを活用してイノベーションを生み出そうという、ナイキが約10年に渡って行ってきた取り組みの方向性を伝えるものとなっている。

レブロン・ジェームズはプロとして通算3万ポイントを達成したわけだが、彼が打ったすべてのシュートがどの位置からのものだったのかを示すマークが、ゴール前のつややかなコンクリートフロアの上に記されている。シュートが決まった場合には金色の点、はずれた場合にはただの円になっている。特別なシュートにはやや大きめの文字入りのマーカーがついているが、そこには彼の最初のシュートと、2万ポイント目のシュートも含まれている。

メインフロアの上は、アパレル、シューズのプロトタイプが置かれていて、デザイナーやクリエイターがロボットや3Dプリンターを使って仕事をするスペースになっており、ニット、ファブリック、刺繍セクションもある。また、ナイキの共同創設者であるPhil Knight(フィル・ナイト)氏が陸上競技会場へ出向くのに使用したトラベルトレーラーであるウィネベーゴの複製すらある。ナイト氏は、アスリートからフィードバックを得ようと競技会場でナイキの最も初期の靴を配ったのだ。

8万4000平方フィートのNSRLは建物の最上階を占め、そこで研究者とアスリートがともにナイキの靴や服を開発する。NSRLには、フルサイズのNBA企画のバスケットボールコート、200メートルの陸上トラック、人工気候室、人工芝のフィールドが設けられている。これらのエリアには、フォースプレート92個、モーションキャプチャカメラ400台、プロトタイピングマシン80台が置かれている。

ナース氏が豪華な体重計と表現するフォースプレートが、トラックや人工芝やバスケットボールコートの下に配置されている。通常の体重計は乗ると1つの数値を示すだけだが、フォースプレートは、垂直の動きだけでなく、横や前後の3次元の力のかかり方を1秒間に数万回測定可能という。

例えば、ランナーがトラック上にいる場合、足が地面に着地しそして蹴り出す力を測定することができる。

NSRLには余剰スペースがあり、そのため流動的で制限の少ないゲームプレイと動きの測定が可能である。

「ここでの目標の1つは、アスリートがフルスピード、フルモーションで持続的にプレイできるようにすることです。規模の小さな施設だと決められた動きしかできず、それ以上の研究ができないことがあります。私たちの施設では、アスリートに自由に動いてプレイしてもらうことができます」とナース氏はいう。

ラボでのテスト

ここにあるすべてのツールをどのように使用して制御された実験を行い、観察のためのビックデータを収集するかを研究者に知らせるためには「量、行動、反応」の三角形の3つの柱を理解する必要があるとナース氏はいう。「私たちが量、行動、反応を把握することができれば、プロトタイプから情報を得ることができます。これが問題解決のいとぐちになると思います」。

ラボの見学ツアーで、私たちはナイキがアスリートのためにデザインしたのと同じ、バスケットボールコート、陸上トラック、人工芝、そしてトレッドミルなどでのテストを体験した。

まず全身スキャンを行って、どのナイキアパレルが最適かを決定し、形態学的な身体サイズの追跡と骨格筋および筋肉の非対称性の調査、足と足首の3次元スキャン、裸足歩行圧テスト、といったベースラインデータの収集を行ったあと、応用パフォーマンスイノベーショントレッドミルの上を走った。私は快適に感じるジョギングスピードを選び2、3分走るように指示をされたのだが、その間、研究者は分析のためにそれを記録した。

研究者は、アスリートの走り方が跳ねすぎてはいないか、つま先で走っているか、前傾姿勢になりすぎていないかなど、フォームについての観察結果を知らせてくれる。

また、研究者は機能的なアドバイスもしてくれる。例えば、前傾姿勢になりすぎているランナーはより効率よく走るために、臀筋またはハムストリングスを強化する必要がある、といった具合である。

研究者は、生体力学的な知識と、製品やアスリートを理解するためのアルゴリズム開発を通じて、このテストをベースラインデータと組み合わせ、より速く走ることができるか、より長時間走ることができるか、そして体へのストレスのかかり具合が少ないかどうかなど、最も効率のよいパフォーマンスをするための靴についてアドバイスをしてくれる。

トラック

トラックは、人工芝のフィールドとバスケットボールコートを囲む形で配置されている。トラックには長時間のランニングや、スタートといったより個別化したテストに使用することのできるフォースプレートやモーションキャプチャカメラが装備されている。ledラビットまたはペーサーにより実験にさらにもう1つの制御がかけられ、また屋外を走るシュミレーションのために100メートルのコンクリートストリップが設けられている。

トラックでは、二足の靴をテストすることができた。そのうちの1足、Infinity Reactsは足の保護と身体へのストレスの軽減、安定性を重視した靴である。私はこの靴を履き、ナイキランクラブの平均ランナーのマイルペースである11分37秒より速く、そしてマラソンを2時間未満で走るエリウド・キプチョゲ氏よりだいぶ遅いのだが、自分が快適に感じられる速度で(1日中トラックを回転している緑に光るLEDペーサーがペースを知らせてくれる)トラックを周回することができた。

しかし、エリートランナー用の紐靴、ZoomX Invincibleを履いて1周しようとした時、私たちはそのクッションシステム(誇張されたフォームとエアシステムソール内にカーボンプレートを備えた超軽量のシステム)が私の足に合わないことを発見した。

私の足の幅は狭く、足首は以前怪我をしたことがある上フレキシブル(あるいはゆるいまたは弱いと私は考えている)である。ランニングフォームは適切であることがわかったものの、私がランナー向きではないことは認める。クッションシステム構造は一部のランナーには最高に効率がよいのだろうが、私には合わず、走りが非常に不安定になってしまった。

ナイキスポーツリサーチラボのトラックを走るアスリート(画像クレジット:Nike)

これが幅広くアスリートを調査する必要がある理由である。キプチョゲ氏のようなランナーを研究することは信じられないほど貴重なことである。というのも彼は非常に効率のよい体をしていてマラソンを完走するのに5時間も必要としないため、それほど長時間走ったことがないのだ。しかし、世界の平均マラソンランナーの所要時間は4時間20分から4時間40分の間である。

この広範囲に渡るデータ収集により、複数の靴を通じて靴の革新を行うことができ、それによってナイキが、エリートマラソンランナーか一般のジョガーかに関わらず、どのランナーにも合う靴を開発することが可能になっている。

人工芝

人工芝の研究を行うターフラボはNSRLで最大のデータキャプチャ量を誇り、ナイキによると、そのデータ量は世界最大かもしれないとのことだ。人工芝の下にはフォースプレートが装備され、ゲームでの動きやより制御された実験のモニターが行われている。研究者は異なるスピードで異なる方向へ動きながら、他のプレイヤー、人工芝、クリーツ、ボールに関与している最大22人のプレイヤー(実際にサッカーのゲームをした場合にフィールドにいる人数である)のデータを集めることができる。また人工芝はターゲットを投影することのできるスクリーンを備えており、シュートやパスの正確性を記録することができるようになっている。

ナイキはサッカーシューズでは2つの部分に特に力を入れているのが、それらは機能的に非常に異なっている。ソール部分は移動のための推力が必要であり、一方上部はドリブル、パス、キックのための動きが重要になってくる。

ナイキスポーツリサーチラボでのゴールのシュートのシミュレーション(画像クレジット:Nike)

フィールドの周囲には200台のカメラが設置され、サブミリメーターの動きをキャプチャしており、ターフの下には15台のフォースプレートが配置されている。制御された環境でアスリートの動きを計測することで、研究者はパフォーマンスのための、そして保護のための極めて小さな変化を突き止める事ができ、そうした発見の多くは野球、フットボール、ラグビーなどの他のフィールドスポーツに適用される。

サッカーのテスト中、私はゴールを狙う動きのシミュレーションを行った。これにはあたかもディフェンダーをタックルしているかのようなシャトルランや、ディフェンダーの周りを走ること、ゴール内にあるスクリーンに投影されたターゲットにシュートをする、といったことが含まれていた。

このシミュレーションでは、私がカットバックした際の力、定められたルート全体でのタイミングや俊敏性、ターゲットが投影された瞬間の私の意思決定のタイミング、ボールがターゲットに対してどれだけ正確にあたっているかがキャプチャされた。

このテストの結果はアスリートの体格、彼らにどれほどの爆発力があるか、そして彼らがフォースプレートをどれだけ速く押し出すことができるかを物語る。シューズの推力に加え、力が彼らの動きのスピードに変換される。推力が不十分な場合、同じレベルの力では速度は遅くなる。

推力に優れてはいるが、靴の上部の作りのために、足を包み込む性能に乏しい靴の場合、靴の中で足が滑ってしまう。靴が地面と効率よく作用している一方、足そのものは効率よく作用していないからである。

対照的に、上部が足を包み込む性能に優れていても推力に乏しい場合は、靴は足にはフィットするものの、地面の上で滑ってしまう。こうしたデータにより靴に修正を加えることができるようになっている。

バスケットボールコート

近くのバスケットボールコートの下にもフォースプレートが設置されていて、バスケットボールプレイヤーのために、同様のデータをキャプチャしている。

プレイヤーはモーションキャプチャカメラに取り囲まれ、心拍数やコートでの動きの速度を追跡するセンサーを身につけている。センサーで追跡された数値は、壁にある大きなスクリーンにリアルタイムで投影されている。これらに加え、フープの下に4Kカメラを備えたフォースプレートがあり、スニーカーのソールがフロアとどのように相互作用するかを記録することができる。

スニーカーの剛性あるいはソールの厚みに応じ、靴によってスピードがどの程度影響を受けるのかを、データを追跡するモーションセンサーと組み合わせて追跡し、センサーが動き全体を通してアスリートの心拍数を追跡している間、ソールが床とどのように接触しているかをすべて観察および確認することができる仕組みだ。

フープ内に設置されている別のカメラは、フープ内を通過するボールの位置を記録する。これらのシュートから収集されたデータは、フープを通過するより一貫した効率的なシュートを生み出すにはどういった機能調整が必要かを示してくれる。

  1. Basketball-at-the-Nike-Sport-Research-Lab1

    (画像クレジット:Nike)
  2. Basketball-2

    (画像クレジット:Nike)
  3. Basketball-at-the-Nike-Sport-Research-Lab3

    (画像クレジット:Nike)
  4. Basketball-at-the-Nike-Sport-Research-Lab4

    (画像クレジット:Nike)
  5. Basketball-at-the-Nike-Sport-Research-Lab5

    (画像クレジット:Nike)
  6. Basketball-at-the-Nike-Sport-Research-Lab6

    (画像クレジット:Nike)
  7. Basketball

    (画像クレジット:Nike)

 

人工気候室

着用者による水分管理のニーズの違いを理解することで、デザイナーは、より機能的な服を作るガイドラインを得ることができる。私たちは暑い気候室と寒い気候室の2つの気候室を見学した。この気候室は、気温を-20度から50度以上に、湿度を10%から90%まで、そして風速を調節できる。また、太陽光線の出方と一致する2種類の電球を使用して、太陽の放射熱をシミュレートすることができるようになっている。

気候室はこうした精度で設定できるため、私たちが訪れた日は、ホットタンクが摂氏34度、湿度70%と、この夏にオリンピックが開催された8月6日の東京とまったく同じ気候に設定されていた。この温度と湿度のために、スタッフやアスリートの中には、熱性疲労で手当を受けなければならない人々もいた。

気候室を活用することで、ナイキは、アパレルデザインまたは機能のゾーニングのどういった違いが衣服の通気性に最大の影響を与えるのかを評価することができる。

人は汗をかくことで体温の調節をすることができるので、高温の気候室はアスリートの発汗反応とそれらが性、年齢、体の大きさでどう異なるのかを研究するのに使用されている。

スタッフは、私たちにヴェイパーマッチメンズサッカージャージを示し、ニットを変化させ最も発汗が多い部分へゾーニングしたことを示した。その様子はここの三枚目の画像で確認することができる。

逆に、ナイキNSRLトランスフォームジャケットは、屋外でのランニングに必要なさまざまな温度管理に対応したものになっている。袖は取り外してジャケットの裏にある収納場所に収めることができる他、ダウンの中綿を取り外すことが可能。このため、外へ出た直後から体が温まるまでの体温の変化に対応できるようになっている。研究により、ランナーの一日の走行距離の平均は5キロで、体温調節が最も必要になるのは、スタートから2.5〜3キロのあたりであることがわかった。そこを超えると体温は一定になり、それは5キロ以上走るランナーにも当てはまる。

最後になるが、なんとここには汗をかくサーマルマネキンがあり、人体にストレスをかけることなくゾーニング機能をテストすることができる。気候を調節できる部屋と決して疲労しないサーマルマネキンがあるため、デザインチームは多くの仕事をこなすことができるのだ。

クールダウン

私たちは、スポーツの世界において「精神的強さ」という言葉をよく耳にする。それらがパフォーマンスに影響を及ぼすとあって、ナイキがアスリートの心理を理解しようとしているのは理に適っている。

NSRLのラボでは、マッサージや鍼の他、身体が休養と維持のために必要とするものを利用できるが、彼らの研究はそういった身体的ニーズをはるかに超えたもので、被験者の精神状態をも研究対象としている。

メンタルヘルスは、メディアにおいてエリートアスリートについてのディスカッションのトピックになっている。Naomi Osaka(大阪なおみ)氏が記者会見を回避したり、 Simone Biles(シモーネ・ヴァイルス)氏が2020年の夏のオリンピックの体操女子総合決勝に欠場する必要性について公にするなどがその例である。

ベースライン測定を行う前に、私は認知評価を受けたのだが、これをもとに、一日の最後に学んだことを振り返った。驚くべきことに(おそらくそのように意図されているのだろうが)、その評価は、スポーツにおけるアスリートにも、人間として日々の行動にも簡単に変換して考えることができるものだった。

チームは、確実性よりも不確実性がずっと大きい場合がある、ということを指摘しつつ、意思決定についてや、アスリートが、失点を防ぐ、またはリスクを回避するという立場から意思決定を行いやすい傾向があるのかどうかを、さまざまな結果をもとに議論した。

これらの知見は、他のテストがフォームや機能の推奨事項を提供するのと同様に、認知の推奨事項にも適用できる。彼らはより良いアパレルや靴を作ろうとしているだけでなく、アスリートの能力のあらゆる側面を促進することに取り組んでいる。

例えば、コントロールの必要に悩んでいるアスリートは、結果そのものよりも、その結果を将来の成功やさらには成功へのプロセスに役立てる事ができる、という事実にもっと目を向ければよい。同様に、スポーツ心理学者は、ある一瞬やシュートの失敗といったことにいつまでもとらわれるのではなく、将来に向けたポジティブな結果を想像したり視覚化することを推奨している。

最終的に、この新しいレブロンジェームズイノベーションセンターは、ナイキのアパレルや靴のイノベーションを促進するとともに、アスリートの心身の健全性やパフォーマンスの向上といったことをサポートしていくだろう。

ここでは、問題解決に向け一面的なアプローチを取るのではなく、すべてに対しチームが一丸となってより大きなチャンスという側面からアプローチしている。このセンターの持つ可能性はすばらしいものがあり、今後ここからどのような製品が生み出されるのかが大変楽しみである。

レブロンジェームズイノベーションセンター(画像クレジット:Nike)

画像クレジット:Nike

原文へ

(文:Rae Witte、翻訳:Dragonfly)

AIを活用したエンジニアリング卓越性プラットフォームのPropeloがシリーズAで約13.6億円を調達

ここ数年、DevOpsツールの数は飛躍的に増加しており、それにともない、企業がソフトウェア開発プロセスを改善するためにそうしたツールが生み出すデータの量も増加している。しかし、ほとんどの場合、これらのデータは単にダッシュボードの中でばらばらに分析されている。Propelo(旧社名:LevelOps)は、この混沌とした状況に秩序をもたらしたいと考えており、機械学習(ML)を活用した分析サービスとノーコードのロボティックプロセスオートメーション(RPA)ツールを組み合わせた「AI駆動のエンジニアリング卓越性プラットフォーム」を構築し、ユーザーがこれらのデータポイントを実用的なものに変えられるようにすることを目指している。

同社は米国時間11月4日、Decibel Partnersが主導するシリーズAラウンドで1200万ドル(約13億6000万円)の資金調達を実施したと発表した。このラウンドには、Fike Ventures、Eniac Ventures、Fathom Capitalも参加した。

Propeloの創業者兼CEOであるNishant Doshi(ニシャント・ドーシ)氏は、2015年にPalo Alto Networks(パロアルトネットワークス)が買収したSaaS型セキュリティサービス、CirroSecureを共同創業した経験がある。その後、Palo Alto Networksに数年間在籍し、シニアディレクターやエンジニアリング担当VPとして、DevOpsツールの爆発的な普及を身をもって体験した。開発プロセスをよりよく把握するために、チームはJira、GitHub、Salesforceなどのソースからデータをつなぎ合わせる必要があった。

画像クレジット:Propelo

「これは手作業が多く、多大なリソースを必要とします」と同氏は語る。「ビジネスの核心にフォーカスしていないのに、解決策を探そうとすると、いつも別のツールが必要になってしまうのです。また、それらのツールを手に入れても、何を測定すればよいのかわかりません。当社のような専用のソリューションがもたらす進歩にアクセスできず、さらに重要なのは、行動可能性がないということです」。

画像クレジット:Propelo

そして、最後の部分がキーポイントだとドーシ氏は強調する。優れたデータや分析結果があっても、その情報に基づいて実際に行動を起こすことができなければ、開発プロセスを改善することはできない。PropeloのRPAツールを使えば、ユーザー(同社によれば、主にエンジニアリング・リーダーシップ・スタックのユーザーを対象としている)は、企業内のDevOpsプロセスを改善するための多くのタスクやワークフローを簡単に自動化することができる。

このサービスは現在、Jira、GitHub、GitLab、Jenkins、Gerrit、TestRailsなど、約40種類のDevOpsツールと連携している。Propeloは、AIを活用することで、ユーザーが隠れたボトルネックを発見したり、スプリントが失敗しそうなタイミングを予測したりできる。実際、データの衛生管理やJiraチケットの更新は、ほとんどの開発者があまり考えたくないことなので、Propeloは定期的に開発者にそれを促すことができる。

現在のPropeloのユーザーには、Broadcom(ブロードコム)やCDK Globalなどがいる。Broadcomでセキュリティ技術とエンドポイントソリューションを担当するエンジニアリングVPのJoe Chen(ジョー・チェン)氏はこう述べている。Propelo は、DevOps の摩擦を減らし、無駄な動作を減らす方法について、スクラムチームごとの非常に細かいレベルで、データに基づいた洞察を提供してくれます。これは、追加技術投資の効率を最大化し、エンジニアのペインポイントを取り除くのに役立ちます」。

画像クレジット:

原文へ

(文:Frederic Lardinois、翻訳:Aya Nakazato)

12月開催のSight Tech Global、アップルとアマゾンの機械学習・AI専門家の講演が決定

センサーとデータが急増している。スマートフォンから、あるいはクルマやスマートホームデバイスから得られる驚異的な量のデータをもとにして、新しいプロダクトやエクスペリエンスを考える研究者や開発者の取り組みは加速する。こうした研究や開発は、視覚障がい者に対してもこれまで以上に寄与する。

そこで12月1〜2日に開催するオンラインイベントのSight Tech Globalから、2つのセッションを紹介しよう。1つはApple(アップル)、もう1つはAmazon(アマゾン)のセッションで、この2つのセッションでは機械学習(ML)とAIのリーダーである両社が将来について、特に視覚障がい者を支援する新しいエクスペリエンスについて語る。Sight Tech Globalへの参加は無料だ。今すぐ登録して欲しい。

Designing for everyone:Accessibility and machine learning at Apple(すべての人のためのデザイン:Appleのアクセシビリティと機械学習)

Appleのセッションでは、TechCrunch編集長のMatthew Panzarino(マシュー・パンザリーノ)がJeff Bigham(ジェフリー・ビガム)氏、Sarah Herrlinger(サラ・ヘルリンガー)氏に話を聞く。

ビガム氏はAppleのAI/MLアクセシビリティリサーチ責任者で、カーネギーメロン大学でコンピュータサイエンスのアシスタントプロフェッサーも務める。同氏はAIと機械学習を活用した先進的なアクセシビリティを専門とする研究者とエンジニアのチームを率いている。

ヘルリンガー氏はAppleのグローバルアクセシビリティポリシー&イニシアチブ担当シニアディレクター。同社のアクセシビリティプログラムの責任者として、ワールドワイドで障がい者コミュニティを支援し、同社のハードウェアとソフトウェアにアクセシビリティ技術を実装し、他にもAppleのインクルージョンのカルチャーを推進する役割を担っている。

AppleのiPhoneとVoiceOverは視覚障がい者にとってナビゲーションからメールの読み上げまで多くのサービスを提供する極めて重要なツールだ。LiDARとコンピュータビジョンの機能なども取り入れることで、iPhoneとクラウドコンピューティングを組み合わせて周囲に関する情報を取得し、その情報を役に立つ形で伝える手段としてさらに機能が強化されている。ヘルリンガー氏とビガム氏が、アクセシブルなデザイン、この1年間の進歩、機械学習研究におけるインクルージョン、最新の研究と将来に関して、Appleのアプローチを語る予定だ。

Why Amazon’s vision includes talking less to Alexa(Amazonが話しかけないAlexaを考える理由)

Amazonのセッションでは、Be My EyesのバイスプレジデントであるWill Butler(ウィル・バトラー)氏が、Alexa AI担当バイスプレゼントのPrem Natarajan(プレム・ナタラジャン)氏、Alexa TrustディレクターのBeatrice Geoffrin(ベアトリス・ジェフリン)氏とともに語る。

ジェフリン氏はAmazonのAlexaチームでプロダクトマネジメント担当ディレクターを務めている。Alexaに対する顧客の信頼を獲得して維持し、Alexaのアクセシビリティを向上する部署であるAlexa Trustの責任者で、Alexa for Everyoneチームを監督する。

ナタラジャン氏はサイエンス、エンジニアリング、プロダクトの学際的な研究をする組織の責任者で、会話のモデリングや自然言語理解、エンティティリンキングとエンティティ解決、関連する機械学習テクノロジーの進化を通じたカスタマーエクスペリエンスの向上に取り組んでいる。

AmazonのAlexaはすでに多くの家庭で利用され、視覚障がい者が使うテクノロジーツールセットとしても効果をあげている。家庭でテクノロジーが多く使われるようになると、Teachable AIやマルチモーダル理解、センサー、コンピュータビジョンなど、さまざまなソースからのインプットによって周囲の環境が作られる。すでにAlexaスマートホームでのやりとりの5回に1回は、話し言葉以外から開始されている。Alexaは利用者や利用者の家を十分に理解してニーズを予測し、利用者に代わって有効なやり方で動作する。こうしたことは、アクセシビリティにどのような影響を及ぼすだろうか?

Sight Tech Globalはオンラインで開催され、世界中から無料で参加できる。今すぐ登録しよう。

Sight Tech Globalは、シリコンバレーで75年にわたって運営されているNPOのVista Center for the Blind and Visually Impairedが主催する。現在、Ford、Google、Humanware、Microsoft、Mojo Vision、Facebook、Fable、APH、Visperoがスポンサーとして決定し、感謝している。本イベントのスポンサーに関心をお持ちの方からの問い合わせをお待ちしている。スポンサーシップはすべて、Vista Center for the Blind and Visually Impairedの収入となる。

画像クレジット:Sight Tech Global

原文へ

(文:Ned Desmond、翻訳:Kaori Koyama)

グーグルの親会社アルファベットがAIを活用して創薬に挑むIsomorphic Labsを設立

創薬の分野はAIの能力によって超高速化が進んでいる。複数の企業がさまざまな方法でAIを応用し、膨大な実際上の課題を、扱いやすい情報の問題に変えている。最近の動きとして、Google(グーグル)の親会社であるAlphabet(アルファベット)が、DeepMind(ディープマインド)のトップであるDemis Hassabis(デミス・ハサビス)氏の下でIsomorphic Labs(アイソモルフィックラボ)を設立し、この有望な新分野に挑戦する。

この会社については、初公開のブログ記事と、それに付随するごく一般的なFAQでは、ほとんど何も明らかにされていない。同社の目的は「生体システムを第一原理から理解し、病気治療の新方法を発見する計算プラットフォームを開発する」ことだ。

もちろん、この設立宣言には、いくつかの前提条件が織り込まれている。その中でも最も重要なのは、創薬に適した方法で生体システムを計算機上でシミュレートすることが可能であるという前提だ。

過去5年ほどの間に、よく似た目標を追求するために、複数の大企業が形成され、何億ドル(何百億円)もの資金が投入されたが、目に見える革命や、これまで治療不可能だった病気の特効薬をAIが発見したというようなことはなかった。その理由について考察することは本稿の範囲を超えているが(近い将来、Isomorphic Labsが取り組むことになるだろう)、AIシステムというものは奇跡の工場ではなく、いまだに膨大な時間・資金・試験管を必要とする長く複雑なプロセスの一部に過ぎないことは明らかだ。

ハサビス氏も馬鹿ではない。同氏は生物学を「情報処理システムです。ただし、非常に複雑で動的な」とやや楽観的に表現しているが(この分野の読者は下にスクロールしてコメント欄に向かっていることだろう)、直後にやや穏やかな言葉に置き換えた。

生物学はあまりにも複雑で混沌としているので、単純な数式では表現できないものです。しかし、物理学を記述する適切な言語は数学だということがわかったように、AIを応用する対象として生物学が最適だということが明らかになるかもしれません。

情報システムと生物システムには共通の構造があるのではないかという考えから「Isomorphic Systems(同型のシステム)」と名づけられた。同型とは、形は似ているが起源が異なるという意味だ。

同氏の説明の背景には、2020年、生物学者の度肝を抜いた、DeepMindのAI搭載タンパク質折り畳み構造解析システム「AlphaFold」が有効だとわかり、非常に複雑な分野で新たな常識を生み出すことに貢献したことがあるのは間違いない。

DeepMindの学習システムが汎用性や知識の伝達に特に親和性があることが明らかになりつつある。さまざまなタスクに再利用できる構造を持つということだ。AlphaFoldの成功が示すように、生物学的システムがこの種のシミュレーションや分析に適しているとすれば、ハサビス氏による検証は同社の幅広い能力を証明することになるかもしれない。

しかし、それが実現するのはしばらく先のことだろう。DeepMindがAI研究でスタートダッシュを見せたとしても、Isomorphicは基本的にこの問題をゼロから始めることになる(今後も両社は別々の会社として存在する見込みだが、研究結果は共有される可能性がある)。Isomorphicは、採用により「世界レベルの学際的なチーム」を構築しており、おそらく1~2年後には、同社の野望から生まれる成果の最初の兆候を目にすることができるだろう。

画像クレジット:Isomorphic Labs

原文へ

(文:Devin Coldewey、翻訳:Nariko Mizoguchi

タップやスワイプを行動分析し詐欺・不正行為と闘うNeuro-IDがシリーズBで約40億円調達

私たちの生活の大部分はデジタル体験を中心に成り立っており、企業はコンバージョンを促進したり、詐欺スクリーニングを最適化する方法をますます模索している。米国時間11月4日、リアルタイムの行動分析ツールを構築したスタートアップが自社サービスへの需要の高まりを受けて、資金調達を発表した。

デジタル企業がデジタル顧客の意図を理解し、顧客との摩擦の根本原因を特定するために、大規模なスケールでリアルタイムの顧客行動を捉える分析プラットフォームを提供するNeuro-IDは、シリーズBラウンドとして3500万ドル(約39億8000万円)を獲得した。

今回の新たな資本は、2020年12月に調達した700万ドル(約8億円)のシリーズAに続くもので、2014年の設立以来、同社の累計調達額は4950万ドル(約56億3000万円)に達した。

今回のラウンドはCanapi Venturesがリードし、既存の投資家であり共同でシリーズAを主導したFin VCとTTV Capitalがそれに加わった。

Neuro-IDは評価額を公表していないが、CEOのJack Alton(ジャック・アルトン)氏は、メールで「強い顧客の牽引力」を背景にしたものだと述べている。

「Neuro-IDは、2021年には売上高、顧客数ともに3~4倍の成長が見込まれています」と同氏は付け加えた。「これは、顧客数と収益が3~4倍に増加し、モニターされたカスタマージャーニーが500%増加した、当社にとって大きな拡大の年に続くものです」とも。

Neuro-IDのヒューマンアナリティクスダッシュボード(画像クレジット:Neuro-ID)

同社の顧客リストには、Intuit(インテュイット)、Square(スクエア)、Affirm(アファーム)、OppFi、Elephant Insuranceなどが名を連ねており、Neuro-IDが独自に開発したHuman Analyticsソフトウェアを使用して、スワイプやタップによるユーザーの行動のすべてを実用的なインサイトに変換している。

この行動分析により、顧客は行動データを見て、既存のAI / MLモデルを最適化するために利用することもできる。顧客は平均して、コンバージョンを200%向上させ、過去の不正率を35%低減させることができたという。

アルトン氏は、今回の資金調達を、エンジニアリング人材の追加採用、製品主導の成長の加速、グローバルな事業拡大に充てる予定だ。過去1年間で、同社の社員数は約3倍に増え、現在は60名になっているという。

Canapi VenturesのパートナーであるWalker Forehand(ウォーカー・フォアハンド)氏は、メールで次のように述べている。「Neuro-IDは、ユーザーの意図や体験を分析するためのワンストップショップであり、新規顧客を分析する独自の機能を備えていることで、リピート顧客との対話に重点を置く他社との差別化を図っている」とのこと。

シームレスなカスタマージャーニーを実現することは、フィンテック企業にとっても銀行にとっても優先事項であり、フォアハンド氏は、デジタルジャーニーを開始してから完了する人はわずか10%未満であると述べている。また、従来のモデルでは、住所や生年月日などの物理的な属性を用いて認証を行っているが、Neuro-IDでは他の方法で顧客が本物か不正かを識別する。

フォアハンド氏はこうも述べている。「顧客の行動を大規模に把握するこの新しい見解は、詐欺を減らしつつ、優良顧客を早期に獲得してより多くの収益を上げるためのコンバージョンの改善、意図の測定の高度化、デジタル製品の設計品質の向上などの可能性を広げます。最もエキサイティングなのは、Neuro-IDの技術はフィンテックや銀行に適用できるだけでなく、大量のデジタルおよび自動意思決定に対応するあらゆる業界がNeuro-IDの顧客になりうるということです」。

画像クレジット:Neuro-ID

原文へ

(文:Christine Hall、翻訳:Aya Nakazato)

サッポロビールと日本IBMがAIによる商品開発システムをテスト運用、コンセプトから味を作り出す新たなスキーム目指す

サッポロビールと日本IBMがAIによる商品開発システムをテスト運用、コンセプトから味を作り出す新たな商法開発スキーム目指す

サッポロホールディングスは11月4日、グループ企業のサッポロビール日本IBMが、コンセプトから味を作り出す新たな商法開発スキームを目指すシステムのテスト運用の実施を発表した。2022年の実装を目指すという。

これは、140年を超えるサッポロビールの歴史の中で蓄積された味に関するデータを学習したAIが、目標とする味のコンセプトと「香味プロファイル」に合致するレシピ(推奨配合骨格と推奨香料)を出力するというもの。それにより、RTD(Ready to Drink。栓を開けてすぐに飲める低アルコール飲料)開発のDXを推進し、経験と熟練技術を伝承するという、時間のかかるプロセスを改善するという狙いがある。

同システム構築では、商品開発システムのアルゴリズム作成にあたり、過去のレシピの官能評価データと、採用した香料の特徴に関する情報をAIにまず学習させたという。これに、立案した新商品コンセプトを基に香料の特徴と目標とするプロファイルを入力すると、AIが学習したデータを基に分析を行い、目標とするコンセプト・香味プロファイルに合致するレシピを出力する。

実際に、出力されたレシピで試作を行ったところ、「コンセプトに合致した良好な香味」が得られたという。そのレシピの検討時間は、従来のやり方と比較して50%以下に抑えられた。

このシステムではまた、「従来の手法では実現できなかった新規性」のあるレシピの考案も可能とのことで、つまり「人では思いつかない創造性を伴う商品レシピ」の創出も期待されるとのことだ。

AIアプリケーションのためのストリーミングデータベースを構築するActiveloopが約5.7億円調達

Y Combinatorの2018年夏季から巣立ったActiveloopは、メディアに特化した人工知能アプリケーションのために特別に設計されたデータベースを開発している。米国時間11月2日、同社は 468 CapitalとCM Venturesがリードする500万ドル(約5億7000万円)のシード投資を発表した。これにはTribe CapitalとShasta Ventures、およびテクノロジー業界のさまざまなエンジェルたちが参加した。

同社の創業者でCEOのDavit Buniatyan(ダビット・ブニアティヤン)氏によると、同社は彼がプリンストン大学で行っていた研究から生まれた。そのとき彼は、AIのユースケースのために特別に設計された、画像や動画など非定型データのストリーミングデータベースが必要だと感じていた。同社はこの度、商用プロダクトのアルファバージョンを立ち上げている。

「私たちのAIのためのデータベースは、具体的には、データを極めて効率的に保存し、これを機械学習のアプリケーションや、コンピュータービジョン、音声処理、NLP(自然言語処理)などのモデルの訓練へストリーミングするレイターです」とブニアティヤン氏は説明している。

実用面では、ビデオやオーディオなどのデータをマシンが理解できる数学的表現に変換するためのオープンソースのAPIだ。さらにそのAPIでデータの異なるバージョンを追跡でき、そして最終的にはそれを、Amazon S3のようなにリポジトリに保存できる。

データがストリーミングで入手できれが、データサイエンティストやデベロッパーはこれまでのようにすべてのデータを手元のノートパソコンにダウンロードする必要もなく、それをモデルが使うために送ることもできる。Netflixでムービーを自分のところへストリーミングするのと同じで、自分のローカルマシンには何もダウンロードしない。

Activeloopの画像データベース(画像クレジット:Activeloop)

彼によると、このオープンソースプロジェクトには55名のコントリビューターがいて、コミュニティのメンバーはおよそ700名いる。そのプログラムはこれまでに30万回ダウンロードされた。

彼がデータをストリーミングしようと思いついたのは、プリンストンの神経科学研究所で大量のデータを扱っていたときだ。彼は、ファイルでは大きすぎると悟った。それをダウンロードするのは非実用的であり、むしろストリーミングするやり方を思いついて、それがActiveloopのベースになった。

現在、社員は15名だが、5〜6名の高度な技術者を求めている。彼が同社を創るときには、人材のダイバーシティをできるかぎり心がけた。たとえばエンジニアリング担当の副社長は女性だ。最近ではエチオピア出身のエンジニアを雇用しようとしたが、彼は結局断った。ブニアティヤン氏によれば、有能な人材であれば性別や人種や国籍などはまったく関係ないし、気にもしないという。

「人の出自や生まれつきなどはどうでもいい。重要なのは、我が社のミッションに貢献してくれるかだけです。私はこの会社をインパクトのある企業に育てたいので、そのための人材が欲しいのです」。

APIはオープンソースだが、この度アルファをリリースした商用プロダクトは、ストリーミングデータへのSQLクエリなど、いろいろな機能が加わっている。それらはオープンソースプロダクトにはない。同社はまだ売上を計上していないが、2022年の第1四半期には商用バージョンをリリースしたい意向だ。

画像クレジット:Activeloop

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)

CoinbaseがAI駆動型カスタマーサポートの印Agaraを約45億円超で買収へ

Coinbase(コインベース)は、AI駆動のカスタマーサポートプラットフォームを運営するスタートアップAgara(アガラ)を買収する。両社が米国時間11月2日に発表した。暗号資産(仮想通貨)取引所であるCoinbaseは、ユーザーがサービスを利用したりサポートを求めたりしやすくしようとしているようだ。

両社は買収に関する財務面での詳細を明らかにしなかったが、取引の規模は4000万〜5000万ドル(約45億〜56億円)の間だとこの件に詳しい2人が筆者に語った。Coinbaseの広報担当者はコメントを控えた。また、Agaraの共同創業者で最高経営責任者のAbhimanyu(アビマニユ)氏も、守秘義務契約を理由に取引規模についてのコメントを却下した。

データインテリジェンスプラットフォームのTracxnによると、インドで創業して4年目のAgaraは、今回の買収前にBlume Ventures、RTP Global、UTEC Japan(東京大学エッジキャピタルパートナーズ)、Kleiner Perkinsから約700万ドル(約8億円)を調達していた。

Agaraは機械学習と自然言語処理に関する深い専門知識を構築し、それをユーザー体験の向上に役立てている。40人以上の従業員を擁する同社は、世界中に複数の大口顧客を抱え、Salesforce、Shopify、Twilioなど多くの人気サービスに統合されている。買収後、AgaraはCoinbaseにフォーカスを移すとアビマニユ氏はTechCrunchとのインタビューで答えた。

「我々は、大きく分けて2つのことに注目して会社を立ち上げました。1つはカスタマーエクスペリエンスとサポート。2つ目は機械学習です。MLテックスタックを作り、それをカスタマーケアに応用するという考えでした」とアビマニユ氏は話す。「我々が行っている複雑な業務の中には、電話での問い合わせがあります。電話によるサポートのすべてではないにしても、その多くを自動化することに取り組んできました」と述べた。

同氏によると、Agaraのテックチームは、その大部分がインドで勤務しており、買収の一環としてCoinbaseに加わる。両社は年内に取引を完了する予定だ。今回の動きの数カ月前に、Coinbaseはインドにテックハブを構築する戦略を打ち出し、Google Payの元幹部であるPancaj Gupta(パンカジ・グプタ)氏を採用していた。

「Agaraの強力な技術を活用して、当社のカスタマーエクスペリエンス(CX)ツールを自動化し、強化する計画です。ここ数カ月でサポートスタッフの人数を5倍に増やし、年末までに24時間365日の電話サポートとライブメッセージを提供することを発表しました。今回の買収により、パーソナライズされたインテリジェントでリアルタイムなサポートオプションを顧客に提供することができるようになります」とCoinbaseのエンジニアリング担当EVPであるManish Gupta(マニッシュ・グプタ)氏は声明で述べた。

画像クレジット:TechCrunch / Flickr

原文へ

(文:Manish Singh、翻訳:Nariko Mizoguchi

マイクロソフト、新しくAzure OpenAI Serviceを通じ言語AI「GPT-3」を招待制で提供開始

Microsoft(マイクロソフト)は米国時間11月2日、Azure OpenAI Serviceの提供開始を発表した。Azure OpenAI Serviceとは、その名の通り、OpenAIの機械学習モデルをAzureプラットフォーム上で利用できるようにするものだ。具体的には、OpenAIの画期的な大規模自然言語処理モデルである「GPT-3」が対象となる。GPT-3は、適切な環境下であれば、わずかなプロンプトで人間のようなテキストを生成することができる。

しかし、少なくとも今のところ、すべてのAzureユーザーがアクセスできるわけではない(たとえお金を払う用意があっても)。アクセスは招待制で「AI技術を使用するための責任ある原則と戦略を取り入れた、明確に定義されたユースケースを実装する予定の顧客」が対象とのこと。Microsoftは、GPT-3の悪用や誤用のケースを見つけるための安全性モニタリングと分析を提供し、GPT-3をベースにしたチャットボットが(たとえそれに値するとGPT-3が考えたとしても)重役に悪態をつき始めたりしないようにするためのフィルターを提供する。

画像クレジット:Microsoft

ここで注目に値するのは、OpenAI自体は2020年、すでにGPT-3のAPIを公開していることだ。ただし、まだウェイティングリストがある。MicrosoftもGPT-3を使って、デベロッパーのコード作成を支援する「GitHub Copilot」ツールをすでに構築している。しかし、Azure以外でGPT-3にアクセスする方法はすでにあるが、Microsoftは「セキュリティ、アクセス管理、プライベートネットワーク、データ処理の保護、またはスケーリング能力の追加レイヤー」を提供できるとしている。

Microsoftは2019年にOpenAIに10億ドル(当時約1080億円)を投資し、GPT-3のライセンスを取得しているので、今、より広い範囲の製品に導入しようとしているのは驚くことではない。

OpenAIのSam Altman(サム・アルトマン)CEOはこう語った。「GPT-3は、自然言語のための最初の強力な汎用モデルであることを証明しました。1つのモデルであらゆることに使えるので、非常に簡単に試すことができ、デベロッパーにとって使いやすいものです。以前から、可能な限り広くスケーリングする方法を見つけたいと思っていました。その点が、Microsoftとのパートナーシップで最も期待していることです」。

画像クレジット:Westend61 / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Aya Nakazato)

Walden Catalystがディープテック系スタートアップに投資する約628億円のファンドを設立

Walden Catalystの創業者(左)リップ・ブー・タン氏と(右)ヨン・ソーン氏。

過去20年間、ディープテック(世界を変えるようなビジネスを構築するための科学技術関連のブレークスルー)からの資本の逃避が続いていると、Walden Catalyst(ウォールデン・カタリスト)は述べている。このベンチャーキャピタル(VC)は、データを「燃料」、AIを「エンジン」として、それらが人々の生活、仕事、遊び方を変革する能力を信じている。

Lip-Bu Tan(リップ・ブー・タン)氏とYoung Sohn(ヨン・ソーン)氏は、アーリーステージのディープテック企業、具体的にはビッグデータ、AI、半導体、クラウド、デジタルバイオロジーなどに投資するためにこのファンドを設立したと、Walden Catalystのマネージングパートナーであるソーン氏はTechCrunchに語っている。

サンフランシスコを拠点とするこのVCは、米国時間11月1日、申し込み過多となった5億5000万ドル(約628億円)のファンドのクロージングを発表した。同VCは、リミテッドパートナーの名前を公表していない。

半導体、クラウド、エレクトロニクス業界全体で実績のあるソーン氏とタン氏は、Zoom(ズーム)、Inphi(インフィ)、Berkeley Lights(バークレーライト)、Habana(ハバナ)、Nuvia(ヌビア)など、多くのテック企業に初期投資を行ってきた。

「Walden Catalystは、2021年初頭に設立された新しいファンドですが、Walden International(ウォールデン・インターナショナル)やSamsung Catalyst Fund(サムスン・カタリスト・ファンド)からの強力な遺伝子があります」。と語るのは、以前、Samsung Electronicsでコーポレート・プレジデント兼チーフ・ストラテジー・オフィサーの役職に就いていたソーン氏だ。タン氏は、Walden Internationalの創業者兼会長でもある。

Walden Catalystは、米国、欧州、イスラエルに焦点を当てている。これは、これらの3つの地域から、関心のあるディープテック分野で一貫したブレークスルーが見られるからだとヨン氏はいう。また、Walden Catalystのパートナーは、過去数十年にわたってディープテック産業に投資してきたことで、これらの国に深いネットワークを持っており、Waldenがトップの起業家を惹きつける画期的なアイデアを見つけるのに役立っているとヨン氏は付け加えた。

現在までに、Walden Catalystは、米国で3社、イスラエルで2社、EUで1社の計6社のディープテック関連のスタートアップ企業に投資している、とヨン氏は続けた。Walden Catalystのポートフォリオ企業には、Speedata(スピーダータ)、MindsDB(マインズDB)、AI21 Labs(AI21ラボ)の他、現在ステルスモードの他3社が含まれていると述べている。同社の最初のチケットサイズは、1ラウンドで数百万ドル(数億円)から2500万ドル(約28億5000万円)までとなっているとヨン氏は語った。

「データは絵を描きます。それは、情報を提供し、啓発するストーリーを語るものです。世界のデータ量は2年ごとに倍増し続けていますが、分析されているのは全データの約2%に過ぎず、意味のある洞察を集めるためにできることはたくさんあります。データの爆発的な増加を捉え、最終的に世界を変えるであろう、米国、欧州、イスラエルの次世代のディープテック起業家たちと協力できることに、私たちは興奮し、光栄に思います」。とソーン氏は述べている。

Shankar Chandran(シャンカール・チャンドラン)氏、Roni Hefetz(ロニ・ヘフェッツ)氏、Francis Ho(フランシス・ホー)氏、Andrew Kau(アンドリュー・カウ)氏の4人の追加パートナーによるチームは、ディープテック分野での投資やエグジットに関して数十年の経験を有している。

Walden Catalystは、事業運営と投資の経験を活かして、初期段階の起業家が次世代のビジネスを構築する際に、迅速なスケールアップとイノベーションを支援することを目指している。同社は、起業家こそが経済成長とイノベーションの中心であると考えている。

「私たちは、業界の次の波を担う夢想家たちと協力して、彼ら(起業家)がイノベーションを起こし、成長を加速するのを支援できることを楽しみにしています。起業家は我々の未来のエンジンであり、Walden Catalystはその旅を共有し、まだ到来していない多くの驚くべきブレイクスルーを支援するために設立されました」とタン氏は述べている。

Walden Catalyst は、国連の持続可能な開発目標に沿ったグローバルな課題に取り組む起業家を対象としたスタートアップコンテストであるエクストリーム・テック・チャレンジ(XTC)と密接な関係にある。Walden Catalystは、地球に意味のある影響を与えながら大規模なスケールに到達できる、次のすばらしい破壊的スタートアップ企業を見つけるというXTCのミッションを共有している。

原文へ

(文:Kate Park、翻訳:Akihito Mizukoshi)

Mantraがマンガ特化の多言語翻訳システムで小学館「マンガワン」英語版展開を支援、海賊版サイトの作品取り下げにも寄与

暗号資産・ブロックチェーン業界の最新1週間(2020.11.8~11.14)

マンガに特化したAI翻訳技術の研究・開発を行うMantra(マントラ)は11月1日、小学館のマンガ配信サイト「マンガワン」の英語版展開を、多言語翻訳システム「Mantra Engine」で支援すると発表。共同による取り組みを開始した。


マンガワンの海外展開は、海外で広く普及している海賊版への対処でもある。Mantraが2021年に行った調査では、小学館が出版したマンガのうち、正規の手続きを踏んで翻訳された公式版に対して、海外海賊版は約5倍の量が流通していることがわかった。なかでも、「ケンガンアシュラ」と「ケンガンオメガ」のシリーズは、確認できた海外海賊版サイトだけでも閲覧回数が1億回を超えていた。

ただ、海賊版の制作者に対するアンケートでは、公式な翻訳版がないためという回答が67.7%あり、大好きなマンガを広めたいという気持ちが強い熱烈なファンによる行為であることがわかる。その証拠に、「ケンガンアシュラ」「ケンガンオメガ」の公式な翻訳版の配信予定が発表されると、海外海賊版制作グループは海賊版の制作を停止し、公開済みエピソードの配信取り下げを発表したという。

小学館では、そうした熱烈なファンの力を活用して、正規の翻訳版制作に取り組んでいる。上記の理由から、公式版の公開が急がれるが、そこでMantra Engineの能力が活かされることになる。このシステムでは、翻訳担当者に原稿データを送ることなくウェブブラウザー上で作業が行えるほか、AI技術による支援機能により安全性と効率性が両立され、制作時間が従来の約半分に短縮されるとのことだ。

翻訳を行うのは、Mantraが個別に面談し協力を依頼したマンガファン。彼らはMantra Engineで作業を行った英語版は、英語圏向けマンガ配信サービス「Comikey」から日本語版と同時に公開される。

ウミトロンがAIスマート給餌機「UMITORN CELL」を活用し「くら寿司」の養殖事業と協業

愛媛県宇和島市のくら寿司委託生産者に実験導入された「UMITRON CELL」

愛媛県宇和島市のくら寿司委託生産者に実験導入された「UMITRON CELL」

AI・IoT・衛星リモートセンシングなどを駆使して持続可能な水産養殖に取り組むスタートアップ「ウミトロン」は10月28日、くら寿司傘下のKURAおさかなファームと協業して、スマート給餌機「UMITRON CELL」」(ウミトロンセル)を使った養殖事業を支援すると発表した。

UMITRON CELLは、生け簀で泳ぐ魚のリアルタイム動画を見ながら、遠隔で餌やりが行えるスマート給餌機。AIが魚の食欲を判定し、餌の量や与える速度を最適化することで、労働負荷を軽減し、無駄な餌やりをなくして海の環境を守ることができるというもの。従来よりも少ない餌量でも、適切なタイミングで給餌することで、出荷時のサイズや品質を保ちながら短期間で魚を育成できるという。すでに、近畿、四国、九州地域を中心に、真鯛、シマアジ、サーモントラウトなどの養殖に導入されている。

くら寿司が100%出資するKURAおさかなファームは、回転寿司チェーン業界では初となる、水産専門の子会社。自社養殖と委託養殖を行う。委託養殖された魚は、くら寿司が中長期契約で全量を買い取り、店舗で提供される予定だ。「くら寿司の先端技術と水産業界のノウハウを結集して、持続可能で国際競争力のある水産経営モデルの創出」を目指している。

AIを使った超音波分析の拡大を目指すイスラエルのヘルステックDiAが約15億円調達

独自の光超音波3Dイメージング技術を手がけるLuxonusが約4.3億円調達、2022年に医療機器の開発・生産および薬事申請準備

イスラエルに拠点を置くAIヘルステック企業DiA Imaging Analysisは、深層学習と機械学習を利用して超音波スキャンの分析を自動化している。同社はこのほど、シリーズBのラウンドで1400万ドル(約15億3700万円)を調達した。

DiAの前回の資金調達から3年後に行われた今回の投資ラウンドには、新たにAlchimia Ventures、Downing Ventures、ICON Fund、Philips、XTX Venturesが参加し、既存投資家としてCE Ventures、Connecticut Innovations、Defta Partners、Mindset Ventures、Shmuel Cabilly(シュムール・カビリー)博士らが名を連ねている。同社のこれまでの総調達額は2500万ドル(約27億4500万円)に達している。

今回の資金調達により、DiAはプロダクト範囲の拡大を継続し、超音波ベンダー、PACS / ヘルスケアIT企業、リセラー、ディストリビューターとのパートナーシップの新規構築や拡充を進めるとともに、3つの地域市場でのプレゼンスを強化していく。

このヘルステック企業は、AIを利用したサポートソフトウェアを臨床医や医療従事者に販売し、超音波画像のキャプチャと分析を支援している。このプロセスを手動で行うには、人間の専門家がスキャンデータを視覚的に解釈する必要がある。DiAは、同社のAI技術を「今日行われている手動および視覚による推定プロセスから主観性を取り除く」ものだと強調している。

同社は、超音波画像を評価するAIを訓練して、重要な細部の特定や異常の検出を自動的に行えるようにしており、心臓にフォーカスしたものを含む、超音波分析に関連する各種の臨床要件を対象とした広範なプロダクトを提供している。心臓関連のプロダクトには、駆出率、右心室のサイズと機能などのアスペクトの測定と分析の他、冠動脈疾患の検出支援などを行うソフトウェアがある。

また、超音波データを利用して膀胱容積の測定を自動化するプロダクトもある。

DiAによると、同社のAIソフトウェアは、人間の目が境界を検出して動きを認識する方法を模倣しており「主観的」な人間の分析を超える進歩につながるもので、スピードと効率の向上も実現するという。

「当社のソフトウェアツールは、正しい画像の取得と超音波データの解釈の両方を必要とする臨床医を支援するツールです」とCEOで共同創業者のHila Goldman-Aslan(ハイラ・ゴールドマンアスラン)氏は語る。

DiAのAIベースの分析は、現在北米や欧州を含む約20の市場で利用されている(中国ではパートナーが自社のデバイスの一部として同社のソフトウェアの使用の承認を取得したと同社は述べている)。DiAは、チャネルパートナー(GE、Philips、コニカミノルタなど)と協力して市場開拓戦略を展開しており、チャネルパートナーは自社の超音波システムやPACSシステムに追加する形で同社のソフトウェアを提供している。

ゴールドマンアスラン氏によると、現段階で3000を超えるエンドユーザーが同社のソフトウェアへのアクセスを有している。

「当社の技術はベンダーニュートラルであり、クロスプラットフォームであることから、あらゆる超音波デバイスやヘルスケアITシステム上で動作します。そのため、デバイス企業およびヘルスケアIT / PACS企業の両方と10社以上のパートナーシップを結んでいます。当該分野には、このような機能、商業的牽引力、これほど多くのFDA・CE対応のAIベースソリューションを持つスタートアップは他にありません」と同氏は述べ、さらに次のように続けた。「現在までに、心臓や腹部領域のための7つのFDA・CE承認ソリューションがあり、さらに多くのソリューションが準備されています」。

AIのパフォーマンスは、当然ながら訓練されたデータセットと同等である。そして、ヘルスケア分野での有効性は特に重大な要素である。トレーニングデータに偏りがあると、トレーニングデータにあまり反映されていない患者群で疾患リスクを誤診したり過大評価したりする、欠陥のあるモデルにつながる可能性がある。

AIが超音波画像の重要な細部を突き止めるためにどのような訓練を受けているのかと聞かれて、ゴールドマンアスラン氏はTechCrunchに次のように答えている。「私たちは多くの医療施設を通じて何十万もの超音波画像にアクセスできますので、自動化された領域から別の領域にすばやく移動する能力があります」。

「各種のデバイスからのデータに加えて、異なる病理を持つ多様な集団データも収集しています」と同氏は付け加えた。

「『Garbage in Garbage out(ゴミからはゴミしか生まれない)』という言葉があります。重要なのは、ゴミを持ち込まないことです」と同氏はいう。「当社のデータセットは、数人の医師と技術者によってタグ付けされ、分類されています。それぞれが長年の経験を持つ専門家です」。

「また、誤って取り込まれた画像を拒否する強力な拒否システムもあります。このようにして、データがどのように取得されたかに関する主観的な問題を克服しています」。

注目すべき点は、DiAが取得したFDAの認可が市販前通知(510(k))のクラスII承認であることだ。ゴールドマンアスラン氏は、自社プロダクトの市販前承認(PMA)をFDAに申請していない(また申請する意思もない)ことを認めている。

510(k)ルートは、多様な種類の医療機器を米国市場に投入する承認を得るための手段として広く利用されている。しかし、それは軽薄な体制として批判されており、より厳格なPMAプロセスと同じレベルの精査を必要としないことは確かである。

より大きなポイントは、急速に発展しているAI技術の規制は、それらがどのように適用されているかという点で遅れをとっている傾向があるということだ。巨大な展望が確実に開かれているヘルスケア分野への進出が増えている一方、まことしやかなマーケティングの基準を満たすことに失敗した場合の深刻なリスクもある。つまり、デバイスメーカーが見込んだ展望と、そのツールが実際にどれだけの規制監督下に置かれているかということの間には、依然としてギャップのようなものが存在している。

例えば、欧州連合(EU)では、デバイスの健康、安全性、環境に関するいくつかの基準を定めているCE制度において、一部の医療デバイスはCE制度の下での適合性についての独立した評価が必要になるが、実際にはそれらが主張する基準を満たしているという独立した検証が行われることなく、単にメーカーが適合性の宣言を求められるだけの場合もある。しかし、AIのような新しい技術の安全性を規制する厳格な制度とは考えられていない。

そこでEUは、来るべきAI規制法案(Artificial Intelligence Act:AIA)の下で「高リスク」と見なされたAIのアプリケーションに特化して、適合性評価の層を追加することに取り組んでいる。

DiAのAIベースの超音波解析のようなヘルスケアのユースケースは、ほぼ確実にその分類に該当するため、AIAの下でいくつかの追加的な規制要件に直面することになる。しかし現時点では、この提案はEUの共同立法者によって議論されているところであり、AIのリスクの高いアプリケーションのための専用の規制制度は、この地域では何年も効力を発揮していない状態にある。

画像クレジット:DiA Imaging Analysis

原文へ

(文:Natasha Lomas、翻訳:Dragonfly)

スマホで撮影した数枚の写真で簡単に3Dモデルが作れるLumaが4.9億円調達

おそらくオンラインショッピングで、商品を回転させて、全方向から見ることができる写真を見たことがあると思う。こうしたものは、製品をあらゆる角度から撮影した写真を何枚も用意して、それらをアニメーションのように再生するのが一般的だ。Apple(アップル)のAR(拡張現実)およびコンピュータビジョングループを離れたエンジニアたちによって創業されたLuma(ルマ)は、これらの課題を解決しようとしている。


同社が開発した新しいニューラルレンダリング技術は、少ない枚数の写真を撮影するだけで、製品のフォトリアリスティックな3Dモデルを生成し、陰影をつけてレンダリングすることを可能にした。その目標は、ハイエンドなeコマースアプリケーション向けの商品写真撮影を大幅にスピードアップするだけでなく、あらゆる角度から商品を見せることでユーザー体験を向上させることだ。そしてすばらしいことに、撮影された画像は実際に3Dとして解釈されたものであるため、どの角度からでもレンダリングできるだけでなく、わずかに異なる角度からの2つのビューポートを使って3Dで見ることも可能だ。言い換えれば、検討中の製品の3D画像をVRヘッドセットで見ることができるということなのだ。

この分野をずっと追い続けてきた人なら、民生用のカメラと初歩的な写真測量技術を使って3D表現を行おうとするスタートアップは繰り返し見てきたことだろう。はっきりいってしまえば、これまでのそうした技術は決してすばらしいものとは言えなかった。だが新しい技術には新しいチャンスがあり、それがLumaの狙う場所なのだ。

Lumaの技術が実際に適用されたデモ(画像クレジット:Luma)

Luma AIの創始者であるAmit Jain(アミット・ジェイン)氏は「何が今までと違うのか、そしてなぜ今このようなことをしているのかを説明するなら、ニューラルレンダリングの考え方が台頭してきたということです。従来、写真測量で行われてきたのは、何枚かの画像を撮影し、それを長時間の処理を経ることで点群を得て、そこから3D構造を再構築するというものでした。最終的にはメッシュを作成することになりますが、高品質な3D画像を得るためには、ノイズの多い実在のデータから高品質なメッシュを作成できる必要があります。この問題は今でも根本的に解決されていないのです」と説明し、この課題がが業界では「インバースレンダリング」と呼ばれていると指摘した。同社は、この課題に別の角度からアプローチすることにした。

ジェイン氏は「点群から正確なメッシュを得ることはできないという前提の下に、別のアプローチをとることにしたのです。オブジェクトの形状に関する完璧なデータ、つまりレンダリング方程式があれば、PBR(Physics Based Rendering、フィジカルベースドレンダリング)を行うことができます。しかし問題は、スタートが写真であるため、そのようなレンダリングを行うには十分なデータがないということです。そこで、新しい方法を考えたのです。クルマの写真を30枚撮って、そのうちの20枚をニューラルネットワークに見せるのです」と説明する。残りの10枚の写真は「チェックサム」、つまり方程式の答として使われる。ニューラルネットワークが、20枚のオリジナル画像を使って、最後の10枚の画像がどのように見えるかを予測できれば、アルゴリズムは、撮影しようとしているアイテムに対するかなり優れた3D表現を作成できたことになる。

非常にマニアックな写真の話だが、かなり大規模な実用的なアプリケーションが作られている。同社の思う通りにもし進んだならば、eコマースストアで物理的な商品を閲覧する方法は、これまでとは違ったものになるだろう。商品写真を、軸の周りに回転させるだけでなく、撮影されていない角度も含めて、あらゆる角度からズームやバーチャルな動きを取り込むことができる。

上の2枚が写真。下の画像はこれらを元にして作られたLumaレンダリングによる3Dモデル(画像クレジット:Luma)

ジェイン氏は「誰もが製品を3Dで見せたいと思っていますが、問題は3Dアーティストに参加してもらって、スキャンしたものに調整を加えてもらう必要があるということです。その分、コストが大幅にアップします」という。そして、これでは3Dレンダリングができるのは、ハイエンドのプレミアム製品に限られてしまうとジェイン氏は主張する。Lumaの技術は、この状況を変えることを約束している。なにしろ3Dモデルのキャプチャーと表示にかかるコストを、1つのモデルごとに数百ドル〜数千ドル(数万〜数十万円)ではなく、数十ドル(数千円)程度に抑えることができるようになるからだ。

Lumaの共同設立者であるAmit Jain(アミット・ジェイン)CEOとAlberto Taiuti(アルベルト・タユティ)CTO(画像クレジット:Luma)

同社はYouTubeのような埋め込み型のプレイヤーを開発し、小売店が商品ページに立体映像を簡単に埋め込めるようにする予定だ。

Matrix Partners、South Park Commons、Amplify Partners、RFCのAndreas Klinger(アンドレアス・クリンガー)氏、Context Ventures、そして多くのエンジェル投資家たちが、このビジョンを受け入れ、430万ドル(約4億9000万円)の資金を提供した。ラウンドを主導したのはMatrix Partnersだ。

MatrixのゼネラルパートナーであるAntonio Rodriguez(アントニオ・ロドリゲス)氏は「次の偉大なコンピューティングパラダイムが3Dに支えられていくことは、よほど事情に通じていない人以外なら誰でも知っていることです。しかし、来るべき3D環境に人を増やしていくためには、手間のかかるオーダーメイドの方法ではスケールアップできないことをきちんと理解しているひとは、Lumaの外にはほとんどいません。写真を撮って送信するのと同じように、私の作品を3Dにする手段も簡単でなければならないのです!」。

その技術がどのようなものかが、以下のビデオで紹介されている。

画像クレジット:Luma

原文へ

(文:Haje Jan Kamps、翻訳:sako)

非テック企業のAIアプリ構築を支援するプラットフォームPeakが約82億円調達

人工知能(AI)はますます多くのエンタープライズアプリケーションに組み込まれてきている。そうした中、企業、特に非テック企業がよりカスタマイズされたAI意思決定ツールを構築するのを支援するプラットフォームを手がけるスタートアップが、大幅な成長資金を獲得した。英国・マンチェスターに拠点を置き「Decision Intelligence」プラットフォームを構築しているPeak AIは、7500万ドル(約82億円)の資金を調達した。同社は今後もプラットフォームの構築を続け、新たな市場への進出を図り、来四半期には約200人の新規雇用を行うことを予定している。

シリーズCにはかなりビッグネームの投資家が参加している。SoftBank Vision Fund 2が主導しており、これまでの支援者であるOxx、MMC Ventures、Praetura Ventures、Areteもこれに名を連ねている。このグループはPeakの2100万ドル(約23億円)のシリーズBに参加し、同ラウンドは2021年の2月にクローズした。同社の調達総額は1億1900万ドル(約131億円)に達している。評価額については公表していない。

PeakのCEOであるRichard Potter(リチャード・ポッター)氏は、資金調達の迅速なフォローアップはインバウンドの関心に基づいており、同社が行ってきたことはその一端につながっていると語る。

PeakのいわゆるDecision Intelligenceプラットフォームは、小売業者、ブランド、製造業者などが在庫レベルを監視し、パーソナライズされた顧客エクスペリエンスを構築するために使用している。また、より効率的に機能するある程度の自動化機能を備えたその他のプロセスにも使用されており、異なるファクターを相互に測定してよりインテリジェントなインサイトを提供する洗練性も求められる。現在の顧客リストにはNike、Pepsico、KFC、Molson Coors、Marshalls、Asos、Speedyなどが名を連ね、過去12カ月で売上は2倍以上になった。

Peakは、次のようなことに取り組んでいる。AIは、現代の多くの先進的ITアプリケーションやビジネスプロセスの基盤となっているが、もしあなたが組織であり、特にテクノロジーに依存していない組織であるなら、AIへのアクセスとその利用方法は必ずしも自分に合わせたものではなく、他者が構築したアプリケーションによってもたらされることになる。よりカスタマイズされたソリューションを構築するためのコストは往々にして非常に高くつく。Peakによると、同社のツールを使用するユーザーの平均収益は5%増加し、広告費は2倍になり、サプライチェーンコストは5%、在庫保有(企業にとっては大きなコストだ)は12%減少したという。

Peakのプラットフォームは、その問題を解決するための「ノーコード」のアプローチではないことを指摘しておかなければならない。少なくとも今のところは、そのような組織のデータサイエンティストやエンジニアに向けたものであり、彼らが、AIツールから恩恵を享受できるかもしれないオペレーション内の各種プロセスを容易に特定し、それらを比較的少ない労力で構築できるようにすることを目的としている。

また、重要な役割を果たすさまざまな市場ファクターも存在している。新型コロナウイルス感染症(COVID-19)を例にとると、企業における「デジタルトランスフォーメーション」の拡大と、消費者需要の高まりやサプライチェーンの逼迫に対応するためのeコマースプロセスの効率化の両方で、企業はよりオープンになり、自動化をインテリジェントに改善するためのツールへの投資に熱心になっている。

これはPeak AIの収益増加とも相まって、SoftBankが興味を示していることの一部だ。この投資家はしばらく前からAIに注目しており、そのような投資先企業に戦略的サービスを提供することを目的として、自社の投資ポートフォリオの1セクションを構築している。

これにはeコマースやその他の消費者向けビジネスが含まれ、Peakの顧客ベースの主要セグメントの1つを構成している。

特に、この分野に特化した最近の投資の1つが2021年に入ってマンチェスターでも行われており、D2Cビジネスのためのソフトウェアを開発し運営するThe Hut Groupの7億3000万(約803億円)ドルの株式を取得している(将来的にはさらに16億ドル[約1760億円]を取得する可能性もある)。

SoftBank Investment Advisersのシニア投資家Max Ohrstrand(マックス・オーストランド)氏は声明で次のように述べている。「私たちは、将来の企業がバリューチェーン全体を最適化できる集中型AIソフトウェアプラットフォーム上で運営されるという、共通のビジョンを持つパートナーを得ています。これを実現するには新しいタイプのプラットフォームが必要であり、リチャード(・ポッター)氏とその優秀なチームがPeakで構築したものに非常に感銘を受けています。彼らがDecision Intelligenceにおけるカテゴリー定義のグローバルリーダーになるのを支援できることをとても喜ばしく思っています」。

SoftBankの2つのマンチェスター関連会社が協力するかどうかは明らかではないが、そうなれば興味深いシナジー効果が期待できるし、何よりもSoftBankが関心を持っている分野の1つを強調するものになるだろう。

長期的に、Peakがどのように進化し、すでに顧客となっている組織のより幅広いユーザー層にプラットフォームを拡大していくのか、またその展開がどうなるのかを見るのは興味深い。

ポッター氏は、短期的にも中期的にも「技術的な傾向のある人々」が同社製品のユーザーになる可能性が最も高いと考えているという。例えば、マーケティングマネージャーのような人たちはそうしたことをしないだろうと思うかもしれないが、多くのソフトウェアツールの一般的な傾向はまさに、データサイエンティストが使っているのと同じツールのバージョンを構築し、技術に詳しくない人たちが、自分の使いたいものを作るプロセスに関与できるようにすることにある。

「データパイプラインを流す能力を民主化し、それらをアプリケーションで動作するように最適化できることが重要だと考えています」とポッター氏は付け加えた。

画像クレジット:

原文へ

(文:Ingrid Lunden、翻訳:Dragonfly)

フェイスクブックの研究者がAIの訓練のために何千時間もの一人称視点の動画を収集

テック企業の多くが目指しているように、ARメガネやその他のウェアラブルに搭載されたAIが人間の目を介して物事を見るようになるのであれば、未来のAIは人間の視点をきちんと理解できるようになる必要がある。自身の視点というのは当然、我々にとっては自然なものだが、意外なことに日常的な作業を映した1人称視点のビデオ映像はほとんど存在しない。そこでFacebookは、数千時間に及ぶ映像を新たなデータセットとして公開するため収集した

Facebookが取り組んだのは、現在最も優れた物体・シーン認識モデルであっても、そのほとんどが三人称視点でのみ学習されているという課題だ。つまりキッチンに立っている場面を見れば、料理をしている人として認識することができても、料理をしている人の視点から見た場合では認識する事ができない。自転車を認識するにしても、自転車が映し出されれば認識できるが、自転車に乗っている人の視点では理解ができないわけだ。我々人間にとっては当たり前のことで、これまで見過ごされてきたことだが、コンピューターにとってはまだ難しい課題なのである。

機械学習の問題を解決するには通常、データを増やすかより優れたデータを得るかのどちらかが必要になる。今回の場合は両方あっても損はないだろう。Facebookは世界中の研究パートナーに協力を依頼し、料理や買い物、靴ひもを結ぶ様子から仲間と遊んでいる様子まで、一般的な行動の1人称映像を集めた。

13のパートナー大学が9カ国700人以上の参加者から何千時間ものビデオを収集。参加者はみんなボランティアで、自身の関与やアイデンティティのレベルをコントロールすることができた。これら数千時間にもわたる映像は、研究チームによって3000時間にまで縮小され、研究チームが映像を見て編集し、手書きで注釈を加え、さらに現実世界では撮影できなかった環境を演出した独自の映像も追加された。この研究論文にそのすべてが記されている

映像はメガネ型カメラ、GoPro、その他のデバイスなどさまざまな方法で撮影されている。研究者の中には、活動している環境を同時に収録した人もいれば、視線の方向やその他の指標を追跡した人もいる。これらのデータはすべてEgo4Dと呼ばれるFacebookのデータセットにまとめられ、研究コミュニティに広く提供される予定だ。

コンピュータービジョンが物体の識別に成功しているものと、1人称映像での識別に失敗しているもの(画像クレジット:Facebook)

「AIシステムが人間と同じように環境と関わり合うためには、AI分野が1人称視点の知覚というまったく新しいパラダイムに進化する必要があります。そのためには人間の目を通したリアルタイムの動き、関わり合い、多感覚の観察の中で、AIに日常生活の動作を理解することを教えなければなりません」と、主任研究員のKristen Grauman(クリステン・グラウマン)氏はFacebookのブログ中で話している。

Facebookは1人称視点での理解力があらゆる分野でますます重要になっていると考えてはいるものの、何とも信じ難いことにこの研究とRay-Ban Storiesのスマートシェードはまったく無関係とのこと(この3Dスキャンは同社のハビタットAIトレーニングシミュレーターに使用されるかもしれないが)。

「弊社の研究では、拡張現実やロボット工学への応用を強く意識しています。特にARメガネのようなウェアラブル製品が人々の日常生活や移動に不可欠な要素になるにつれ、将来AIアシストを実現するためには1人称視点の知覚が不可欠です。もし、あなたのデバイスに搭載されているアシスト機能が、あなたの目を通して世界を理解し、生活から認知的過負荷を取り除くことができたらどれほど有益か想像してみてください」とグラウマン氏はTechCrunchに話している。

世界中から映像を集めたというのは意図的な戦略である。1つの国や文化の映像だけを集めるようでは近視眼的だ。米国のキッチンはフランスのキッチン、ルワンダのキッチン、日本のキッチンとはまるで別物であり、また同じ食材を使って同じ料理を作ったり、同じ作業(掃除や運動)をしたりしても、個人間はさることながら、文化間となれば大きく異なるのは当然である。つまりFacebookの投稿にあるように「既存のデータセットと比較して、Ego4Dのデータセットは、シーン、人、アクティビティの多様性が高く、背景、民族、職業、年齢を問わずさまざまな人に向けてトレーニングされているため、モデルの適用性が高い」のである。

Facebookの1人称視点のビデオとその環境の例(画像クレジット:Facebook)

Facebookが公開しているのはデータベースだけではない。データ収集においてこのような飛躍的な進歩がある場合、あるモデルがどれだけこの情報を活用できているかをテストしたベンチマークを公開するのが一般的になっている。例えば犬と猫の画像があったとして、どちらがどちらかを見分けるというモデルの有効性をテストした標準的なベンチマークが知りたい場合もあるだろう。

しかし今回のような場合はもう少し複雑になる。1人称視点で物体を識別するというのはそれほど難しいことではなく、目新しさや便利さもない。「これはトマトですよ」と教えてくれるARメガネなど誰が必要だろう。他のツールと同様に、ARデバイスは私たちが知らないことを教えてくれるものでなければならないのだ。そのためにARデバイスは、意図、文脈、連動したアクションなどをより深く理解する必要がある。

そこで研究者らは、1人称視点の映像を分析することで理論的に達成可能な5つのタスクを考えた。

  • エピソード記憶:物体や概念を時間と空間の中で追跡し「私の鍵はどこにあるか」といった任意の質問に答えられるようにする。
  • 予測:一連の出来事を理解することで「レシピの次の手順は何か」といった質問に答えたり「車の鍵を家に忘れた」といったことを事前に指摘したりすることができる。
  • 手と物体のインタラクション:人がどのように物を掴み、操作しているのか、またその際に何が起こっているのかを把握することで、エピソード記憶やそれを模倣したロボットの動作に反映させることができる。
  • オーディオ・ビジュアル・ダイアライゼーション:音をイベントやオブジェクトに関連付けることで、音声や音楽をインテリジェントに追跡し「カフェでかかっていた曲は何だったのか」「会議の最後に上司は何と言ったか」といった質問のソリューションに適用する(「ダイアライゼーション」が「言葉」である)。
  • 社会的相互作用:誰が誰に向かって話しているのか、何が語られているのかを理解し、他のプロセスに情報を提供する目的と、複数の人がいる騒がしい部屋で字幕を表示するなどの瞬間的な使用の両方に対応する。

当然、このような活用法やベンチマークに限られているわけではなく、上記の例はAIモデルが1人称視点のビデオで何が起きているかを実際に理解しているかどうかをテストするための初期アイデアに過ぎない。論文に記載されている通り、Facebookの研究者らはそれぞれのタスクについてベースレベルの実行を行い、それを出発点としている。さらにこの研究をまとめた動画には、それぞれのタスクが成功した場合を想定した、非現実的とも言えるような例が挙げられている。

現在公開されているデータは、25万人の研究者が手作業で丹念に注釈を加えたという3000時間ものデータ数にははるか及ばないものの、まだ成長の余地があるとグラウマン氏は指摘する。今後もデータセットを増やしていく予定であり、パートナーも積極的に増やしていくという。

このデータの活用に興味がある読者は、Facebook AI Researchのブログをチェックして論文に掲載されている莫大な数の人々の1人に連絡を取ってみるといい。コンソーシアムが正確な方法を確定した後、数カ月以内に発表される予定だ。

画像クレジット:Facebook

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)

人工知能と機械学習を使ってブランドと顧客の距離を縮めるSocial Chatが約6.8億円調達

ブランドがソーシャルメディアやその他のサードパーティを通じて製品を販売する場合、それらのプラットフォーム上で広告を出すために数百万ドル(数億円)を費やすことがよくあるが、実際の顧客が誰であるかについてはほとんど、あるいはまったく知ることはない。ソーシャルコマースのスタートアップであるSocial Chat(ソーシャル・チャット)は、この状況を変えようとしている。

Social Chatは、Wish(ウィッシュ)のグロース部門の責任者であったFrost Li(フロスト・リー)氏が機械学習と人工知能を活用して、パーソナライゼーション、レコメンデーション、ライブ・カスタマー・サービスを実現するソフトウェアを開発するために5月に設立した会社だ。これにより、ソフトウェアで、ブランドが大規模なエンジニアリングチームに頼ることなく、失われたソーシャルエンゲージメントを収益や顧客獲得につなげることを可能にする。

「Wishでは、適切なショッピング体験を提供するためには、絶対的なパーソナライゼーションが必要であることを学びました。それを機械学習のエンジニアが行っていたのですが、Wishを辞めてブランドにアドバイスをしていると、Wishで行っていたことが珍しいことだとわかりました。人が手作業でやっていたので、結果的にパーソナライゼーションがあまりできなかったのです」とリー氏はTechCrunchに語っている。

彼女は、店頭でお気に入りの販売員と接するときのような顧客体験を、デジタルの世界でも再現し、ソーシャルイベントの中で消費者が購入や取引を行えるようにすることを目指している。

リー氏は、ソーシャルコマースはすべての店舗の標準となるべきだと考えており、それは近い将来実現するかもしれない。2021年初め、Grand View Research(グランド・ビュー・リサーチ)は、世界のソーシャルコマース市場は、現在から28%以上の成長を遂げ、2028年には3.4兆ドル(約387兆円)に達すると予測している。

「現在、オンラインショッピングは非常に取引という色の強いものですが、私たちは、お客様とのソーシャルな交流を通じて、長期的な関係を構築するお手伝いをしています」と彼女は付け加えた。

Social Chatは、eコマースのカスタマーエンゲージメントおよび収益ソフトウェアの提供を開始するにあたり、Race Capital(レース・キャピタル)とGradient Ventures(グラディエント・ベンチャーズ)が共同で600万ドル(約6億8300万円)のシードラウンドを実施したことを発表した。このシードラウンドには、Twitch(トゥイッチ)の共同創業者であるKevin Lin(ケビン・リン)氏、Agora.io(アゴラ)の創業者であるTony Zhao(トニー・チャオ)氏、Lyft(リフト)の元チーフプロダクトオフィサーであるRan Makavy(ラン・マカヴィ)氏、AfterPay(アフターペイ)のエンゲージメント担当グローバルヘッドであるAlanna Gregory(アラーナ・グレゴリー)氏、Wishのエンジニアリング担当バイスプレジデントであるJack Xie(ジャック・シー)氏が参加した。

Social Chatチーム、左からRichard Lin(リチャード・リン)、Pearl Tsang(パール・ツァン)、フロスト・リー、Michael Chen(マイケル・チェン)の各氏。(画像クレジット:Social Chat)

Race CapitalのパートナーであるEdith Yeung(エディス・イェン)氏は、未来のショッピングはソーシャル化すると述べている。子どもたちはテレビを見る機会が減り、TikTok(ティックトック)を見る機会が増えているため、ブランドは視聴者を他のプラットフォームに奪われないように、データを管理する必要がある。

「フロスト氏がやっていることは、ブランドに力を与えて、顧客を自社のウェブサイトに戻し、売上につなげることです。Facebook(フェイスブック)は人々に再び信頼してもらおうとしていますが、企業は何百万ドル(数億円)ものお金を払い続けながら、自分たちの顧客が誰なのかを知らないまま、翻弄されているのです」と同氏は付け加えた。

一方、Social Chatは以前、200万ドル(約2億2700万円)を調達し、合計800万ドル(約9億1000万円)を調達しており、この資金を使って人工知能や機械学習のエンジニアを増員し、製品の提供を拡大する予定だ。

まだかなり新しい会社であり、具体的な成長指標を見るには時期尚早だが、Social ChatはすでにHTCをはじめとする10のブランドの顧客と協力しており、初期の牽引力を発揮している。

ソーシャルコマース市場が数百億ドル(数兆円)規模の市場に成長し、トラッキングの技術的な部分がなくなっていくのを見ているリー氏は、会社の規模を拡大し、ユーザーの問題を解決する機会を提供していくことになるだろう。

「私たちは、ユーザーが価値を見出すことができ、かつユーザーを維持するためにFacebookにお金を払い続ける必要がないように、人工知能を活用した差別化を図っています。Google(グーグル)がクッキーを廃止したら、とんでもないことになります。ユーザーとコミュニケーションをとるためには、ファーストパーティデータを自分たちで所有しなければならず、そうでなければ可視性を失うことになるでしょう」。と彼女はいう。

画像クレジット:Busakorn Pongparnit / Getty Images

原文へ

(文:Christine Hall、翻訳:Akihito Mizukoshi)