グーグルがAIの進化を「個人の危機」の検出と検索結果の安全に役立てる

Google(グーグル)は米国時間3月30日、AIモデルを強化してGoogle検索をより安全にし、自殺や性的暴行、薬物乱用、DVなど扱いに注意を要するクエリを向上させると発表した。同社は、利用者が明確に露骨な内容や挑発的な内容を探しているのではない場合に、AIテクノロジーでそうした好ましくない内容を検索結果から取り除く機能も強化する。

現在は、利用者が自殺や乱用といった扱いに注意を要する情報を検索すると、Googleは検索結果よりも上に関連する国のホットラインの連絡先情報を表示する。しかし同社は、危険な状況にある人はさまざまな方法で検索することがあり、人間が検索のクエリを見ればフラグが立つとわかるにしても、検索エンジンにとっては検索した人が助けを必要としているかどうかが明らかにわかるとは限らないと説明する。Googleは、MUM(Multitask Unified Model)と呼ばれる同社の機械学習と最新AIモデルのテクノロジーを利用して、自動でこれまでよりも正確に、広範囲にわたる個人の危険に関する検索を検出できるようになると説明する。MUMは人間の質問やクエリの背後にある意図をこれまで以上に理解できるからだ。

Googleは2021年に開催したSearch OnイベントでAIテクノロジーを利用して検索を再設計する計画を紹介したが、今回発表した具体的なユースケースには言及していなかった。同社は、検索する人の意図をMUMがもっと理解して、その人が調べていることについてより深いインサイトを提供し、検索の新しい道筋を示すことに力を入れてきた。例を挙げよう。ユーザーが「アクリル絵画」と検索すると、Googleはアクリル絵画について「知っておくべきこと」を示す。さまざまなテクニックやスタイル、描き方のヒント、掃除のヒントなどだ。「日用品でアクリル絵画を描く方法」のように、ユーザーが検索しようとは思っていなかった別のクエリを提示することもある。この例に関してGoogleは、アクリル絵画に関して350種類以上のトピックを特定できると説明した。

危険な状況にいる人が明らかに助けを求めているとわかる言葉を入力するとは限らないが、そのような人が検索しているかもしれないトピックをもっと理解するために、MUMが前述したアクリル絵画の例と似た方法で今後使われる。

Googleはブログ記事で「正確に認識できなければ、最も有用な検索結果を表示するシステムを作ることはできません。だから機械学習を利用して言葉を理解することが重要なのです」と説明した。

例えば、ユーザーが「シドニーの自殺の名所」と検索したとする。Googleのこれまでのシステムでは「名所」が旅行の検索クエリなどでよく使われる言葉であるため、情報を探すクエリだと理解する。しかしMUMはこれをシドニーで身投げをする場所を探している人に関連するクエリであると理解し、危険な状態にある人の検索かもしれないと判断する。そして自殺相談ホットラインなど行動に結びつく情報を表示する。もう1つ、MUMの向上が見られる自殺に関するクエリとしては「自殺の最も一般的な方法」がある。これも、これまでは情報を探す検索としか理解されなかった。

MUMによって、人間にとっては文脈が明らかでも機械にとっては必ずしもそうではない長い検索クエリもこれまでより理解できるようになる。例えば「私が彼を愛していないというと彼が攻撃してくるのはなぜ」のようなクエリはDVを暗示している。しかし、自然言語で長文のクエリは、高度なAIを使用しないGoogleのシステムでは難しかった。

さらにGoogleは、MUMはそのナレッジをトレーニングしている75言語に移行でき、このようなAIの進化を世界中のユーザーに迅速に拡大できることにも言及した。つまり、前述したような個人の危機に関する検索に対し、現地のホットラインなど信頼できるパートナーの情報を多くの利用者に表示できるようになる。

MUMがGoogle検索に利用されるのはこれが初めてではない。これまでに新型コロナウイルスワクチンの情報に関する検索を向上させるために利用したと同社は述べている。Googleによれば、今後数カ月でスパム保護機能にMUMを使い、トレーニングデータの少ない言語にも拡大していくという。MUMの向上は他にも今後展開される。

AIテクノロジーによって、検索結果から露骨なコンテンツをフィルタリングする機能も向上する。Googleのセーフサーチのフィルタリングをオフにしても、Googleはわいせつなコンテンツを見つけることが目的ではない検索から好ましくない露骨なコンテンツを減らそうと試みている。そしてユーザーが世界中で何億回も検索をする中で、アルゴリズムによって性能が向上している。

現在はBERTと呼ばれるAIテクノロジーで、ユーザーが露骨なコンテンツを探しているのかどうかを判断できるようになってきている。Googleによれば、ウェブ検索と画像検索のクエリからランダムにサンプルをとり、性的な度合いが高い検索結果かどうかを検索品質評価者が判断して分析した結果、この1年間でBERTによって好ましくないショッキングな検索結果が30%減少したという。分析からは、女性、特に有色人種の女性に不当な影響を与えるとGoogleが述べている「人種、性的指向、ジェンダー」に関連する検索で、このテクノロジーが露骨なコンテンツを減らすのに特に有効だったこともわかった。

Googleは、今後数週間でMUMの進化したAIを検索に導入するとしている。

画像クレジット:Jaap Arriens/NurPhoto / Getty Images

原文へ

(文:Sarah Perez、翻訳:Kaori Koyama)

ドローンを使って森林をモニタリングするTreeswiftが約5.9億円のシードラウンド調達

過去10年間で、ドローンは森林モニタリングの重要なツールになりつつある。自然のバランスを大きく崩すことなく、多くのデータを一度に収集できる、迅速で効果的な方法だからだ。2020年にペンシルバニア大学のGRASP(General Robotics, Automation, Sensing and Perception)研究所からスピンオフして設立されたTreeswift(ツリースイフト)は、その可能性を推進するために活動してきた。

共同創業者のSteven Chen(スティーブン・チェン)氏、Elizabeth Hunter(エリザベス・ハンター)氏、Michael Shomin(マイケル・ショミン)氏、Vaibhav Arcot(ヴァイバヴ・アーコット)氏は、ドローン群と林業に関する専門知識を結集し、フライスルーで広範囲のデータを収集できるシステムを構築した。搭載カメラやセンサーで収集された情報は、森林減少のモニタリング、二酸化炭素回収の測定、森林火災の防止など、さまざまな用途に活用することが可能だ。

「私たちのミッションは、自然界のためのデータエコシステムを構築することであり、森林の林冠の下から重要なデータを取得することでそれを達成します」と、このスタートアップのCEOであるチェン氏はリリースで述べている。「より透明性が高く検証可能、かつ正確な地球の姿を底辺から観るのにTreeswiftの技術が役立つと期待しています」。

今週、同社は、それにふさわしく、シードラウンドを発表した。Pathbreaker Venturesが主導したこの480万ドル(約5億9400万円)の資金調達で、累計調達額は640万ドル(約7億9200万円)になった。

画像クレジット:Treeswift

「Treeswiftのソリューションは、これまで不可能だった方法で自然界を測定することができます」とPathbreaker VenturesのRyan Gembala(ライアン・ジェンバラ)氏はいう。「商業林業や二酸化炭素回収などに大きな影響を与えるでしょう。彼らの技術導入から得られたデータは、今後数十年にわたり自然ベースのソリューションとマネジメントにおける最大のチャンスの基盤となると考えています」。

フィラデルフィアを拠点とする同スタートアップの主要製品は「SwiftCruise」で、樹木単位でメトリックを収集することができるハードウェアとソフトウェアの組み合わせのソリューションである。この情報は、搭載された機械学習(ML)アルゴリズムによって処理され、クラウドベースのデータダッシュボードに収集される。これは、従来、衛星や飛行機の画像で収集されていたものよりも、より詳細な画像である。

画像クレジット:Treeswift

原文へ

(文:Brian Heater、翻訳:Den Nakano)

コンピュータビジョンチームに合成データを提供するDatagenが約61.7億円のシリーズB資金調達を実施

イスラエルで設立されたDatagen(データジェン)は、コンピュータビジョン(CV)チームのために合成データソリューションを提供するスタートアップ企業だ。同社はその事業の成長を促進するため、5000万ドル(約61億7000万円)のシリーズBラウンドを実施し、これまでの資金調達総額が7000万ドル(約86億4000万円)を超えたと発表した。今回のラウンドは新たに投資家となったScale Venture Partners(スケール・ベンチャー・パートナーズ)が主導し、パートナーのAndy Vitus(アンディ・ヴィータス)氏がDatagenの取締役に就任した。

テルアビブとニューヨークにオフィスを構えるDatagenは「実世界の環境をシミュレートすることによってわずかなコストで機械学習モデルを迅速に訓練し、AIの進歩を推進する完全なCVスタックを構築している」と、ヴィータス氏は述べている。このパロアルトに拠点を置くVCは「これはCVアプリケーションの開発とテストの方法を根本的に変えるだろう」と予測する。

11カ月前にDatagenが1850万ドル(約22億8000万円)を調達したシリーズAラウンドを支援した投資家たちも、この新たなラウンドに参加した。その中にはVCのTLV Partners(TLVパートナーズ)とSpider Capital(スパイダー・キャピタル)が含まれる。シリーズAを主導したViola Ventures(ヴィオラ・ベンチャーズ)も、今回はその成長部門であるViola Growth(ヴィオラ・グロース)を通じて参加した。さらに、コンピューター科学者のMichael J. Black(マイケル・J・ブラック)氏や、Trevor Darrell(トレバー・ダレル)氏、NVIDIA(エヌビディア)のAI担当ディレクターであるGal Chechik(ガル・チェチック)氏、Kaggle(カグル)のAnthony Goldbloom(アンソニー・ゴールドブルーム)CEOなど、AIやデータ分野の高名な人物も倍賭けを決めている。

投資家の名簿はもっと長くなる可能性があると、DatagenのOfir Zuk(オフィール・ズク)CEOはTechCrunchに語った。このラウンドは数週間前に終了したが、同スタートアップは、確認が取れていない数名の名前とともに「クローズを延期した少しの余地」を残しているという。

シリーズA以降のDatagenの主なマイルストーンの1つは、ターゲットユーザーが初期のフィードバックで要求したセルフサービス・プラットフォームの構築だったと、ズク氏は語る。これによってDatagenは、顧客がCVアプリケーションのトレーニングに必要なビジュアルデータを生成するための、より拡張性の高い方法を提供することができるようになった。

Datagenのソリューションは、フォーチュン100社や「ビッグテック」企業を含む、さまざまな組織内のCVチームや機械学習エンジニアに使用されている。その用途は多岐にわたるが、中でも特に加速している分野が4つあるとズク氏はいう。AR/VR/メタバース、車内および自動車全般、スマート会議、ホームセキュリティだ。

車内への応用は、Datagenが行っていることをより良く理解するための好例といえるだろう。これはつまり、乗員がシートベルトを着用しているかどうかなど、車内の状況を意味する。乗員やクルマの形状はさまざまであるため、そこでAIが活躍するわけだ。最初に現実世界から作成した3Dモーションキャプチャをベースに、Datagenの顧客は、例えばエアバッグの展開する位置を正確に決めるためなどに必要な膨大なデータを生成することができる。

Datagenは、ビジュアルデータに特化しているものの、特定の分野に縛られているわけではない。もし、小売業やロボット工学のユースケースが軌道に乗れば、倉庫のモーションキャプチャなど、特定の現実世界のデータを収集するだけでよい。その上のアルゴリズムや技術は、分野にとらわれないとズク氏はいう。

20年以上の歴史を持つ企業向けVCのScale Venture Partnersは、すでに自動車運転シミュレーション・プラットフォームのCognata(コグナタ)に投資しており、シミュレーションデータの分野に関しては強気だ。ズク氏も同様で「合成データは現実のデータを凌駕しつつある」という言葉でまとめた。

画像クレジット:Andriy Onufriyenko / Getty Images

原文へ

(文:Anna Heim、翻訳:Hirokazu Kusakabe)

マイクロソフトがZ-Codeを使ってAI翻訳サービスを改善

Microsoft(マイクロソフト)は米国時間3月22日、同社の翻訳サービスを改訂したことを発表した。新しい機械学習技法によって、多数の言語間における翻訳が著しく改善されるという。「spare Mixture of Expert(Mixture of Expertを出し惜しみする)」アプローチを使用するという同社のProject Z-Code(プロジェクト・ズィー・コード)を基盤とする新モデルは、盲検法評価で同社の以前のモデルより3~15%高いスコアを記録した。Z-CodeはMicrosoftのXYZ-Codeイニシアチブの一環で、複数の言語を横断してテキスト、視覚、音声を組み合わせることによって、これまで以上に強力で有効なAIシステムを作る。

「Mixture of Experts」はまったく新しい技法というわけではないが、翻訳の場面では特に有効だ。システムはまず、タスクを複数のサブタスクに分割し、それぞれを「expert(エキスパート)」と呼ばれるより小さい特化したモデルに委譲する。次に、どのタスクをどのexpertに委譲するかを、独自の予測に基づいてモデルが決定する。ごく簡単にいうなら、Mixture of Expertsは複数のより特化されたモデルを内包するモデルと考えることができる。

画像クレジット:Microsoft

「Z-Codeを使うことで、驚くほどの進展が見られました。それは、単一言語と複数言語のデータに対して転移学習(transfer learning)とマルチタスク学習の両方を使って最先端の言語モデルを作ることができたからです。これで品質と性能と効率性の最善の組み合わせを顧客に届けることができます」とMicrosoftのテクニカルフェロー兼Azure(アジュール)AI最高技術責任者のXuedong Huang(シュードゥン・ホァン)氏はいう。

この結果、例えば、10種類の言語間で直接翻訳することが可能になり、複数のシステムを使う必要がなくなる。すでにMicrosoftは固有表現抽出、文章要約、カスタム文章分類、キーワード抽出など、同社AIシステムの他の機能の改善にZ-Codeモデルを使い始めている。しかし、翻訳サービスにこのアプローチを利用したのはこれが初めてだ。

翻訳モデルは伝統的に著しく巨大で、製品環境に持ち込むことは困難だった。しかしMicrosoftのチームはsparse(スパース)アプローチを採用し、タスクごとにシステム全体を動かす代わりに、少数のモデルパラメータのみを起動する方法を選んだ。「これによって大幅にコスト効率よく実行できるようになります。家の暖房を1日中全開されるのではなく、必要な部屋を必要な時だけ暖めるほうが安くて効率がよいのと同じことです」とチームがこの日の発表で説明した。

画像クレジット:Keystone/Getty Images / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Nob Takahashi / facebook

成人10万人分のデータを機械学習アルゴリズムで睡眠解析し睡眠パターンを16に分類、新たな不眠症診断法に期待

成人10万人分のデータを機械学習アルゴリズムで睡眠解析し睡眠パターンを16に分類、新たな不眠症診断法に期待

東京大学は3月15日、腕の加速度から覚醒と睡眠を判別する機械学習アルゴリズム「ACCEL」を開発し、約10万人の加速度のデータを解析したところ、睡眠が16種類のパターンに分類されることがわかったと発表した。その中には睡眠障害との関連が疑われるものもあるため、腕時計型ウェアラブルデバイスと「ACCEL」を組み合わせることで、睡眠障害の新たな診断方法や治療法の開発につながるものと期待されている。

ライフスタイルの多様化により、遺伝的に持っている睡眠パターンと相容れない生活が強いられると、不眠症となり健康リスクが高まる。例えば夜型の人は、昼間に学校や会社に通うといった社会的義務感により平日の睡眠時間が短くなり、平日と休日の睡眠時間が違ってくる傾向にある。これは「社会的時差ぼけ」と呼ばれ、肥満、高血圧、精神的なストレスといった健康への悪影響が心配される。実に現代人の60〜70%は睡眠不足を感じているという。その解消には正確な不眠症の診断と適切な治療が大切だが、そのためには週単位の睡眠パターンを把握しなければならず、その方法は問診などによる主観的な指標に頼っているのが現状だ。

そこで東京大学大学院医学系研究科機能生物学専攻システムズ薬理学分野の上田泰己教授、香取真知子氏、史蕭逸助教らによる研究グループは、簡単に正確に1週間以上の長期にわたる睡眠測定を行い、その結果を定量的に解析できれば、より詳細な診断ができると考えた。そして2022年に、腕の加速度から睡眠と覚醒の状態を判定するアルゴリズム「ACCEL」を開発した。

研究グループは、英国の遺伝情報や健康情報を含む研究用データベース「UK Biobank」にある、30〜60代の成人10万人分の加速度データから睡眠データを生成し、それを「ACCEL」で解析した。睡眠データを21の睡眠の指標に変換し、次元削減法とクラスタリング法という分析手法を用いて睡眠パターンを8種類のクラスターに分類。さらに、睡眠指標の中の睡眠時間や中途覚醒時間など、睡眠障害に関係が深いとされる6つの指標において、一般的な睡眠から大きく外れるデータを同様に解析したところ、新たに8種類のクラスターが分類された。こうして、不眠症診断に用いられている現行方式では判定が難しい社会的時差ぼけや、生活習慣に関連するクラスターを定量的に分類することに成功した。

今後は、睡眠障害と診断されている人のデータを用いて、各クラスターと睡眠障害の関係性をより正確に解明することで、定量的な指標に基づく新たな診断方法の開発が期待できるという。また、睡眠障害をより詳細な分類による適切な治療法の確立も期待される。

解析された16のクラスターは以下のとおり。

    • 1:中途覚醒を持つ(不眠症に関連)。合計睡眠時間は多い
    • 3a:中途覚醒を持つ(不眠症に関連)。合計睡眠時間は一般的
    • 3b:中途覚醒を持つ(不眠症に関連)。合計睡眠時間は少ない
    • 2a:不規則な睡眠スケジュールを示す
    • 2b:断片的な睡眠を繰り返し、合計睡眠時間が少ない
    • 3b-1:合計睡眠時間が短く、中途覚醒が長い(不眠症に関連)
    • 3b-2:合計睡眠時間が短く、長い中途覚醒と短い中途覚醒の両方を持つ(不眠症に関連)
    • 4a:1日の睡眠覚醒リズムが24時間よりも長いと推定される
    • 4b:平均的な睡眠を持ち、データ総数がもっとも多い
    • 4b-1:長眠型
    • 4b-2:朝型
    • 4bー3:1日の生活リズム(睡眠覚醒リズム)が24時間より短い
    • 4b-4:合計睡眠時間が短く、短い中途覚醒を持つ(不眠症に関連)
    • 4b-5:合計睡眠時間が一般的であり、少ない回数の長い中途覚醒を持つ(不眠症に関連)
    • 4b-6:夜型
    • 5:日中の睡眠を持たない

数千年にわたり損なわれていた古代ギリシャの碑文の完成をAIが支援

古代ギリシャ語の研究者にとって、頼りとする原文が数千年前のものという古さゆえに、修復不可能なほど損傷しているというようなことはよくある。DeepMind(ディープマインド)が開発した機械学習モデル「Ithaca(イサカ)」が、歴史家にとって新しい強力なツールになるかもしれない。失われた単語や文章の位置と書かれた年代を驚くほど正確に推測する。AIの珍しい応用例だが、その有用性が技術分野以外でも発揮されることを証明している。

不完全な古文書は、劣化した物質に関するさまざまな分野の専門家が関わる問題だ。原文は石、粘土、パピルスに刻まれている。アッカド語、古代ギリシャ語、リニアA言語で、食料品店の請求書から英雄の旅まで、あらゆることが書かれている。いずれの文書にも共通するのは、数千年の間に蓄積された損傷だ。

文字が磨り減ったり、ちぎれたりしてできた空白は「欠落」と呼ばれ、短いものでは1文字、長いものでは1章、あるいは1つの物語全体が欠落していることもある。欠落を埋めるのは簡単でも不可能でもないが、その間のどこからか始めなければならない。ここでIthacaの出番となる。

Ithaca(オデュッセウスの故郷の島から名づけられた)は、古代ギリシャの膨大なテキストで訓練されており、不足している単語やフレーズが何であるかだけでなく、それがどのくらい古いものか、どこで書かれたかも推定できる。ただ、それだけで叙事詩の全巻を埋めることはできない。これは、この種のテキストを扱う人たちのためのツールであり、解決策ではない。

「Nature(ネイチャー)」誌に掲載された論文では、ペリクシア時代のアテネの勅令を例にとって、その有効性を実証した。紀元前445年に書かれたと考えられているこの勅令は、Ithacaのテキスト分析によれば、実際には紀元前420年前後のものであり、より新しい証拠と一致している。大したことには聞こえないかもしれないが、もし権利章典が実際には20年後に書かれたとしたらと想像してほしい。

画像クレジット:DeepMind

テキストそのものについては、専門家による1回目の結果は、正解が約25%だった。決して優秀とは言えない。もちろん、テキストの復元は午後のお遊びではなく、長期的なプロジェクトであることは言うまでもない。しかし、人間とIthacaの組み合わせでは、すぐに72%の精度を達成することができた。これは他のケースでもよく見られることだ。究極的には人間の精度の方が高いものの、行き詰まりを素早く排除したり、出発点を示唆したりして、プロセスを加速できる。医療データの場合、AIがすぐに気づくような異常を人間は見落としがちだが、最終的に詳細に気づき、正しい答えを見つけるのは人間の専門知識だ。

Ithacaは、手元に欠落の多い古代ギリシャ語のテキストがあれば、このサイトで簡易版を試せる。また、そこで提示されている複数の例から1つを使って、空白がどのように埋められるのかを見ることもできる。長い文章や、10文字以上欠けている場合は、このColabノートブックで試してみてほしい。コードはGitHubのこのページで公開されている。

古代ギリシャ語はIthacaがはっきりと結果を出せる分野だが、チームはすでに他の言語についても懸命に取り組んでいる。アッカド語、デモティック語、ヘブライ語、マヤ語はすべてリストに載っており、今後さらに増えると期待される。

「Ithacaは、人文科学における自然言語処理と機械学習の貢献の可能性を示しています」と、このプロジェクトに携わったアテネ大学のIon Androutsopoulos(イオン・アンドラウトソプロス)教授は話す。「この可能性をさらに実証するためにIthacaのようなプロジェクトがもっと必要ですが、それだけでなく、人文科学とAI手法の両方をよく理解している将来の研究者を育てる適切なコースや教材も求められます」。

画像クレジット:Image Credits: Wikimedia Commons under a CC BY 2.0 license.

[原文へ]

(文:Devin Coldewey、翻訳:Nariko Mizoguchi

Strong Computeは機械学習モデルのトレーニングを「100倍以上高速化」できると主張する

ニューラルネットワークのトレーニングには、市場で最も高速で高価なアクセラレータを使ってさえも、多大な時間がかかる。だから、多くのスタートアップ企業が、ソフトウェアレベルでプロセスを高速化し、学習プロセスにおける現在のボトルネックをいくつか取り除く方法を検討していることも、不思議ではないだろう。オーストラリアのシドニーに拠点を置くスタートアップで、最近Y Combinator(Yコンビネーター)の22年冬クラスに選抜されたStrong Compute(ストロング・コンピュート)は、学習プロセスにおけるこのような非効率性を取り除くことによって、学習プロセスを100倍以上高速化することができると主張している。

「PyTorch(パイトーチ)は美しいし、TensorFlow(テンソルフロー)もそうです。これらのツールキットはすばらしいものですが、そのシンプルさ、そして実装の容易さは、内部において非効率的であるという代償をもたらします」と、Strong ComputeのCEO兼創設者であるBen Sand(ベン・サンド)氏は語る。同氏は以前、AR企業のMeta(メタ)を共同設立した人物だ。もちろん、Facebook(フェイスブック)がその名前を使う前のことである。

一方では、モデル自体を最適化することに注力する企業もあり、Strong Computeも顧客から要望があればそれを行うが、これは「妥協を生む可能性がある」とサンド氏は指摘する。代わりに同氏のチームが重視するのは、モデルの周辺にあるものすべてだ。それは長い時間をかけたデータパイプラインだったり、学習開始前に多くの値を事前計算しておくことだったりする。サンド氏は、同社がデータ拡張のためによく使われるライブラリのいくつかを最適化したことも指摘した。

また、Strong Computeは最近、元Cisco(シスコ)のプリンシパルエンジニアだったRichard Pruss(リチャード・プルス)氏を雇用し、すぐに多くの遅延が発生してしまう学習パイプラインのネットワークボトルネックを除去することに力を注いでいる。もちろん、ハードウェアによって大きく違うので、同社は顧客と協力して、適切なプラットフォームでモデルを実行できるようにもしている。

「Strong Computeは、当社のコアアルゴリズムの訓練を30時間から5分に短縮し、数百テラバイトのデータを訓練しました」と、オンライン顧客向けにカスタム服の作成を専門とするMTailor(Mテイラー)のMiles Penn(マイルス・ペン)CEOは語っている。「ディープラーニングエンジニアは、おそらくこの地球上で最も貴重なリソースです。Strong Computeのおかげで、当社の生産性を10倍以上に向上させることができました。イテレーション(繰り返し)とエクスペリメンテーション(実験)の時間はMLの生産性にとって最も重要な手段であり、私たちはStrong Computeがいなかったらどうしようもありませんでした」。

サンド氏は、大手クラウドプロバイダーのビジネスモデルでは、人々ができるだけ長くマシンを使用することに依存しているため、彼の会社のようなことをする動機は一切ないと主張しており、Y Combinatorのマネージングディレクターを務めるMichael Seibel(マイケル・サイベル)氏も、この意見に同意している。「Strong Computeの狙いは、クラウドコンピューティングにおける深刻な動機の不均衡です。より早く結果を出すことは、クライアントから評価されても、プロバイダーにとっては利益が減ることになってしまうのです」と、サイベル氏は述べている。

Strong Computeのベン・サンド氏(左)とリチャード・プルス氏(右)

Strong Computeのチームは現在、依然として顧客に最高のサービスを提供しているが、その最適化を統合してもワークフローはあまり変わらないので、開発者はそれほど大きな違いを感じないはずだ。Strong Computeの公約は「開発サイクルを10倍にする」ことであり、将来的には、できる限り多くのプロセスを自動化したいと考えている。

「AI企業は、自社のコアIPと価値がある、顧客、データ、コアアルゴリズムに集中することができ、設定や運用の作業はすべてStrong Computeに任せることができます」と、サンド氏は語る。「これにより、成功に必要な迅速なイテレーションが可能になるだけでなく、確実に開発者が企業にとって付加価値のある仕事だけに集中できるようになります。現在、開発者は複雑なシステム管理作業のML Opsに、最大で作業時間の3分の2も費やしています。これはAI企業では一般的なことですが、開発者にとって専門外であることが多く、社内で行うのは合理的ではありません」。

おまけ:下掲の動画は、TechCrunchのLucas Matney(ルーカス・マトニー)が、サンド氏の以前の会社が開発したMeta 2 ARヘッドセットを2016年に試した時のもの。

画像クレジット:Viaframe / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Hirokazu Kusakabe)

アップルがM1シリーズ最上位版「M1 Ultra」を発表

Apple(アップル)は米国時間3月8日、同社の「Peek Performance」イベントにおいて、新しいM1チップ「M1 Ultra」の発売を発表した。このチップは、これまでM1、M1 Pro、M1 MaxがあったM1ファミリーの最終バージョンであるとAppleは述べている。

Ultraは2つのM1 Maxダイをベースに、既存のM1 Maxチップに存在する、しかし休止状態だったらしい接続を使用する。この相互接続により、2つのチップ間で2.5TB/sの帯域幅が実現されている。Appleはこれを(同社らしいネーミングで)「Ultra Fusion」と呼んでいる。

M1 Maxを2つ組み合わせたチップなのだから、Ultra版ではCPUとGPUのコアが2倍になっているのは当然のことだ。つまり、高性能コア16個と高効率コア4個の計20CPUコアと64GPUコアを搭載している。このチップは最大で128GBのユニファイドメモリに対応する。また、機械学習(ML)ワークロードのための32コアのNeural Engine(ニューラルエンジン)も搭載している。これらすべてを合わせると、1140億個のトランジスタになる。

Appleによれば、これらすべてによってUltraはM1の8倍速くなり、一方でこのチップは、CPUとGPUの両方において、ワットあたりのCPU性能で10コアのデスクトップチップをも凌駕しているとのこと。ただしAppleは、M1 Ultraをどのデスクトップチップと比較しているのかは明言しなかった。

Appleは2020年11月に初代M1チップを発売し、同社の製品ポートフォリオ全体でIntelのチップから脱却する第一歩を踏み出した。

2020年の発売当時、8コアのM1はMac mini、Macbook Air、MacBook Proに搭載されてデビューした。その後Appleは、最大10コアのCPU、32コアのGPU、(16GBが上限だった初代M1と異なり)64GBのユニファイドメモリをサポートする、大幅にパワフルなM1 ProおよびM1 Maxチップを発表した。これらのチップは、14インチと16インチのMacBook Proでデビューした。

M1 Ultraは、新しいMac Studioでデビューする予定だ。

もしAppleが今後もこの命名スキームを踏襲するなら、私たちは後のイベントでM2 ProsとMaxチップを紹介するのを見ることができるかもしれない。

Read more about the Apple March 2022 event on TechCrunch

画像クレジット:Apple

原文へ

(文:Frederic Lardinois、翻訳:Den Nakano)

「もっと早く知りたかった」、Gesundが医療アルゴリズム検証データを提供するために2.3億円を調達

医療アルゴリズムを開発することと、それが本当に機能することを証明することは、まったく別の話だ。そのためには、入手しにくいある重要なものが必要だ。医療データである。現在、とあるスタートアップ企業が、そのようなデータを、検証研究を容易にするツールとともに提供する準備を整えている。

今週、2021年に創業されたGesund(ゲズンド)が、500 Globalが主導する200万ドル(約2億3000万円)のシードラウンドでステルスから浮上した。CEOで創業者のEnes Hosgor(エネス・ホスゴー)氏はTechCrunchに対して、同社はすでに多くの実績を残していて、実行可能なプラットフォーム、30社の見込み顧客との取引、今四半期の売上見込みなどを見込んでいると語る。

基本的にGesundは、医療アルゴリズムを開発するAI企業や、自身のモデルをテストするアカデミアのためのCRO(Contract Research Organization、医薬品開発業務受託機関)なのだ。一般のCROが医薬品や医療機器企業向けの臨床試験をデザインするのと同じように、Gesundのプラットフォームは、AI企業が自社の製品をテストするためのデータをキュレーションし、その比較をスムーズに行うためのITインフラを構築する。

ホスゴー氏は「私たちは、自分たちを機械学習運用企業だと考えています」という。「私たち自身はアルゴリズムを手がけません」。

医療アルゴリズムは、学習させるデータがあってこそ役に立つが、多様で有用なデータセットの入手は困難であることが知られている。例えば、2020年にJAMAで発表された研究では、放射線科、眼科、皮膚科、病理科、消化器科などの分野にわたる深層学習アルゴリズムを説明した74の科学論文を分析し、これらの研究で使われたデータの71%がニューヨーク州、カリフォルニア州、マサチューセッツ州からもたらされたものだということを報告している。

実際、米国の34の州は、これらのアルゴリズムの学習に使用したデータを提供しておらず、より広い母集団に対する一般化の可能性が疑問視されている。

また、この問題は医療機関の種類を越えて存在している。大規模かつ権威ある大学病院で収集されたデータを使ってアルゴリズムを学習させることは可能だ。しかし、それを地域の小さな病院に導入しようと思っても、そうしたまったく異なる環境ではうまくいく保証はない。

BMJに発表された152件の研究のメタレビューによれば、アルゴリズムを訓練するために使用されるデータセットは、一般的に、必要とされるものよりも小さいという。当然ながら、アルゴリズムの成功例もあるものの、これは業界全体の問題なのだ。

テクノロジーだけでこれらの問題を解決することはできない。そもそも、そこにないデータを分類したり、提供したりすることはできないのだ。ヨーロッパ人以外の祖先を持つ人々の遺伝子研究が、非常に不足していることを考えてみて欲しい。しかしGesundは、既存のデータへのアクセスを容易にし、データ共有の新たな道を開くパートナーシップを構築するという、テクノロジーを役立てられる可能性のある問題に焦点を絞っている。

Gesundの検証プラットフォームの画面

Gesundのデータパイプラインは「各臨床施設と締結している、データ共有契約」に基づいているとホスゴー氏はいう。現在、Gesundはシカゴ大学医療センター、マサチューセッツ総合病院、ベルリンのシャリテ大学で収集された画像データにフォーカスしている(同社は今後、放射線医学以外の分野にも拡大する計画だ)。

機械学習アプリケーションで使用するためのデータの集約と配信は、Nightingale Open Science Project(ナイチンゲール・オープンソースプロジェクト)のような、研究者に臨床データセットを無料で提供する他の企業によっても行われている(物議を醸しているGoogleの「Project Nightingale」[プロジェクト・ナイチンゲール]とは提携していない)。だが、データそのものも重要な要素だが、実はホスゴー氏が秘密兵器と見ているのは、同社のテクノロジー・スタックなのだ。

「誰もがクラウドでML(機械学習)をやっています。ですが、一般的な医療機関はクラウドを持っていないので、すべてが失われてしまうのです」とホスゴー氏はいう。「そこで私たちは、病院のファイアウォール内に設置できる技術スタックを構築しました。これは機械学習にはつきもののサードパーティのマネージドサービスには一切依存していません」。

そこを起点として、プラットフォームには「ローコード」のインターフェイスが搭載されている。つまり、医師や医療機関は、基本的に必要なデータセットをドラッグ&ドロップし、そのデータに対して自身のアルゴリズムをテストすることができるのだ。

ホスゴー氏は「創業して約6カ月ですが、すでに本格的に走っています。私たちは開発した最初の製品は、クラウドリソースにアクセスできない高度なコンプライアンス環境において、モデルの所有者がデータに対して自身のアルゴリズムを実行し、正確なメトリクスをその場で生成できるようにするものです。それが私たちの強みなのです」と説明する。

現時点では、GesundはNightingaleと同様に、一部のサービスを無料で提供している。同社のCommunity Edition(コミュニティエディション)では、手持ちのアルゴリズムがある研究者たちが、自分たちのアルゴリズムを無料でテストできる(ただし、自分たちのデータセットをアップロードする必要がある)。

一方、同社の「プレミアム」版の費用を払うのは、AI企業だ。これによって、お金を払っている顧客は、独自のデータセットにアクセスできるようになるとホスゴー氏はいう。そして、必要なデータにはお金を払うという実績もある。現在、Gesundは30の潜在顧客との交渉中だとしていて、今期中に収益を上げる予定だという。

「私たちは2021年11月にシカゴで開催されたRSNAに出席しましたが、話を聞いたあらゆるAI企業から『ああ、もっと早く知りたかったです』という発言を聴きました」。

現在Gesundが調達した資金は今回の200万ドル(約2億3000万円)のプレシードラウンドだけだが、ホスゴー氏は2022年中に再び資金調達を行えることを期待している。近い将来、同社は研究開発に注力しつつ、米国および欧州における臨床提携を拡大する予定だ。

画像クレジット:Gesund

原文へ

(文:Emma Betuel、翻訳:sako)

オックスフォード大からスピンアウトした英QuantrolOxは機械学習で量子ビットを制御する

2021年にオックスフォード大学からスピンアウトした新しいスタートアップ、QuantrolOxは、量子コンピュータ内部の量子ビットを機械学習(ML)で制御しようとしている。オックスフォード大学のAndrew Briggs(アンドリュー・ブリッグス)教授、テック起業家のVishal Chatrath(ヴィシャール・チャトラス)氏、同社のチーフサイエンティストのNatalia Ares(ナタリア・アレス)博士、量子技術責任者のDominic Lennon(ドミニク・レノン)博士が共同で設立した同社は西ヨーロッパ時間2月23日、Nielsen VenturesとHoxton Venturesが主導して140万ポンド(約2億1700万円)のシードラウンドを調達したと発表した。Voima Ventures、Remus Capital、Arm(アーム)の共同創業者であるHermann Hauser(ハーマン・ハウザー)博士、Laurent Caraffa(ローラン・カラファ)氏もこのラウンドに投資している。

同社の技術はテクノロジー非依存型で、標準的な量子コンピューティング技術のすべてに適用できる。QuantrolOxのシステムは、手動調整の代わりに、量子ビットの調整、安定化、最適化を大幅に高速化することができるというものだ。QuantrolOxのCEOであるチャトラス氏は、既存の方法はスケーラブルではないと主張し、特にこれらのマシンが改良され続ける限りはそうだと語る。

「ある米国の投資家と話していた時のことです。彼は、量子コンピュータが有用であるために収益を得るのを待つ必要はないという点で、我々は量子業界のスコップやつるはしのようなものだと言いました」とチャトラス氏。「5個の量子ビットから、願わくば数百万個の量子ビットになっていく中で、デバイス特性評価と量子ビットの調整を行うために、毎日私たちのソフトウェアが必要になります」。

同社は当面は、固体量子ビットに焦点を当てるという。フィンランドの研究所との緊密な連携など、同社がアクセスできるシステムであることも理由の1つだが、同社はそのパートナーシップについてはまだ公表する準備ができていない。すべての機械学習の問題と同様に、QuantrolOxは効果的な機械学習モデルを構築するために十分なデータを収集する必要がある。

チャトラス氏も述べているように、我々はまだ量子コンピューティングの非常に初期の段階にいる。しかし、QuantrolOxのようなツールが研究者のデバイステストのプロセスを加速するのに役立つなら、それは業界全体にとって恩恵となる。業界ではすでに多くの企業が、同社の制御ソフトウエアの利用を打診していると同氏は指摘した。

同社は現在7人の正社員を擁しているが、近い将来、さらに10人程度を採用する予定だという。だがチャトラス氏は、今後2年間で人数がそれ以上増えることはないだろうと述べている。「ニッチな分野に特化しているため、大きなチームは必要ありません」と彼はいう。「フルスタックにするつもりはありません。スタックの上位には行きたくないし、スタックの下位はハードウェアですから、そこにも行けません。当社がフォーカスしているのは非常に狭いエリアです」。

今のところQuantrolOxは、量子コンピュータの開発者とより多くのパートナーシップを構築することに注力している。チームは物理的なマシンだけでなく、これらのシステムと統合できるように、それらを制御するソースコードにもアクセスする必要があるため、かなり深いパートナーシップとなるからだ。

もちろん、今の業界には標準規格がほとんどないという問題があり、チャトラス氏はそれを痛感している。「量子産業が成功するためには、我々のようにある特定の分野に超特化したスタートアップがたくさん必要です。超特化した企業でなければ、規模の経済が得られないからです」と彼はいう。「フルスタックの(1つですべてなし得るという)ストーリーを語るのは、遅かれ早かれ止めなければならないと思います。人々は、企業のエコシステムを構築し始める必要があります」。

画像クレジット:hh5800 / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Den Nakano)

ML可観測性プラットフォームのAporiaが約28.8億円のシリーズA資金を調達

テルアビブに拠点を置くAporia(アポリア)は、企業がAIベースのサービスを監視・説明できるように支援するスタートアップ企業だ。同社は米国時間2月23日、Tiger Global(タイガー・グローバル)が主導する2500万ドル(約28億8000万円)のシリーズA資金調達ラウンドを実施したことを発表した。このラウンドには、新たに投資に加わったSamsung Next(サムスン・ネクスト)の他、以前の投資家であるTLV Partners(TLVパートナーズ)とVertex Ventures(ヴァーテックス・ベンチャーズ)も参加、同社の調達資金総額は3000万ドル(約34億6000万円)に達した。

2021年サービスを開始した当初は、オブザーバビリティ(可観測性)プラットフォームであることに正面から取り組んでいた同社だが、それからチームはその網を少し広げ、フルスタックのML(機械学習)モニタリング・プラットフォームとなっていった。

「今のところ、私たちのソリューションには4つの柱があります」と、Aporiaの共同創業者兼CEOであるLiran Hason(リラン・ハソン)氏は説明する。「1つ目の柱は可視性、つまりダッシュボード機能のようなもので、予測値などを見ることができます。2つ目は、かなり新しいものですが、説明可能性です。すでに何人かのユーザーには使っていただいています。3つ目がモニタリング、そして4つ目が自動化ですが、これも新しいものです」。

自動化は、もちろん、どのような監視サービスにとっても、明白な次のステップである。ユーザーは普通、受け取ったアラートに対して、何らかのアクションを起こしたいと思うからだ。Aporiaは、すでにその監視サービスにドラッグアンドドロップツールを取り入れていたので、この機能もすぐに追加できた。この自動化機能を拡張して、より複雑なユーザーケースに対応できるようにしたいと、ハソン氏は言及している。

また、説明可能性も、顧客からのフィードバックを基に追加した機能だ。企業には規制当局から、自社のAIモデルが何を行っているかを説明できるように求める圧力が増している。Aporiaは、モデルがなぜそのような予測をするのか、また、さまざまな入力パラメータがどのように予測に寄与しているのかを、ユーザーが理解できるように支援する。

フルスタックなML可観測性プラットフォームになるというミッションは、顧客の心に響いているようだ。Aporiaによると、同社のサービスを利用する顧客の数は、直近の半年間だけで600%増加したという。現在はその顧客に、Lemonade(レモネード)やArmis(アーミス)などの企業が含まれている。

「Aporiaは起ち上げ以来、信じられないような成長を見せ、驚くべき勢いで、急速にMLの可観測性の分野におけるリーダーとなっています」と、Tiger GlobalのパートナーであるJohn Curtius(ジョン・クルティウス)氏は述べている。「グローバル企業の経営幹部は、人工知能のメリットと、それが事実上すべての産業にどれほど影響を与えているかを理解していますが、リスクによって夜も眠れない状態になっています。Aporiaは、すべての組織が、AIの責任ある利用を保証するために求めるソリューションになると位置付けられます」。

画像クレジット:Aporia

原文へ

(文:Frederic Lardinois、翻訳:Hirokazu Kusakabe)

製造業の研究開発・生産技術領域での課題解決をAI・機械学習で支援するSUPWATが1.5億円調達

製造業の研究開発・生産技術領域においてAI・機械学習などを活用し研究開発現場の課題解決に向けた事業を展開するSUPWAT(スプワット)は、2月24日、シードラウンドで総額約1億5000万円の資金調達を行った。引受先はScrum Ventures、DEEPCOREとなる。

現在、SUPWATは製造業への深い知見を活用しながら、製造領域に対して機械学習などの技術を適用する「メカニカル・インフォマティクス技術」で研究開発現場の課題解決に向けた事業を展開。製造業の研究開発領域において誰でも簡単に定量的な判断ができるようになるサービスであるAIや機械学習を活用したSaaS型プラットフォーム「WALL」などを提供している。さらに同社は、受託研究開発としてNEDO/東京大学生産技術研究所と共同で「水素タンク」最適設計の研究にも採択され、、機械学習・AI技術を用いた最適設計技術を提供している。

調達した資金で、既存のサプライチェーンマネジメントの概念を変え、SUPWATが掲げるビジョンである「知的製造業の時代を創る」のために、エンジニアを中心とした採用を強化していくとのこと。

また、今回の発表に合わせてコンピュータービジョン・機械学習の応用研究やプロダクト開発、組織マネジメント、技術ブランディングなどを行うABEJAの共同創業者でCTOを務めた緒方貴紀氏が、SUPWATの技術顧問に就任する。

スクラムベンチャーズのプリンシパル黒田健介氏はリリースで「研究開発の現場では日々、担当者の勘と経験をもとにした仮説構築、それに基づいたマニュアルでの実験作業、実験データのCSVでのローカル管理・分析が行われており、クラウドや機械学習等 を用いた高度化・効率化の余地がいまだに大きく残されています。【略】高い技術力と現場への深い理解を併せ持つSUPWAT創業チームに、緒方さんという心強い味方も加わり、日本が誇る製造業という巨大産業のアップデートに挑みます」と述べている。

SeMI TechnologiesのAI検索エンジンはデータを照会する新しい方法を提供する

ベルリンで開催されたGraphQLミーティングでデモをを行うSeMi Technologies CEOのボブ・ファン・ラウト氏(画像クレジット:SeMi Technologies)

企業は大量の非構造化データを保有しているが、そのデータから多くのことを得ることはできていない。

例えば、保有しているデータに対して「ABC社が当社と初めて契約したのはいつ?」とか「青い空が映っているビデオを探して」といった質問を、実際にできるようになることを想像してみて欲しい。

それこそが、SeMI Technologies(セミ・テクノロジーズ)が開発しているベクター検索エンジンWeaviate(ウィビエイト)だ。SeMIの共同創業者でCEOのBob van Luijt(ボブ・ファン・ラウト)氏によれば、それはエンベッディングとも呼ばれる、ベクトルを出力する機械学習モデルを用いたユニークなタイプのAIファーストデータベースであり、それゆえにベクトル検索エンジンと名付けられたのだという。

彼によれば、ベクトル検索エンジンは新しいものではなく、ベクトル検索エンジンの上に構築されたソリューションの例としてGoogle Search(グーグルサーチ)があることを説明した。しかし、SeMIはこの技術のコモディティ化を目標としており、誰でも使えるようにオープンソースのビジネスモデルを採用している。

ファン・ラウト氏は2021年、私の同僚であるAlex Wilhelm(アレックス・ビルヘルム)記者に、2021年のTechcrunchの記事に対して質問応答を行えるセマンティック検索エンジンを示しながら、その技術の詳細を紹介している。

関連記事:ビッグニュースに関するささやかなメモ

「誰もがこの技術を使うことができますし、それを必要とする企業のためのツールやサービスも用意しています」とファン・ラウト氏は付け加えた。「私たちは実際のモデルを作成したり配布したりはしません。それはHuggingface(ハギングフェイス)やOpenAI(オープンAI)のような企業が行っていることですし、企業自身がモデルを作成していることもあります。しかし、モデルを持っていることと、検索やレコメンデーションシステムを実際に稼働させるためにそれらを使うことは別のことです。Weaviateが解決するのはまさにその部分なのです」。

2019年にCTOのEtienne Dilocker(エティエンヌ・ディロッカー)氏ならびにCOOのMicha Verhagen(マイカ・バーハゲン)氏とともに会社を創業して以来、ファン・ラウト氏は、SeMIの技術がKeenious(キーニアス)やZencastr(ゼンキャスター)のようなスタートアップを含む100以上のユースケースに影響を与え、ベクトル検索エンジンが与える新しい可能性に基づいて新しいビジネスを創造し、Weaviateによって提供された結果がたとえば医療分野で人々を直接助ける場面で利用されているのを眺めてきた。

ファン・ラウト氏が個人的に気に入っているのは、より「難解」なものだ。例えばヒトゲノムをベクトル化して検索したり、全世界をベクトルでマッピングしたり、Weaviateを使って簡単に検索できるいわゆるグラフエンベディングと呼ばれるものだ。Meta Researches(メタ・リサーチ)のグラフエンベディング上にSeMIが作成したデモがその例だ。

SeMIは、2020年8月にZetta Venture PartnersとING Venturesから120万ドル(約1億4000万円)のシード資金を調達し、それ以降VCの目に留まるようになった。以来、同社のソフトウェアは75万回近くダウンロードされており、その数は毎月約30%増加している。ファン・ラウト氏は、同社の成長指標の具体的な内容については言及しなかったが、ダウンロード数は企業向けライセンスやマネージドサービスの売上と相関関係があると述べている。また、Weaviateの利用者が急増し、付加価値が理解されたことで、すべての成長指標が上昇し、シード資金を使い果たすことになった。

だがシード資金はなくなったものの、会社は新たな資金調達には積極的ではなかった。しかし、SeMIの共同創業者たちが、元Datarobotの創業者たちが設立したCortical Venturesや、New Enterprise Associates(NEA)と会談をした際に、両社が自分たちの事業をどのように支援できるかを示してくれたのだとファン・ラウト氏はいう。

「まさに『ふいを突いてびっくりさせる』ような凄さでした」と彼は付け加えた。「過去に彼らが行ってきたこと、そして私たちをサポートしてくれているチームは、まさに私たちが求めていたもので、私にとっては初めての経験ではありますが、すべての驚くべき話が真実であると言えます」。

そうした会談の結果、NEAとCorticalがともに主導したシリーズAにつながり、このたび1600万ドル(約18億4000万円)の新規資金が調達された。

SeMIは今回の資金をアメリカとヨーロッパの人材採用に投入し、Weaviateとベクトル検索全般のためにオープンソースのコミュニティを強化しようとしている。また、オープンソースのコアを中心とした市場進出戦略や製品への取り組みを強化するとともに、機械学習がコンピュータサイエンスと重なる部分の研究にも第一歩を踏み出す。

一方、ファン・ラウト氏は、データベース技術の次の波を見ている。彼はデータベース技術はOracle(オラクル)やMicrosoft(マイクロソフト)のような大成功をもたらしたSQLの波から始まり、MongoDB(モンゴDB)やRedis(レディス)のような成功を収めた非SQLデータベースが第2の波だったと考えている。

「私たちは今、新世代のデータベース、つまりAIファーストのデータベースの入り口に立っています。Weaviateはその一例です」と付け加えた。「Weaviateだけでなく、ベクトル検索データベース、あるいはAIファーストのデータベースを市場を啓蒙していく必要があります。機械学習が新たにもたらすすばらしい可能性に、興奮を押さえられません。例えば何百万、いや何十億ものドキュメントに対して自然言語で質問してデータベースに答えさせたり、何百万もの写真やビデオに含まれている内容を『理解』させたりするのです」。

原文へ

(文:Christine Hall、翻訳:sako)

理化学研究所、機械学習・最適制御技術により人の動作意図を推定し運動を精度よく支援する装着型アシストロボット

理化学研究所、機械学習・最適制御技術により人の動作意図を推定し運動を精度よく支援する装着型アシストロボット

開発した装着型アシストロボット(黒の部分)をマネキンの両足に装着

理化学研究所情報統合本部ガーディアンロボットプロジェクト人間機械協調研究チーム(古川淳一朗氏、森本淳氏)は2月15日、膝の関節に装着する軽量な「装着型アシストロボット」を開発した。機械学習により装着者の動作の意図を推定して、適切な運動支援を行うというものだ。

カーボン樹脂のフレームに空気圧人工筋アクチュエーターを内蔵した、片足わずか810gという軽量なアシストロボットだが、装着者の意図を推定することにより、様々な身体の動きに対応して、適切に目的の動作だけを支援できるようになっている。例えば、椅子に座った状態から立ち上がる場合、従来の方法でも立ち上がる動作を支援できたが、腰を浮かして遠くのものを取ろうとしたり、座り直したりといった「紛らわしい」動作の場合も、立ち上がりと判断して作動してしまう可能性がある。そこで理化学研究所は、様々な動きの中から、いくつかの動きだけを選択して支援するアルゴリズムを提案した。

機械学習では、学習の手本となるラベルを使う。たとえば、立ち座り動作のみを支援するロボットの場合は、座った状態のラベルと、立ち上がろうとして体幹が傾き始め、ロボットの支援が必要になる状態に「立位動作」とラベルを付けて学習させればよい。ただし、これでは「紛らわしい」動作のときもロボットが作動してしまう恐れがある。それを避けるには、あらゆる動作に正確なラベル付けをしなければならないが、それは不可能だ。できるだけ少ないラベルで正確な推定を行う必要がある。

理化学研究所は、立ち上がりの動作にのみラベルを付け、その他の動作にはラベルを付けずに学習させる方法をとった。そして、機械学習を使い、筋活動と関節運動のセンサー信号から支援対象の動作意図を精度よく推定する技術と、対象動作に対して個人に合わせた適切な量で支援する制御の法則(制御則)を導き出す「最適制御技術」を組み合わせて、提案アルゴリズムを実現させた。

理化学研究所、機械学習・最適制御技術により人の動作意図を推定し運動を精度よく支援する装着型アシストロボット

装着者の動作意図を推定し適切な運動を支援するアルゴリズムの概要。PU-ラーニング(Positive and Unlabeled learning)で構築された動作分類(PU-分類器)から適切な制御戦略を選択する。支援対象の動作に関しては、最適制御技術iLQG(iterative Linear-Quadratic-Gaussian)を用いて制御戦略を算出する。装着者の動作意図がポジティブと推定された場合は、支援対象動作に対する「πtarget」でロボットを空気弁コントローラーにより駆動させる。ポジティブではないと推定された場合は、装着者の動きを妨げないようにロボットの重さを常に打ち消す「πother」で駆動させる

数名の被験者の協力で、このシステムの動作支援実験を行った。支援対象をイスからの「立ち上がり」とし、その他「脚を組む」「少し離れた物を手を伸ばして取る」「座り直す」という動作を想定し、ロボットの装着者から取得した筋活動と関節角度のデータに基づき、提案アルゴリズムでロボットを駆動させた。その結果、立ち上がりには100%の確率で支援動作の制御則が選択され、その他の動作では83.4%の確率で支援対象以外の制御則が選択された。

また、ロボットが装着者の動作を妨げたかを、ロボットの軌道と本来の関節の軌道との誤差で比較したところ、従来手法に比べて提案方法では誤差が小さいこともわかった。これらの結果から、理化学研究所が提案した手法は「精度よく装着者の動作意図を推定」していることがわかったとのことだ。このアルゴリズムを使えば、「一部のデータに対してだけ分類情報が整理されている状況」でも適切に運動を支援できるため、ウェアラブルセンサーが普及して多様な運動データが収集できるようになれば、ロボットによるさらなる支援技術に貢献できると理化学研究所は話している。

機械学習でイノシシの出没確率を予測、森林総研と岩手県立大学が岩手県におけるイノシシ出没ハザードマップを作成

機械学習でイノシシの出没を予測、森林研究・整備機構森林総合研究所と岩手県立大学がイノシシ出没ハザードマップを作成

2017年~2019年の出没データを用いて作成したイノシシの出没予測図。この図をハザードマップとして用いることが可能。図中の細線は市町村界を示す

森林研究・整備機構森林総合研究所(⼤⻄尚樹氏)と岩手県立大学(今⽥⽇菜⼦氏、⼀ノ澤友⾹氏)の研究グループは2月15日、岩手県で分布域を拡大しているイノシシの出没を機械学習で予測するハザードマップを作成したと発表した。この手法は地域を限定しないため、他の地域にも応用が可能だという。

研究グループは、2007年以降の岩手県内のイノシシの出没データ(目撃・被害・捕獲情報をまとめたもの)を基に、種の分布モデル(種の分布を推定する手法)を用いた機械学習法により、出没予測図を製作した。また予測には、標高、植生、土地利用、人口、年間最大積雪深の5つの環境データ(国⼟地理院や政府が公開しているオープンデータを採用)を用いたが、このすべてを組み合わせて予測図を作ったところ、標高、植生、土地利用の3つを用いた場合がもっとも信頼度の高い予測図となった。

そして、最初の目撃例からの拡大期にあたる2007年から2017年の出没データを用いた予測図と、拡大を終え定着期に入り大きく出没件数が増えた2018年から2019年の出没データを用いた予測図とを比較したところ、予測確率が高い地域ほど出没が多いことがわかった。つまり、データ量が多いほど予測確率は高くなるということで、2019年までの全データを用いた出没予想図は、今後のイノシシ出没ハザードマップとして活用できるという。

岩手県内のイノシシの分布拡大の変遷。図中の□は5kmメッシュを示し、メッシュごとの目撃件数を色分けした

岩手県内のイノシシの分布拡大の変遷。図中の□は5kmメッシュを示し、メッシュごとの目撃件数を色分けした

2007年~2017年の出没データから作成した出没予測図に、2018年~2019年に実際に出没した5kmメッシュ(□)を重ねたもの

2007年~2017年の出没データから作成した出没予測図に、2018年~2019年に実際に出没した5kmメッシュ(□)を重ねたもの

この手法は地域を限定しないため、東北以外のイノシシの分布が拡大している地域でも、これを使って独自のハザードマップを作ることが可能だ。また、シカ、サル、クマなどの他の哺乳類にも応用が期待できるという。ただし、これはあくまで目撃や被害をもとにした「出没確率」であって、「生息確率」ではないため、人が関与しない場所で生息している可能性もあるとのことだ。

東京大学と農研機構が作物の品種改良を行う育種家の感性を解明、柑橘類の皮の剥きやすさと実の硬さを深層学習で定量化

Pythonを用いることで、カンキツの果実断面の画像から、果実のさまざまな形態的特徴を定量的かつ自動的に評価する技術を開発

Pythonを用いることで、カンキツの果実断面の画像から、果実のさまざまな形態的特徴を定量的かつ自動的に評価する技術を開発

東京大学農研機構は2月10日、育種家(作物の品種改良を行う人)が独自の感性でもって評価してきた柑橘類の剥皮性(皮の剥きやすさ)と果実の硬度を、AIによる画像解析などにより定量化することに成功したと発表した。これにより、効率的な品種改良が可能になるという。

東京大学大学院農学生命科学研究科(南川舞氏・日本学術振興会 特別研究員、岩田洋佳 准教授)と農研機構(野中圭介氏、浜田宏子氏、清水徳朗氏)からなる研究グループは、柑橘類の果実の剥皮性と硬度を、果実断面のAIの深層学習を用いた画像解析などから、自動的に、定量的に評価する技術を開発した。そうした評価は、これまで育種家の感性に頼ってきたものであり、何を持って評価を行っているかは当事者にしかわからない「ブラックボックス」状態だった。

育種家の感性による達観的評価の方法

育種家の感性による達観的評価の方法

深層学習による剥皮の難易もしくは果実の硬軟の分類と、分類に寄与した特徴の可視化

深層学習による剥皮の難易もしくは果実の硬軟の分類と、分類に寄与した特徴の可視化

柑橘類の果実は、外皮(フラベド)、中果皮(アルベド)、じょうのう(袋)、果肉、種子、果芯(中心部)で構成されている。その断面画像を解析したところ、果芯の崩壊(空間ができること)が進んだ果実ほど皮が剥きやすく実が柔らかいという関係性がわかった。このほか、種子の面積と硬度の関係、アルベドの崩壊の状態も剥きやすさと柔らかさに寄与することもわかった。こうした関係性の推定には、変数間の因果関係を推定するベイジアンネットワークが用いられている。

ベイジアンネットワークにより推定された、カンキツ果実の形態的な特徴と剥皮性・果実硬度との関係

ベイジアンネットワークにより推定された、カンキツ果実の形態的な特徴と剥皮性・果実硬度との関係

この技術により果実の形態的な特徴のデータを自動的に大量に収集できるようになれば、ゲノム情報を活用した効率的な品種改良が可能となる。また、「果芯の崩壊程度や種子面積を改良することで、望ましい剥皮性や果実硬度を有する新品種」の開発も可能になるという。今後は、剥皮性と果実硬度の総合的な遺伝システムの解明を目指すとのことだ。

韓国のスタートアップAtommerce、約19.4億円の資金調達でメンタルヘルスサービスを拡大させる

モバイルアプリ「MiNDCAFE」を通じてユーザーがメンタルヘルス専門家とつながることを支援する韓国のスタートアップ、Atommerce(アトマース)は、2カ月で3倍の応募超過となった1670万ドル(約19億3600万円)のシリーズBで、メンタルヘルスのサービスを拡大する計画だ。

今回の資金調達で、Atommerceはプラットフォームの人工知能と機械学習技術を強化し、精神疾患に特化したデジタル治療に投資する予定だ。また、調達資金は人員増強にも充てられる。

ソウルを拠点とするこのスタートアップは、バーチャル・セラピー・プログラムと雇用者向けメンタルヘルス・ベネフィット・ソリューションを提供している。AtommerceのCEOであるKyu-Tae Kim(ギュテ・キム)氏はTechCrunchに対し、Atommerceは人間の専門家と同じようにセラピーができるAIチャットボットサービスを加えることで、患者、人間の専門家、精神疾患に対応するために人工知能が相互に作用するエコシステムを構築したいと考えていると語った。12月に発売された同社のAIチャットボット「RONI」は、推奨される回答を提供することで人間の専門家をサポートすると、キム氏は述べた。

Atommerceは、韓国で100万人以上のアプリユーザーと、Naver(ネイバー)、NHN、新韓インベストメント、Neowiz(ネオウィズ)、ソウル市役所など100社の企業を顧客として主張している。現在、MiNDCAFEの従業員支援プログラム(EAP)を通じて、B2Bクライアントの約20万人の従業員がアプリを利用している。同社は、250人以上のメンタルヘルス専門家を抱えているという。

新型コロナウイルスのパンデミックは、同社の成長を加速させた。例えば、2021年第1四半期の同社の売上高は、2020年第1四半期と比較して約1200%伸びた。また、過去2年間は年平均400%増の売上を記録しているという。

このスタートアップは、米国留学中にセラピーを受けてうつ病を克服したキム氏が、2015年に創業した。韓国に帰国したキム氏は、米国とは異なり、社会的なスティグマからメンタルヘルスの専門家の助けを得ることが難しいことを実感し、MiNDCAFEを立ち上げることを決意した。

韓国は、精神衛生問題を含むさまざまな要因でOECD諸国の中で最も自殺率の高い国となっているが、精神的な問題に対するスティグマから、人々は専門家に相談することをためらっていたと、キム氏はいう。しかし、ここ数年で変わってきた。現在、そのユーザーのほとんどは、国内のミレニアル世代とZ世代の成人女性であるとキム氏は付け加えた。

Atommerceは2022年前半に日本への進出を予定しており、早ければ年末に北米への浸透を目指す。同社のサービスは、言語やUX・UIなどのユーザーインターフェースデザインを完全にローカライズする予定だと、キム氏はTechCrunchに語った。また、次の資金調達計画について尋ねたところ、2023年第1四半期にシリーズCの調達を検討しているとのことだ。

画像クレジット:MiNDCAFE app

今回のラウンドで、同社の資金調達総額は約2600万ドル(約30億1400万円)に達した。シリーズBは、Hashed(ハッシュド)が主導し、E&Investment(E&Iインベストメンと)、K2 Investment(K2インベストメント)、Samsung Next(サムスンネクスト)が参加した。既存の出資者であるInsight Equity Partners(インサイト・エクイティ・パートナーズ)と韓国の製薬会社GC Green Cross Holdings(GCグリーンクロスホールディングス)もこのラウンドに参加した。

キム氏は声明の中で、今回の投資により、テクノロジーによって人々のメンタルヘルスを支援するという使命を持つMiNDCAFEが成長を加速させることができると述べている。さらに、Atommerceはメンタルケアエコシステムへのアクセスを向上させる。

画像クレジット:Carol Yepes / Getty Images

原文へ

(文:Kate Park、翻訳:Yuta Kaminishi)

コンピュータービジョンでレストランのオーダーエラーを解消するAgot AI

Agot AIの共同創業者エヴァン・デサントラ氏とアレックス・リッツエンバーガー氏(画像クレジット:Agot AI)

人工知能はいろいろな業界に浸透してきたが、レストランはその中でも後発となり、その主な導入動機はパンデミックとオンラインオーダーの導入となる。

レストランのAI導入は今後も増えるだろう。2021年には米国人の60%が週に1度以上テイクアウトまたはデリバリーを注文し、31%がデリバリーサービスを利用したMarket Study Reportの予想によると、世界のレストラン管理ソフトウェアの市場は年率25%で伸び、2025年には69億5000万ドル(約8034億円)に達する

しかしながら私たちはみな、フードデリバリーが持ってきたものが注文と違うという経験をしている。そこでAgot AIは、機械学習を利用するコンピュータービジョンの技術を開発し、最初はファストフード業界を対象にして、そのようなエラーが起きないようにした。

同社は3年前にEvan DeSantola(エヴァン・デサントラ)氏とAlex Litzenberger(アレックス・リッツエンバーガー)氏が創業し、レストランテクノロジーのオペレーションの側面や、従業員の成功報酬、レストランの顧客満足度の向上などの問題解決を目指した。

画像クレジット:Agot AI

同社のプロダクトは、オンラインからのオーダーに対する正しさをリアルタイムで確認し、修正が必要なら従業員に告げる。たとえば彼らは、チーズとケチャップを加えるのを忘れていたかもしれない。

同社はその技術を発表して以来、Yum! Brandsなどの大手サービスの協力のもとに、展開を進めてきた。Yumの場合、Agotは同社とのパートナーシップにより、その20のレストランでパイロット事業を行った。パイロットの結果が良ければ、Yumの100のレストランで実装する、とAgotのCEOデサントラ氏はいう。

Yum! BrandsのチーフストラテジーオフィサーであるGavin Felder(ギャビン・フェルダー)氏は声明で次のように述べている。「同社は常に、テクノロジーを利用する革新的な方法でチームのメンバーの能力を高め、私たちのレストランにおいて彼らと顧客の両方の体験を向上させようとしてきた」。そしてパイロット事業の初期的な結果は「私たちが料理を届けているすべてのチャンネルで、顧客にオーダーに忠実で正確なメニューを届けることができるという将来的に有望な可能性を示唆している」。

Yum! Brandsは、Agotの顧客であるだけでなく投資家でもある。以前の1200万ドル(約13億9000万円)のラウンドでは、Continental Grain Co.の戦略的投資部門であるConti VenturesやKitchen Fund、そしてGrit Venturesらとともに投資に参加した。これでAgotの総調達額は1600万ドル(約18億5000万円)に達した。

Agotは新たな資金を、技術チームの拡大と、その他のファストフードブランドとのパイロット事業、およびプロダクトの機能拡張に充てたいとしている。また、機能拡張により、デリバリーだけでなく、ドライブスルーや店内での顧客体験も改善していきたい。

同社は、小規模な概念実証レベルの展開で、オペレーションの能力を示してきたため、今後はより大きな市場とオーディエンスにその技術をスケールしたいという。

Agotは成長率などを明かさないが、同社のチーフビジネスオフィサーのMike Regan(マイク・リーガン)氏によると、彼がデサントラ氏と出会ったとき、彼自身は投資家だったが、オーダーの正確さチェックが今後大きなビジネスになることをすぐに理解し、またAgotがそれに対して総合的な視野で臨んでいることを知った。「それはまさにデジタルトランスフォーメーションそのものだった」とリーガン氏は言っている。

Toastのようなレストラン管理のパイオニアや、その他のスタートアップも、2年前ほど前からこのニーズに対応するようになり、それぞれ独自のアプローチを採っているだけでなく、ベンチャー資本も獲得している。

たとえば最近の数カ月ではLunchboxDeliverectOrdaZakSunday、そしてMargin Edgeなどが新たなラウンドを発表し、レストランを新しいオーダー方式に適応させていくことに向けて大金が流れ始めたことを示唆している。

リーガン氏によると、レストラン業界の現状は「厳しい」けれども、Agotは「社歴3年のスタートアップよりもずっと先を行っている」やめ、事業の成功という点でも、また今後の2年間で大多数のファストフード企業を顧客にしていける能力でも傑出しているという。

そしてデサントラ氏は「新たな資本がAgotを次のレベルのビジネスに押し上げる」と感じている。

「初期のパイロットでは成功を証明したし、現在および将来のパートナーを相手にスケールしていけることにもエキサイトしています。新たな資金はプロダクトの機能拡張と、顧客とそのオペレーションの分析、そしてドライブスルー向けの技術開発に充てたい」とデサントラ氏はいう。

原文へ

(文:Christine Hall、翻訳:Hiroshi Iwatani)

秘密計算エンジン「QuickMPC」の分析機能群に「勾配ブースティング決定木」を追加、秘密計算の活用の幅が拡大

Acompanyが秘密計算エンジンQuickMPCの分析機能群に「勾配ブースティング決定木」追加、秘密計算活用の幅が拡大

秘密計算(sMPC)システムの開発と提供を行うAcompany(アカンパニー)は2月8日、同社独自の秘密計算エンジン「QuickMPC」に実装されている分析機能群「Privacy AI」に、機械学習を追加することに成功したと発表した。これにより、QuickMPCで構築されたセキュアな環境で機械学習を利用できるようになり、秘密計算の活用の幅が広がるという。

秘密計算とは、暗号化によって保護されたデータを、暗号化されたままで分析できるようにする次世代暗号技術。たとえば、店舗が保有する顧客データの分析を外部業者に依頼する場合、暗号を解除して元のデータに戻すことなく、プライバシーを守りながら分析が行える。これにより、複数組織間でのプライバシーデータを活用した計算・分析を実現できる。

Acompanyでは、その秘密計算を実現するための秘密計算エンジンとしてQuickMPCを開発し提供しており、2021年10月に「線形回帰分析」と「ロジスティック回帰分析」という2つの手法を取り入れた分析機能群「Privacy AI」を追加。それまでは困難だったプライバシー保護化での複雑なデータ分析を実現した。そして今回、新たに「勾配ブースティング決定木(推論)」という機械学習手法が追加した。

勾配ブースティング決定木とは、高精度で汎用性が高い需要予測の一種。マーケティングなどでよく使われる手法で、企業が保有する「勾配ブースティング決定木」の学習済みモデルを秘密計算環境に導入可能となる。つまり、プライバシーデータに対して予測が行えるようになるということだ。これがまさに、「プライバシー保護とデータ活用の両立」というAcompanyの理念に一致する。

Acompanyでは、今後も「Privacy AI」にはさまざまな手法を追加してゆくと話している。

どんどん増える画像や動画に特化したデータベースを開発するApertureDataが約3.5億円のシード資金を調達

Vishakha Gupta(ビシャカ・グプタ)氏と、後に共同創業者になるLuis Remis(ルイス・レミス)氏は2016年にIntel Labsでともに働いていた頃、どんどん増えるビジュアルデータ(画像やビデオ)をどう管理するかを解決する業務を任されていた。2人はこの問題に精力的に取り組み、研究者やデータサイエンティストとも協力して、大量のビジュアルデータに適したインフラの開発を始めた。

結局、画像を扱い、データサイエンティストが利用する要件を満たす新しいデータベースが必要であるとの結論に達した。データサイエンティストは画像データを処理するために複数のシステムを扱う必要があり、これは非効率で時間がかかることがわかった。2人はもっと良い方法があるはずだと考え、Intelにまだ在籍していた2017年に、1カ所であらゆる処理ができるデータベースを構築するためのシステムに取り組み始めた。

2人はこの仕事がスタートアップになる素地を備えていると考え、2018年にIntelを退社してApertureDataという企業を始めた。正式に創業したのは2018年後半で、現在も引き続きこの問題に取り組んでいる。

最終的に開発したソリューションはApertureDBという名前のクラウドアグノスティック(特定のシステムに依存しない)データベースで、画像を処理することに関連するあらゆるデータ(メタデータなど)を1カ所で扱うことに特化して設計され、自動化することで手作業でデータを検討する時間のかかるステップを省くことができる。

グプタ氏は「もし私がデータサイエンティストで、データを見て何が起きているかを把握する立場だとしたら、データの検討に(相当長い)時間を費やさなくてはならないでしょう。(これまでは)このようなタイプのデータやこのようなタイプのユーザーを理解できるデータベースがなかったからです」と説明する。

さらに同氏はこう続ける。「それがこの問題を解決しようとするきっかけになりました。私と共同創業者はIntelにいたときにこの問題に直面していました。そして自分たちのためにこの問題を解決するのであれば、このインフラを構築している間にどうすればもっと多くの人のためにこの問題を解決できるかを探ろうと考えました。その結果としてApertureDataを創業し、ApertureDBをプロダクトとして提供することになりました」。

同社の従業員数は現在8人で、2022年末までに15〜20人にすることを目指している。グプタ氏は、女性創業者として多様性のあるチームを構築することの重要性を、そして2人の子を持つ母としてワークライフバランスの重要性も強く認識している。

同氏は「スタートアップで働くなら私的な部分は犠牲にしなくてはいけないというシリコンバレーの古い考え方があることをご存じでしょう。(私たちの考えでは)実はバランスをとることもできるし、多様性も実現できます。最初から多様であることが重要です」と述べた。

米国時間2月8日、ApertureDataはプロダクト開発を継続するための300万ドル(約3億4500万円)のシード資金調達を発表した。このラウンドを主導したのはRoot Venturesで、他にWork-Bench、2048 VC、Graph Ventures、Alumni Ventures Group、Magic Fundと、業界のエンジェルも参加した。

このラウンドがクローズしたのは2021年10月だった。それ以前は、全米科学財団の助成金、友人や家族からの資金、そして昔ながらのブートストラップでプロダクトを開発していた。

画像クレジット:Dimitri Otis / Getty Images

原文へ

(文:Ron Miller、翻訳:Kaori Koyama)