フェイスブックが自動モデレーション機能などのグループ管理者向け新ツール発表

Facebook(フェイスブック)は米国時間6月17日、プラットフォーム上のコミュニティを適切に管理し、意見が対立して荒れるなどの状況を防ぐことを目的としたグループ管理者向けの新しいツールを発表した。特に興味深いツールは、機械学習を利用して、グループ内で不健全な会話が発生している可能性を管理者に警告する機能である。管理者がグループメンバーの投稿の頻度を制限して、白熱した会話のペースを落とす機能もある。

Facebookグループを利用するためにFacebookのアカウントを持ち続けるユーザーも多い。同社によると、現在、数千万のグループが存在し、世界中で7000万人以上のアクティブな管理者とモデレーターによって管理されているという。

Facebookは長年にわたり、グループオーナーのためのより優れたツールの導入に取り組んできた。大規模なオンラインコミュニティの運営には大き過ぎる管理責任がともなう。それに疲弊した管理者が仕事を放棄し、グループが管理されないまま放置され、誤った情報やスパム、不正行為の温床となってしまうことも多い。

2020年秋、Facebookはこのような問題に対処するために新しいグループポリシーを導入し、アクティブな管理者のいないグループを取り締まるなどの対策を講じた。同社はもちろん、グループの運営を簡単にできるようにして、グループが存続し、成長し続けることを維持したいと考えている。

米国時間6月17日、満を持して新機能が登場した。

新しいダッシュボード「管理者ホーム」には、管理者ツール、設定、機能が集約され、グループのニーズに合わせて役に立つツールを提案するヒントが表示される。

画像クレジット:Facebook

もう1つの新機能「管理者アシスト」では、グループ内のコメントを自動的に調整することができる。グループ内で議論が白熱した際に、事後的にコメントや投稿を削除すると、問題が生じる可能性がある。「管理者アシスト」機能を使うと、管理者は(事後的ではなく)より積極的にコメントや投稿を制限することができる。

管理者は「管理者アシスト」機能を使って、Facebookアカウントを取得してから間もないユーザーや、最近グループのルールに違反したユーザーの投稿を制限することができる。特定の内容の宣伝(マルチ商法へのリンクなど)を含む投稿を自動的に拒否し、その投稿が拒否された理由を投稿者に自動的にフィードバックすることも可能だ。

管理者は、Facebookが推奨する条件を利用して、スパムを制限したり、対立を管理したりすることもできる。

画像クレジット:Facebook

注目すべきアップデートは「対立の可能性のアラート」という、新しいタイプのモデレーションアラートだ。Facebookによると、この機能は現在テスト中で、グループ内で論争や不健全な会話が行われている可能性がある場合に管理者に通知する機能である。管理者はこのアラートを見て、コメントを消す、コメントできるユーザーを制限する、投稿を削除するなど、状況に応じて迅速に対応することができる。

「対立の可能性のアラート」は機械学習を利用している、とFacebookは説明する。機械学習モデルは、返信時間やコメントのサイズなどの複数のシグナルを見て、ユーザー間の相互作用がマイナスな方向に進行していないか、あるいは進行する可能性があるかどうかを判断するという。

これは、現在多くの管理者が使用しているキーワードアラート機能を自動化、拡張した機能で、言い争いになりそうなトピックを探すことができる。

画像クレジット:Facebook

これに関連した新機能では、管理者は、特定のメンバーによるコメントの頻度を制限したり、指定した投稿へのコメントの頻度を制限したりすることもできるようになる。

この機能を有効にすると、メンバーのコメントは5分に1回に制限される。根底にあるのは、議論が白熱する中、ユーザーにいったん立ち止まって自分の発言を考えてもらうことで、より文化的な会話につなげるというアイデアである。この考え方は、他のソーシャルネットワークでも採用されている。例えばTwitterは、リツイートする前に記事を読むように促したり有害である可能性のある返信にプロンプトを表示して、投稿を再確認するように呼びかけたりしている。

関連記事
Twitterが脊髄反射リツイートに警告を発する機能をテスト中
Twitterが有害なツイートを減らすため「返信の警告」機能の改良版を公開

画像クレジット:Facebook

その一方で、Facebookは、たとえそれがポジティブなやり取りや体験につながらない場合でも、プラットフォーム上でのコミュニケーションを幅広く受け入れてきた。今回の機能は大掛かりなものではないが、健全なオンラインコミュニティを構築するためには、頭に浮かんだことをすぐに書き込んだりコメントしたりできないようにする必要もある、とFacebookが認めたことを意味する。

Facebookは、管理者が特定のグループメンバーの活動を一時的に制限できるようにするツールもテスト中である。

管理者はこのツールを使って、特定のメンバーが1日に共有できる投稿数(1~9件)と、制限を有効にする期間(12時間、24時間、3日、7日、14日、28日)を設定したり、特定のメンバーが1時間あたりに共有できるコメント数(1~30件、5件単位)と、制限期間(12時間、24時間、3日、7日、14日、28日)を設定したりすることができる。

また、より健全なコミュニティの構築に向けて「メンバーの概要」という新機能で各メンバーのグループでの活動状況を把握したり、投稿数やコメント数、投稿の削除やミュートの回数などを確認したりすることも可能になる。

画像クレジット:Facebook

Facebookは、これらの新しいツールの活用法については言及していないが、管理者が詳細な「メンバーの概要」を利用して散発的にメンバーベースのクリーンアップを行い、議論を妨害してばかりいる悪質なユーザーを排除する、といったユースケースなどが考えられる。このツールで、グループの活動に貢献している無違反のユーザーを見つけてモデレーターに昇格させることもできるだろう。

さらに、管理者は、コメントと投稿にグループルールをタグ付けしたり、特定の投稿タイプ(アンケートやイベントなど)を禁止したり、グループの違反に関連する決定を再調査するようFacebookに「異議申し立て」したりすることができるようになる。

画像クレジット:Facebook

ここまでのニュースに埋もれてしまった感があるが、以前発表された「チャット」の復活も興味深い。

2019年、Facebookは突然チャット機能を削除した。(Facebookは製品インフラの問題であるとしたものの、)おそらくスパムが原因ではないかと一部で推測されている。以前と同様、チャットには、アクティブメンバーと、チャットからの通知をオプトインしたユーザーを含めて、最大250人が参加できる。上限に達すると、チャットのアクティブメンバーが退出するか、誰かが通知を停止するまで、他のメンバーはそのチャットルームに参加することができない。

Facebookグループのメンバーは、Messengerを使用するのではなく、Facebookグループ内で他のメンバーとのチャットを開始したり、チャットを検索して参加したりすることができる。管理者やモデレーターも同様だ。

今回の変更が、評価額が11億7000万ドル(約1290億円)の新しいユニコーン企業であるIRL(アイアールエル)のようなメッセージングベースのソーシャルネットワークの他、Telegram(テレグラム)やSignal(シグナル)などのメッセージングアプリ、さらに非主流のソーシャルネットワークの成長を後追いしている、という点は注目すべきだろう。

関連記事:言論の自由を謳うソーシャルアプリと暗号化メッセンジャーが米議事堂暴動後にダウンロード数急増

画像クレジット:Facebook

以上のようなたくさんの新機能の他にも、Facebookは管理者からのフィードバックに基づいて、いくつかの機能に変更を加えている。

現在、固定されたコメントと、重要なニュースをグループの(グループの通知を受信する設定になっている)メンバーに通知する「管理者からのお知らせ」という新しい投稿タイプがテスト中である。

また、管理者がグループメンバーを除外する際、フィードバックを共有できるようになる予定だ。

画像クレジット:Facebook

これらの変更は、今後数週間のうちに、全世界でFacebookグループ全体に展開される。

関連記事
フェイスブックがネットショッピングに関連する4つの新機能を発表
フェイスブックのVR広告参入は前途多難
オフィス再開に向けて大手テック企業はそれぞれ柔軟なワークモデルを検討中

カテゴリー:ネットサービス
タグ:FacebookSNSチャット機械学習

画像クレジット:Facebook

原文へ

(文:Sarah Perez、翻訳:Dragonfly)

Kayakの共同創業者がポッドキャスト発見アプリ「Moonbeam」をリリース

ポッドキャストのダウンロードは昨年、空前のブームとなった。そしてKayak(カヤック)の共同創業者でテック起業家のPaul English(ポール・イングリッシュ)氏は毎日聴く熱心なリスナーになった。しかしポッドキャストを愛する人は、ポッドキャストを探すのが難しいものであることを知っている。Apple PodcastsやSpotifyのような人気のストリーミングアプリすら使える発見ツールを欠いている。そうしたことから、先週Spotifyがポッドキャスト発見アプリのPodz(ポッズ)を買収したのは、この業界における新しいコンテンツを発見する簡単な方法に対する需要が次第に増している事実を示すものとなった。

イングリッシュ氏は6月24日、パーソナライズされたレコメンデーションを提示するのに機械学習と人間によるキュレーションをミックスさせたポッドキャスト発見アプリMoonbeamを立ち上げた。ユーザーが好きそうなニュースフィードスタイルのコンテンツストリームを作るという、Podzが提供しているものと似ているように聞こえるかもしれない。しかしMoonbeamは、ポッドキャストホストがMoonbeamで特集する自身の番組のクリップを選べるようにしているクリエイターフレンドリーなプラットフォームを作ることで賭けに出ている。Moonbeamはまた、ファンが番組を気に入った場合、そのクリエイターにチップを送れるようにもしている(Moonbeamは手数料を取らないが、ポッドキャスターが考慮に入れなければならないアプリ内購入手数料はある)。

「Podzは発見のための1つのアプローチですが、多くの人がこの問題に取り組むべきニーズがあると考えています」とイングリッシュ氏はTechCrunchに語った。「MoonbeamがPodzと異なる点は、人間のエディターがいることです」

イングリッシュ氏は、部分的には洗練された発見アルゴリズムのお陰でユビキタスな存在になったTikTokに感化された。エンジニアとして、同氏は楽しみでInstagramやTwitterなどのアプリをよく再設計する。しかしポッドキャスティングに興味を持つようになるにつれ、同氏はTikTokのように機能しつつ新しいポッドキャストを見つけるのを手伝うアプリを作りたくなった。TikTokでいうとFor Youページに相当するBeamセクションでは、長さ数分のクリップをユーザーに提供する。そうしたクリップにどのように反応するかに基づき、アルゴリズムはあなたがどういう種のポッドキャストを視聴したいかを学習する。

「機械学習はあなたの友人よりもあなたにうってつけのコンテンツを探すことができます。あなたが持っているのと同じような面白いユーモアのセンスを持っている人をドイツで発見するかもしれません。あなたの最も親しい友人とは少し違うかもしれません」とイングリッシュ氏は話した。「機械学習はユーザークラスタリングをします。あなたが好きなものと似たようなものを好むユーザーを見つけると、Moonbeamでそうしたユーザーが聴いている番組を共有できます」

しかしMoonbeamのようなアプリで注意が必要なのは、多くの人がアプリを使うほどに、さらに機能するようになることだ。公正に言うと、アプリは6月24日にリリースされたが、初期段階ではポッドキャストレコメンデーションの多くは比較的よく知られた番組から選ばれる。しかしすでに多くのポッドキャストがあることから(全ての番組がNPRによって制作されているわけではない!)、問題は「This American Life」を発見することではないということだ。大手制作スタジオのサポートがなければポッドキャスト業界で試みようとしないような新出のクリエイターを探している。クチコミにより一晩でセンセーションを起こすことが十分可能であり、これはクリエイターにとってTikTokを価値あるものにしている要素だ。ポッドキャスター向けに同じような価値を生み出すアプリがあったらどうだろう?

Moonbeamは2週間ごとにソフトウェアをアップデートする計画だ。アップデートではリスナーがお気に入りのポッドキャストを制作したチームとやり取りできるようにする一連のツールを導入する見込みだ。こうした機能の最初のものとなるチップはすでにアプリに導入されている。間もなく、ファンとポッドキャスターはMoonbeamでシェアするために自前のクリップを作ることができるようになる。Moonbeamのウェブサイトに誘導するポッドキャストのホストは現在、自身の番組を宣伝し、そのクリップを作ることができる。Headlinerのようなアプリよりもナビゲートするのはややスムーズではないが、機能的だ。

「リスナーとホストの間にかなりのツールを追加するつもりです」とイングリッシュ氏は話した。「関係構築はとても重要です。我々はそれを直接プレイヤーの中でしたいと考えています。Facebookや他のサイトに行く必要はないようにしたいのです」

Moonbeamではアプリでエピソード全てを聴いたり、特定の番組を検索したりできるため(たとえBeamに表示されなくても)ポッドキャッチャーとしても機能するが、ポッドキャッチャーはたくさんある一方で発見アプリはそうではない。Moonbeamがそうした状況を変えることを期待したい。

カテゴリー:
タグ:

画像クレジット: Moonbeam

[原文へ]

(文:Amanda Silberling、翻訳:Nariko Mizoguchi

パーソナライズされた栄養改善アドバイスを提供するZoe、ビッグデータと機械学習で食品に対する身体の反応を予測

パーソナライズドニュートリション(パーソナライズされた栄養改善アドバイス)のスタートアップ企業Zoe(ゾーイ)がシリーズBラウンドで2000万ドル(約22億円)を調達し、累計調達額が5300万ドル(約58億円)に達した。ちなみに、社名の由来は人名ではなく「生命」を意味するギリシャ語の言葉だ。

今回クローズしたシリーズBラウンドをリードしたのは、2人のノーベル賞受賞者をサイエンスパートナーに擁するとZoeが述べているAhren Innovation Capital(アーレン・イノベーション・キャピタル)だ。加えて、元アメリカンフットボールプレイヤーのEli Manning (イーライ・マニング)氏とOsitadimma “Osi” Umenyiora(オシタディマ(オシ)・ウメニーラ)氏の2人の他、米国ボストンを拠点とするシードファンドのAccomplice(アコンプリス)、ヘルスケアに特化したベンチャーキャピタル企業のTHVC、アーリーステージのスタートアップを支援する欧州系VCのDaphni(ダフニ)が参加した。

Zoeは英国と米国を拠点として2017年に創業したスタートアップなのだが、最初の3年間は自社のサービスや製品について外部に公表せずに活動し、その間、マサチューセッツ総合病院、スタンフォード大学医学部、ハーバード大学 T.H.チャン公衆衛生大学院、ロンドン大学キングス・カレッジの科学者と協力してマイクロバイオームの研究を進めてきた。

創業者の1人は、食をテーマにしたサイエンス系の人気書籍を多数執筆しているキングス・カレッジのTim Spector(ティム・スペクター)教授だ。人間の健康における遺伝子(自然要因)と栄養(環境・生活要因)の役割の対比など、数十年にわたる双子研究を続けた末、健康全般における(一般的な)食の役割、(特に)マイクロバイオームの役割に興味を抱いたという。

Zoeは、2つの大規模なマイクロバイオーム研究のデータを使って同社の最初のアルゴリズムを開発し、2020年9月にそれを商品化した。同社の商品化第一号として米国市場に投入されたこの製品は家庭用検査キットだ。Zoeの栄養分析プログラムに登録するとこの検査キットが届き、ユーザーは、各種食品に対して自分の身体がどのように反応するのかを理解し、自分だけの栄養改善アドバイスをもらうことができる。

プログラムにかかる費用はおよそ360ドル(約4万円)で、6回の分割払いも可能だ。さまざまな検査を(自分で)行うことが必要だが、このプログラムにより、血中脂質や血糖値、腸内細菌の種類の変化など、代謝や腸内環境に関する情報を収集し、生物学的に分析することができる。

Zoeでは、ビッグデータと機械学習を活用して各種食品に対する身体の反応を予測し、何をどう食べれば腸内環境を改善し、食事による炎症反応を抑えることができるか、個人に合わせたアドバイスを行っている。

さまざまな生物学的反応を組み合わせて分析する手法により、血糖値などの単独の数値に焦点を当てた商品を展開する他のパーソナライズドニュートリションのスタートアップ企業とは一線を画している、とZoeは主張する。

しかし、誤解のないように言っておくと、Zoeの商品化第一号であるこの製品は医薬品として認定されたものではない。同社のFAQにも、特定の疾患に対する医学的診断や治療を行うものではないと明言されている。あくまで「一般的な健康増進のみを目的としたツール」だという。つまり、今のところは、Zoeのアドバイスが実際に役立つことをそのまま信用するしかない。

1つ確実なことは、Zoeの共同創業者がTechCrunchのインタビューで明言しているように、マイクロバイオームの科学研究がまだ始まったばかりということだ。そのため、データとAIの活用により個人に合わせた有用な予測をはじき出そうとするスタートアップによく見られるように、Zoeでも初期の顧客のデータが研究の推進に役立てられていることに留意すべきである。食事が健康に与える影響について未知の部分が多い現状を鑑みれば、個人の期待に応えるよりも、まずはデータ収集が優先されることは仕方のないことかもしれない。

それでも、果敢に(お金を払って)プログラムを試してみるユーザーは、特定の食品に対する自分の身体の生物学的反応を数千人と比較した詳細な個人レポートを手に入れることができる。レポートにはさらに、自分に合う健康的な献立作りに役立てることができるよう、特定の食品に関する個人データを点数化した「Zoe」スコアも表示される。

Zoeのウェブサイトには「1人ひとりの身体の状態と生活スタイルに合わせた4週間プランで食事による炎症反応の抑制と腸内環境の改善を実現」「フードスコアに基づいた毎週の食事改善ノウハウをアプリで学べる」などの宣伝文句が並ぶ。

マーケティング資料にも「食べてはいけない食品」は一切なしと書かれており、前述のZoeスコアが、特定の食品群を禁止することもある(減量重視の)ダイエットとは異なることを示唆している。

「必要な情報とツールを提供することで、自分の健康にとって最善の決断ができるようにすることが目標」だとZoeは胸を張る。

その根底には、同じ食品でも身体が示す反応は人によって異なるという前提がある。食事内容(または食事量)に関わらず、痩身で(一見)健康な人を誰でも少なくとも1人は知っているだろう。その人と同じ食生活を送っても、期待通りの結果は得られないことが多い、ということだ。

共同創業者のGeorge Hadjigeorgiou(ヨルゴス・ハッジゲオルギオ)氏は次のように説明する。「Zoeは、昔から言われてきたことに初めて科学的な裏づけを与えている。(マイクロバイオームの科学研究は)始まったばかりだが、Zoeは、双子でさえ腸内マイクロバイオームが異なること、食事やライフスタイル、生活様式によって腸内マイクロバイオームが変化すること、特定の(腸内)細菌と食品の間につながりがあることを説明し、自社の製品を用いた実際的な改善方法を全世界に発信している」。

Zoeのこの製品を利用するには、各種食品に対する身体の反応を分析して自分だけの栄養アドバイスを得るため、検便や血液検査、血糖値モニタリングなど、身体に関するさまざまなデータを収集するための検査を自力で行う意思(と能力)が必要となる。

食事が身体に与える生物学的な影響を調べるためにZoeがこのプログラムで採用しているもう1つの方法は、一定のレシピで作られた「検査用の特製マフィン」だ。このマフィンを数千人に食べてもらい、カロリー、炭水化物、脂質、タンパク質の特定の組み合わせに対する栄養反応を比較し、ベンチマーク解析を行っている。

特製マフィンを食べるだけならまったく問題はなさそうだが、実は、Zoeの家庭用検査キットを利用するのにかかる労力は、栄養改善に何となく興味があるだけの消費者には面倒に感じられる可能性が高い。

ハッジゲオルギオ氏も、今のところは食事や栄養に関する特定の問題(肥満、高コレステロール血症、2型糖尿病など)を抱え、解決を希望している人に焦点を当てているとあっさり認めている。ただし、データや見識を引き続き収集しつつも、Zoeの目標はあくまでパーソナライズされた栄養アドバイスを入手する機会を広げることだという。

ハッジゲオルギオ氏はTechCrunchの取材に対し「これまで同様、解決すべき問題を抱えている人たち、人生を変えるような経験を提供できそうな人たちから始めようという発想」だと答え「現時点では広く一般を対象とした商品にしようとは思っていない。初めは小規模にやるしかないことは分かっている。ただし、現在の限定的なターゲットグループでもかなりの人数になるはずだ」と述べた。

「もちろん、全体のコンセプトとしては、初期(のユーザー)の検査を終えた後、収集したデータや経験を踏まえてプログラムを簡素化し、対象者を拡大したいと考えている。内容面でも価格面でも利用しやすいようにシンプルにしていきたい。もっと多くの人に使ってもらえるように。最終的には、誰もが自分で最適化、理解、管理できるようになるべきだし、そうすることがZoeの目標でもある」と同氏は語る。

「生まれ育った環境も社会経済的地位も関係ない。それに実際、こうした手段や能力は、健康などの大きな問題を抱える人たちの方が限られている場合が多いかもしれない」。

Zoeは今のところ初期登録者の数を発表していないが、ハッジゲオルギオ氏によれば需要は高いようだ(現在、新規登録は順番待ちの状態だ)。

さらに同氏は、初期グループの中間トライアルの速報結果は期待を持たせるものだと胸を張る。AIを活用してカスタマイズした栄養改善プランを3カ月間試した結果、活力が増し(90%)、空腹だと感じることが減って(80%)、体重が平均約5kg減少したという。とはいえ、トライアルの参加人数が公表されていないため、これらの指標を定量化することはできない。

シリーズBで調達した追加資金は、年内に予定されている英国でのローンチを控え、プログラムの展開を加速させるために使用される予定だ。2022年にはさらに地域を拡大する。また、工学技術・科学分野の人材確保を継続するための資金にも充てられる。

Zoeは2020年、欧米で新型コロナウイルス感染症が拡大する中、症状自己申告アプリをローンチして注目を集めた。収集したデータは、新型コロナウイルスが人にどう影響するかを科学者や政策立案者が把握する一助として利用されている。

2020年1年間でZoeの新型コロナウイルス感染症アプリは約500万ユーザーを獲得したという。こうした(非営利の)取り組みは、Zoeが栄養改善サービスの分野で推進していきたい斬新な社会参加活動の一例だとハッジゲオルギオ氏は説明する。

同氏は「新型コロナウイルス感染症に関する新たな科学的知見を得るため、何百万、何千万もの人々が突如、協力してくれるようになった」と述べ、アプリ利用者から入手したデータが数多くの研究論文に利用されていると強調する。「一例を挙げれば、嗅覚障害や味覚障害といった症状を初めて科学的に(根拠を)示すことができた。その後、英国政府の公式症例リストに掲載されたのも、そのおかげだ」と同氏はいう。

「販売開始当初には思いもしなかったスピードで人々が参加したことで、大きな影響を生むことができたすばらしい例である」とハッジゲオルギオ氏は述べた。

ここで食生活のことに話を戻そう。食生活については、野菜を食べるとか、加工食品を控えるとか、糖分を減らす(またはゼロにする)といった、誰もが簡単に実践できるシンプルな「経験則」がすでに存在しているのではないだろうか。いまさらオーダーメイドの栄養改善プランにお金を払う必要はあるのだろうか。

「経験則は確かにある」とハッジゲオルギオ氏は同意する。「そんなものがないというのはおかしなことだ。経験則はあるし、時間が経過するにつれて、例えばZoeの研究などを通して洗練されていくだろうが、問題は、ほとんどの人が徐々に不健康になっているという実情に集約されると思う。実際、生活は乱れがちだし、経験則に基づく食事の法則さえ無視されている。そのため、乱れた生活やライフスタイルを改善するにはどうすれば良いかを自分で判断し、無理なく楽しく実践して健康になれるように人々を教育し、そうした能力を高めていくことも重要だと考えている」。

「それこそが、私たちが顧客とともに目指していることだ。そうした判断ができるように能力を高める後押しをしている。個人でカロリー計算をする必要はないし、糖質制限(食事制限)などの我慢をする必要もない。私たちは基本的に、食品が身体に及ぼす影響を把握できるように個人をサポートしているにすぎない。自分の血糖値や体内細菌、血中脂質がどう変化しているかをリアルタイムに理解できるよう、能力を育成して理解を深めた上で、『こんなコースはどう?ゲーム感覚で簡単にできるよ?』と呼びかける。そしてさまざまな食品をカスタマイズして組み合わせるためのツールをすべて提供する。食べてはいけないものもない。Zoeのアプリが示すフードスコアが75点になるような食事を日常的に心がけるだけでよい」。

「このように能力向上を図るアプローチはやる気を引き出すらしい。ユーザーはゲーム感覚で楽しみながら腸を整えて代謝を向上することができ、いつの間にか驚きの効果を実感し始める。活力に満ち、空腹感が減って体重が減少し、時間の経過とともに見違えるほどの健康を手に入れることができる。『人生を変える』と言われる所以だ」。

「人生を左右する目標にゲーム感覚で取り組める」なんて、確かに平均的な消費者にとっては「野菜を食べろ」と言われるよりよほど心惹かれる提案だろう。

ただし、ハッジゲオルギオ氏が認めたように、Zoeが商業的・研究的に独自の強みを持つマイクロバイオームは研究分野としてはまだ歴史が浅い。そのため、研究を進めるためにより多くのデータを収集することが当面の事業課題となっている。食事や運動などの生活要因と健康の関係は複雑で分からないことも多いため、色々とやるべきことが残っていると言える。

しかしハッジゲオルギオ氏は思いつくアイデアに1つずつ取り組んでいくつもりのようだ。

「砂糖はだめでケールは良いという単純な話ではない。魔法そのものはその間に発生するからだ」とハッジゲオルギオ氏は続ける。オートミールはヘルシーなのか。コメや全粒粉パスタはどうか。全粒粉パスタとバターはどう組み合わせれば良いのか。どれくらいの量を食べるべきか。どれも基本的にほとんどの人が日常的に直面する疑問だ」。

「アイスクリームを食べない日もあれば、ケールを食べない日もあるが、その間に色々な食品を摂取しているからこそ、魔法が生まれる。食品の摂取量やより良い組み合わせ、食事と運動の最適なバランス、食後3時間経っても血糖値を下げず、空腹だと感じない食べ方を知る必要がある。Zoeなら、これらをすべて予測し、分かりやすく説得力のある方法で点数化できる。そして食事成分の代謝反応を(本人が理解できるように)示すことができる」とハッジゲオルギオ氏は説明する。

関連記事
ストレスと白髪には顕著な相関、心理的負荷取り除けば元の色に戻る可能性をコロンビア大学の研究者が確認
CTOなど技術幹部志向のITエンジニア対象、paizaでデジタルヘルス領域アイデアソンの参加者募集開始
キユーピーが卵から生まれた「加熱変性リゾチーム」による新型コロナウイルスの不活性化を確認

カテゴリー:ヘルステック
タグ:Zoe資金調達ビッグデータ機械学習

画像クレジット:Getty Images

原文へ

(文:Natasha Lomas、翻訳:Dragonfly)

NVIDIAのAIペイントソフト「Canvas」はいたずら書きを瞬時にリアルな風景に変える

ここ数年、AI(人工知能)はイラストレーターとフォトグラファーのギャップを埋めてきた。文字通り、ビジュアルコンテンツのギャップを巧みに埋める。しかしこの最新ツールは、作品の最初期段階、つまり白紙のキャンバス状態からAIがアーティストに手を貸すことを目標にしている。

それぞれの色が異なる対象物を表す。山、水、草木、廃墟などだ。キャンバスに絵を描くと、荒削りなスケッチが敵対的生成ネットワーク(GAN)に送られる。GANは、(この場合は)リアリスティックな画像を作ろうとするクリエイターAIと、その画像がどれほどリアリスティックかを評価するディテクターAIの間でコンテンツを行き来させる。この共同作業によって、提案された画像のそこそこリアリスティックな解釈と考えられるものが作られる。

これは、2019年のCVPR(Computer Vision and Pattern Recognition)学会で発表されたプロトタイプ、GauGAN(ゴーギャン?)のユーザーフレンドリーバージョンといえるだろう。エッジ周りがよりスムーズになり、生成される画像も向上し、対応するNVIDIAグラフィクスカードを備えたどのWindowsパソコンでも使える。

関連記事:スケッチを数秒でリアルな写真に変えるNVIDIAのAI

この手法は、非常にリアリスティックな顔や動物、景色などを作るために使用されているが、人間にはわかる何らかの「違い」があるのが普通だ。しかし、このCanvas(キャンバス)アプリは現実と区別がつかないものを作ろうとはしていない。コンセプトアーティストのJama Jurabaev(ジャマ・ユラバエ)氏がビデオで説明しているように、いたずら書きよりも詳細な画像で自由に実験できることがこのアプリの狙いだ。

 

例えば片側に川が流れている草原の朽ち果てた廃墟を鉛筆で手早く描いたスケッチは、最終作品がどう見えるかをそこそこしか表せない。もし頭の中で描いたイメージがあり、その後2時間かけて作画して色をつけた後、太陽は絵の左側に沈んでいくので前景の影がどうにも落ち着かないことに気がついたとしたらどうだろうか。

もし代わりに、これらの要素を簡単な走り書きにしてCavasに渡せば、そうなることが即座に把握でき、次のアイデアに移ることができる。時刻やパレットやその他高度なパラメータも簡単に変えられるので、それぞれの場合をすばやく評価することができる。

画像クレジット:NVIDIA

「もう白いキャンバスが怖くなくなりました」とユラバエ氏は言った。「大きな変更も怖くありません、細部は常にAIが助けてくれることがわかっているので、自分はクリエイティブ面に全力を集中し、あとはCanvasに任せられるからです。

これはGoogle(グーグル)のChimera Painter(キマイラ・ペインター)と非常によく似ている。あの不気味な画像を覚えているなら、そこではほとんど同じプロセスを使って想像上の動物が作られていた。雪と岩と茂みの代わりに、後ろ足と毛皮と歯などがある。使い方はより複雑で間違いも起こりやすい。

画像クレジット:Devin Coldewey / Google

それでも普通のペイントアプリで不気味な円筒形の動物すら描いたことのない私のようなアマチュアにとって、優れたツールであることは間違いないだろう。

キマイラ・ペインターとは異なり、Canvasはローカルで動作し、NVIDIAの強力なビデオカードが必要だ。GPUが機械学習アプリケーションの推奨ハードウェアになって久しいが、リアルタイムGANのようなものには、間違いなく超強力バージョンが必要だろう。Canvsアプリはここから無料でダウンロードできる

関連記事:Googleが機械学習を利用した悪夢のような「怪物ジェネレーター」を開発

カテゴリー:人工知能・AI
タグ:NVIDIA機械学習

画像クレジット:NVIDIA

原文へ

(文:Devin Coldewey、翻訳:Nob Takahashi / facebook

テスラは強力なスーパーコンピューターを使ったビジョンオンリーの自動運転アプローチを追求中

Tesla(テスラ)のElon Musk(イーロン・マスク)CEOは、少なくとも2019年頃から「Dojo」(ドージョー)という名のニューラルネットワークトレーニングコンピューターについて言及してきた。Dojoは、ビジョンオンリー(視覚のみ)の自動運転を実現するために、膨大な量の映像データを処理することができるコンピューターだとマスク氏はいう。Dojo自体はまだ開発中だが、米国時間6月22日、テスラは、Dojoが最終的に提供しようとしているものの開発プロトタイプ版となる、新しいスーパーコンピューターを公開した。

テスラのAI部門の責任者であるAndrej Karpathy(アンドレイ・カーパシー)氏が、米国時間6月21日に開催された「2021 Conference on Computer Vision and Pattern Recognition」(コンピュータービジョンとパターン認識会議2021)において、同社の新しいスーパーコンピューターを公開したのだ。このコンピューターを利用することで、自動運転車に搭載されているレーダーやライダーのセンサーを捨て去り、高品質の光学カメラを採用することが可能になる。自動運転に関するワークショップで、カーパシー氏は、人間と同じようにコンピューターが新しい環境に対応するためには、膨大なデータセットと、そのデータセットを使って同社のニューラルネットベースの自動運転技術を訓練できる、巨大なスーパーコンピューターが必要だと説明した。こうして、今回のような「Dojo」の前身が生まれたのだ。

テスラの最新世代スーパーコンピューターは、10ペタバイトの「ホットティア」NVMeストレージを搭載し、毎秒1.6テラバイトのスピードで動作するとカーパシー氏はいう。その1.8EFLOPS(エクサフロップス)に及ぶ性能は、世界で5番目に強力なスーパーコンピューターになるかもしれないと彼は語ったが、後に、スーパーコンピューティングのTOP500ランキングに入るために必要な特定のベンチマークはまだ実行していないことを認めた。

「とはいえFLOPSで考えれば、きっと5位あたりに入るでしょう」とカーパシー氏はTechCrunchに語っている。「実際に現在5位にいるのは、NVIDIA(エヌビディア)のSelene(セレーネ)クラスターで、私たちのマシンに類似したアーキテクチャを採用し、同程度の数のGPUを搭載しています(向こうは4480個で、こちらは5760個、つまりあちらがやや少ない)」。

マスク氏は、以前からビジョン(視覚)のみでの自動運転を提唱してきたが、その主な理由はレーダーやライダーよりもカメラの方が速いからだ。2021年5月現在、北米で販売されているテスラのModel YおよびModel 3は、レーダーを使用せず、カメラと機械学習を利用して、アドバンスト運転支援システムとオートパイロットをサポートしている。

レーダーとビジョンが一致しない場合、どちらを信じればよいでしょう?ビジョンの方がはるかに精度が高いのですから、センサーを混合して使うより、ビジョンを重視した方がいいでしょう。

自動運転を提供する企業の多くは、LiDARと高精細地図を使用している。つまり走行する場所の、道路の全車線とその接続方法、信号機などに関する非常に詳細な地図が必要になる。

カーパシー氏はワークショップの中で「主にニューラルネットワークを使用する、ビジョンベースの私たちのアプローチは、原理的には地球上のどこでも機能することができます」と語った。

いわば「生体コンピューター」である人間をシリコンコンピューターで置き換えることで、レイテンシーの低下(反応速度の向上)、360度の状況認識、Instagram(インスタグラム)をチェックしたりしない完璧な注意力を保ったドライバーが生まれる、とカーパシー氏はいう。

関連記事:テスラの北米向けModel 3とModel Yがレーダー非搭載に

カーパシー氏は、テスラのスーパーコンピューターがコンピュータービジョンを使ってドライバーの望ましくない行動を修正するシナリオをいくつか紹介した。例えばコンピューターの物体検知機能が働いて、歩行者を轢くことを防ぐ緊急ブレーキのシナリオや、遠くにある黄色の信号を識別して、まだ減速を始めていないドライバーに警告を送る交通制御状況に関する通知などだ。

また、テスラ車では、ペダル誤操作緩和機能と呼ばれる機能がすでに実証されている。これは、クルマが進路上の歩行者や、あるいは前方に走行できる道がないことを識別して、ドライバーが誤ってブレーキではなくアクセルを踏んだ場合に対応できる機能だ。このことによって、車の前の歩行者を救ったり、ドライバーが加速して川に飛び込んだりするのを防ぐことができる可能性が高まる。

テスラのスーパーコンピューターは、車両を取り囲む8台のカメラからの映像を毎秒36フレーム収集しており、それらは車両を取り巻く環境について非常に多くの情報を提供すると、カーパシー氏は説明する。

ビジョンオンリーのアプローチは、世界中で高精細な地図を収集、構築、維持することに比べれば拡張性が高い。しかしその一方で、物体の検出や運転を担当するニューラルネットワークが、人間の奥行きや速度への認識能力に匹敵するスピードで、膨大な量のデータを収集処理できなければならないため、課題が多いということができる。

カーパシー氏は、長年の研究の結果、この課題を教師付き学習の問題として扱うことで解決できると考えているという。カーパシー氏は、この技術をテストした結果、人口の少ない地域では人間の介入なしで運転できることがわかったが「サンフランシスコのような非常に障害物の多い環境では、間違いなくもっと苦労するでしょう」と述べている。高精細な地図や追加のセンサーなどの必要性を減らし、システムを真に機能させるためには、人口密集地への対応力を高めなければならない。

テスラのAIチームの持つ画期的技術の1つは、自動ラベル付けだ。これは、テスラのカメラでクルマから撮影された膨大な量の動画から、道路上の危険物などのラベルを自動的に付けることができるものだ。大規模なAIデータセットは、時間がかかる多くの手作業によるラベル付けを必要としてきた。特に、ニューラルネットワーク上の教師付き学習システムをうまく機能させるために必要な、きれいにラベル付けされたデータセットを手に入れようとしているときにはそれが顕著だった。

だがテスラは、この最新のスーパーコンピューターを使って、1本約10秒の動画を100万本集め、60億個の物体に奥行き、速度、加速度のラベルを付けた。これらは、1.5ペタバイトという膨大な量のストレージを占めている。確かにこれは膨大な量に思えるだろうが、テスラがビジョンシステムのみに依存した自動運転システムに求められる信頼性を実現するには、さらに多くのものが必要となる。そのため、より高度なAIを追求するために、テスラはこれまで以上に強力なスーパーコンピューターを開発し続ける必要があるのだ。

関連記事:テスラが車内カメラでAutopilot使用中のドライバーを監視

カテゴリー:人工知能・AI
タグ:TeslaElon Muskスーパーコンピュータ自動運転コンピュータービジョン機械学習

画像クレジット:Tesla

原文へ

(文: Rebecca Bellan、翻訳:sako)

スマホカメラとAIを利用して自動車事故の損傷を査定するTractable、最大の市場は日本

保険業界も21世紀の生活に合わせて進化しているようだ。コンピュータビジョンを利用して遠隔地から損傷を鑑定できるツールを開発したAIスタートアップが、多額の成長資金を獲得したことを発表した。

Tractable(トラクタブル)は、自動車保険会社と提携し、ユーザーがぶつけたクルマの写真を撮影して送信すると、その損傷具合を「読み取って」査定するサービスを提供している。同社はシリーズDラウンドで6000万ドル(約66億1000万円)の資金を調達したと発表、その評価額は10億ドル(1102億円)に達したという。

Tractableは、世界の自動車保険会社トップ100のうち20社以上と提携しており、過去24カ月間で収益は600%増加したという。Alex Dalyac(アレックス・ダルヤック)CEOによると「年間売上高は8桁ドル(数十億円)に達する」とのこと。「新型コロナウイルス感染拡大がなかったら、もっと早く成長していただろう」と、同氏は語っている。人々が自宅から出なくなるということは、クルマで路上を走る人の数が格段に減り、事故も減るからだ。

現在のTractableのビジネスは、主に交通事故の損害請求に関わるものが中心となっている。ユーザーは事故で損傷したクルマの写真をスマートフォンのカメラで撮影し、(通常のアプリではなく)モバイルサイトを介して写真をアップロードする。

しかし、同社は今回の資金調達の一部を利用して、自然災害の復旧(特に物的損害の鑑定)や、中古車の査定といった、隣接する分野へのさらなる事業拡大も計画している。また、スマートフォンで撮影された(サイズの小さな)写真を処理・解析するためのAIベースの技術を、より優れたものにするためにも、この資金は使われる。

今回の投資ラウンドは、Insight Partners(インサイト・パートナーズ)とGeorgian Partners(ジョージアン・パートナーズ)が共同で主導した。これにより、同社の累計調達額は1億1500万ドル(約127億円)に達した。

深層学習の研究者であり、Razvan Ranca(ラズバン・ランカ)氏やAdrien Cohen(エイドリアン・コーヘン)氏とともにTractableを設立したダルヤック氏によれば、同社が特定し解決する「機会」(「事故」と言い換えることもできるだろう)では、自分のクルマに起きた問題として対処する場合、保険会社とのやり取りには時間がかかりストレスになっているという。

最近では、そんな問題により近代的なプロセスを導入する新世代の「インシュアテック」スタートアップが登場しているものの、Tractableがターゲットとする既存の大手保険会社には、そのプロセスを改善する技術が不足していた。

それは、フィンテックを推進するネオバンクと、時代に追いつくためにさらなるテクノロジーへの投資に躍起になっている既存の銀行との間に見られる緊張関係と似ている。

「事故に遭うと、面倒なことからトラウマになることまでさまざまな負担を受けます」とダルヤック氏はいう。「壊滅的なダメージを受け、立ち直るまでにはかなりの時間がかかります。保険会社とのやりとりも多いし、多くの人がやって来て何度も確認しなければなりません。いつになったら本当に元通りになるのかを把握するのは困難です。私達は、画像分類の飛躍的な進歩により、そのプロセス全体が10倍速くなると確信しています」。

このプロセスは現在、保険金請求のための写真撮影に留まらず、Tractableのコンピュータビジョン技術を使って、車両が修理不能になった場合に、どの部品をリサイクルして他の場所で再利用できるかを判断するのにも役立っている。ダルヤック氏によれば、2020年はこのサービスが人気を博し「2019年にTesla(テスラ)が販売した新車台数」と同じ数のクルマのリサイクルを支援したという。

これまでTractableと契約を結んだ顧客企業には、米国のGeico(ガイコ)をはじめ、日本では東京海上日動、三井住友、あいおいニッセイ同和損保など、多くの保険会社が含まれている。また、フランス最大の自動車保険会社であるCovéa(コベア)、英国Admiral Group(アドミラル・グループ)のスペイン法人であるAdmiral Seguros(アドミラル・セグロス)、英国の大手保険会社であるAgeas(エイジアス)も同社の顧客となっている。

現在、日本は同社の最大の市場であるとダルヤック氏はいう。その理由は、高齢化が進んでいることと、その一方で携帯電話の利用率が非常に高いことという2つの条件が揃っているためだという。そのため「自動化は単なる付加価値ではなく、必要不可欠なものとなる」とダルヤック氏は述べている。だが、近い将来には米国が日本を抜いてTractableの最大の市場になるだろうと、同氏は付け加えた。

物的資産や中古車への応用などの新たな方向性は、保険会社との提携だけに留まらず、より幅広いユースケースへの扉を開くことになるだろう。それによってTractableが新たな競争環境に入る可能性もある。同じようなビジネスチャンスを狙っている企業は他にもあるからだ。

例えば、一般的なスマートフォンのカメラを使って住宅の3D画像を作成する方法を確立したHover(ホバー)は、元々は住宅の修理の見積もりをするために開発された技術を、保険会社に販売する方法を検討している。

しかし今のところ、このような商機は十分に大きく、競合他社に勝つことよりも、需要を満たすことの方が重要だと考えられる。

Insight PartnersのMDであり、Tractableの取締役でもあるLonne Jaffe(ロン・ジャフィ)氏は、声明の中で次のように述べている。「Tractableの大規模な加速度的成長は、同社の応用機械学習システムの力と差別化を証明するものであり、それはますます多くの企業に採用されることで改善を続けています。何億人もの生活に影響を与える事故や災害から、世界がより早く回復することを支援するために活動しているTractableとのパートナーシップを、二倍に強化できることを我々はうれしく思います」。

Georgian PartnersのパートナーであるEmily Walsh(エミリー・ウォルシュ)氏は、次のように述べている。「Tractableの業界をリードするコンピュータビジョン機能は、顧客の投資利益率と同社の成長を驚異的なペースで促進し続けています。TractableがそのAI能力を、中古車業界や自然災害復旧という数十億ドル規模の新たな市場機会に適用するために、引き続きパートナーとして協力できることをうれしく思います」。

関連記事:

カテゴリー:人工知能・AI
タグ:Tractable資金調達自動車事故深層学習画像認識機械学習保険

画像クレジット:Tractable

原文へ

(文:Ingrid Lunden、翻訳:Hirokazu Kusakabe)

いにしえのASCIIアドベンチャーゲーム「NetHack」への挑戦から見えるAIの未来

機械学習モデルはすでにチェスや囲碁Atari(アタリ)ゲームなどをマスターしているが、Facebookの研究者たちは、AIを世界で最も難しいといわれる、無限に複雑な「NetHack(ネットハック)」に挑戦させて、さらにレベルを押し上げようとしている。

Facebook AI ResearchのEdward Grefenstette(エドワード・グレフェンステット)氏は次のように話す。「私たちはこのゲームで、最も利用しやすい「グランドチャレンジ」を構築しようと考えました。AIを解き明かすことはできませんが、より優れたAIを実現するための道筋を示すことができます。ゲームは、機械を賢くする要素、機械をダメにする要素について仮定を導き出す良い方法です」。

NetHackを初めて耳にする読者も多いだろうが、これは古今東西最も影響力のあるゲームの1つだ。あなたはファンタジー世界の冒険者で、毎回異なるダンジョンでどんどん危険な深みにはまっていく。モンスターと戦い、罠や危険を回避しながら、神と良い関係を築く。これは(はるかにシンプルな元祖「ローグ」の後の)最初の「ローグライク」ゲームで、間違いなく今でも最高で、ほぼ間違いなく最も難しい作品だ。

(なお、NetHackは無料で、ほとんどのプラットフォームでダウンロードしてプレイすることができる)

ゴブリンは「g」、プレイヤーは「@」、ダンジョンの構造は線と点で表すなどの、シンプルなASCIIグラフィックとは裏腹に、NetHackは驚くべき複雑さを持つ。というのも、1987年に登場したNetHackでは、その後も開発チームが交代しながら、オブジェクトやクリーチャー、ルール、そしてそれらを取り巻く無数のインタラクションを増やし続け、活発な開発を続けているからだ。

これこそが、NetHackがAIにとって非常に困難で興味深いチャレンジとなる理由の1つである。オープンエンドなNetHackでは、世界が毎回変化するだけでなく、すべてのオブジェクトやクリーチャーとインタラクションすることができる。インタラクションはほとんどが何十年もかけて手作業でコーディングされ、プレイヤーのあらゆる選択肢を可能にしている。

タイルベースのグラフィックにアップデートされたNetHack。今まで同様、すべての情報がテキストベースだ

「Atari、『Dota 2』、『StarCraft 2』などのゲームを進化させるために必要とされたソリューションは非常に興味深いものですが、NetHackには、それとは異なる課題があります。人間としてゲームをプレイするためには、人間の知識が必要です」とグレフェンステット氏は話す。

NetHack以外のゲームでは、勝つための戦略が多かれ少なかれ明らかになっている。もちろん、Dota 2のようなゲームは、Atari 800よりも複雑だが、考え方は同じだ。プレイヤーが操作する駒、環境というゲームボード、目標となる勝利条件がある。NetHackでもそれは同じだが、もっと複雑怪奇だ。まず、ゲームが細部も含め、毎回異なる。

「新しいダンジョン、新しい世界、新しいモンスターやアイテム、セーブポイントがないなど。ミスをして死んでしまったら、生き返ることはできません。現実の世界に似ていますね。失敗から学び、その知識で武装して新しい状況に臨むのです」と、グレフェンステット氏。

腐食性のポーションはもちろん飲むべきではないが、それをモンスターに投げつけたらどうだろうか?武器に塗るのは?宝箱の錠前にかけるのは?水で薄めたらどうだろう?人間はこれらの行為を直感的に理解するが、ゲームをプレイするAIは人間のようには考えない。

NetHackのシステムの深さと複雑さを説明するのは難しいが、その多様性と難しさはAIのチャレンジに相応しいとグレフェンステット氏は話す。

ニューラルネットワークではなく、(ゲームと同じくらい)複雑な決定木を用いたゲームプレイ用のボットは、何年も前から設計されている。Facebook Researchチームは、機械学習を用いたゲームプレイのアルゴリズムをテストできる学習環境を構築することで、新しいアプローチを生み出したいと考えている。

AIが認識している内容がラベルで表示されたNetHack

NetHack学習環境(NetHack Learning Environment、NLE)は2020年完成したが、NetHackチャレンジはまだ始まったばかりである。NLEは専用のコンピューティング環境にゲームを組み込んだもので、AIはテキストコマンド(指示、攻撃やポーションを飲むなどのアクション)でNLEとやり取りする。

野心的なAIデザイナーにとっては魅力的なターゲットだ。StarCraft 2のようなゲームの方が知名度は高いかもしれないが、ゲーム界のレジェンドであるNetHackで、他のゲームに適用されたモデルとはまったく異なる方法でモデルを構築するというのは興味深いチャレンジである。

また、グレフェンステット氏の説明のように、NetHackは過去の多くのゲームと比較して、利用しやすいゲームだ。StarCraft 2用のAIを作ろうと思ったら、ゲーム内の画像で視覚認識エンジンを実行するために、大規模なマシンパワーが必要だろう。しかし、NetHackはゲーム全体がテキストで構成されているため、非常に効率的に作業を行うことができる。ベーシックなコンピューターでも人間の何千倍もの速さでプレイすることができるので、(他の機械学習の手法には欠かせない)高性能なデバイスを持たない個人やグループでも挑戦することが可能だ。

グレフェンステット氏は「私たちは、大規模な学術研究機関に限定せずに、AIコミュニティに多くのチャレンジを提供できる研究環境を構築したいと考えていました」と話す。

今後数カ月間はNLEが公開され、競技者は基本的に自分の好きな手段でボットやAIを作ってテストすることができる。2021年10月15日に本格的な競技が開始されると、特別なアクセスやRAMのテストなどはできず、制御された環境の中で標準的なコマンドを使ってゲームを操作するように制限される。

競技の目標はゲームをクリアすることで、Facebookチームは、一定時間内にエージェントがNetHackの「アセンション」を何回行ったかを記録する。しかし「どのエージェントでもアセンションがゼロになるだろうと想定している」とグレフェンステット氏は認めている。結局のところ、このゲームは史上最も難しいゲームの1つであり、何年もプレイしている人間でも、数回連続で勝利することはおろか、一生に一度でも勝利することが難しいのだ。その他にも、いくつかのカテゴリーで勝者を判定するための採点基準がある。

このチャレンジが、より本質的に人間の思考に近い、新しいAIへのアプローチの種になることを期待している。ショートカット、トライ&エラー、スコアハック、ザーグ戦術(量で圧倒する戦術)はここでは通用しない。エージェントは論理体系を学び、それを柔軟かつ知的に適用する……さもないと、怒り狂ったケンタウルスやオウルベアに殺されることになる。

NetHackチャレンジのルールやその他の詳細については、こちらを参照のこと。結果は年内に開催されるNeurIPS(Neural Information Processing Systems、ニューラル情報処理システム)カンファレンスで発表される予定だ。

関連記事:AI応用のMRIは4分の1の時間で従来と同等の結果を得られることが盲検法で判明

カテゴリー:人工知能・AI
タグ:Facebook AI Research機械学習ゲーム

画像クレジット:Facebook / Nethack

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)

Spotifyがポッドキャスト発見プラットフォーム「Podz」を買収

ポッドキャストが大流行しているが、聴きたいポッドキャストを見つけ出すのは難しいものだ。Spotify(スポティファイ)は6月17日、ポッドキャスト発掘にかかる問題を解決しようとしているスタートアップであるPodz(ポッズ)の買収を発表した。

「Spotifyでは、我々は世界で最高の(そして最もパーソナライズされた)ポッドキャストディスカバリーのエクスペリエンスの構築と展開に投資しています」と同社は述べた。「Podzのテクノロジーは発見を促進し、リスナーに正しいコンテンツを正しいときに届け、そしてこの部門の成長を世界中で加速させるためのSpotifyの集中的な取り組みを補い、発展させます」。

ポッドキャストは通常30分ほどの長さであり、リスナーは新しい番組をブラウズするのは難しい。ポッドキャストのエピソードを視聴するのは、新しいアーティストの曲を試すほどに簡単ではないのだ。そのため、Podzはユーザーにさまざまな番組の60秒のクリップを提示する「初のオーディオニュースフィード」と呼ぶものを開発した。ポッドキャスト配信者は往々にして、自身のソーシャルメディアアカウントでの宣伝に使うクリップを制作するためにHeadlinerのようなアプリを活用する。Podzはそれと同じアイデアを踏襲している。しかしポッドキャスト配信者が番組をどのように宣伝するかを手作業で行うのに代わって、Podzは機械学習モデルを使ってクリップを選ぶ。この機械学習モデルは、ジャーナリストやオーディオエディターの監修のもとに10万時間超のオーディオを使って訓練されている。

画像クレジット:Podz

Spotifyに買収される前、PodzはプレシードラウンドでM13、Canaan Partners、Charge Ventures、Humbitionなどから250万ドル(約2億7560万円)を調達した。Katie Couric(ケイティ・クーリック)氏、Paris Hilton(パリス・ヒルトン)氏といったセレブも投資した。

「平均的なポッドキャストリスナーは7つのポッドキャストを購読していますが、Podzでは30近いポッドキャストをフォローしています」とM13のゼネラルパートナーLatif Peracha(ラティフ・ペラチャ)氏は2021年2月に電子メールでTechCrunchに語った。「初期のサインを受け、チームがこの分野で変革的なプロダクトを構築できると我々は楽観的にとらえています」。

関連記事:長いポッドキャストを60秒のパーソナライズされた「音声ニュースフィード」に変えるPodz

買収は、ポッドキャスティングマーケット、概してオーディオエンターテインメントを独占しようというSpotifyの野心を示すものだ。ちょうど6月16日に同社はClubhouseのライバルとなるライブオーディオ「Greenroom」をデビューさせた。ポッドキャストサブスクからの収益の促進という点では、SpotifyとAppleは互角だ。4月にAppleはポッドキャストサブスクへの進出を発表している。そしてその翌週、Spotifyは2月に予告していたサブスクプラットフォームの展開を開始した。Appleは初年度にポッドキャスト売上の30%を徴収すると述べたが、この割合は2年目に15%に下がる見込みだ。一方、Spotifyのプログラムは2023年までクリエイターから手数料を徴収せず、その後は5%となる。

関連記事
Spotifyがライブオーディオアプリ「Greenroom」を提供開始、Clubhouseのライバル誕生
アップルがポッドキャストの有料定額サービス開始を発表、米国では番組あたり約53円から

ポッドキャストクリエイターはサブスク売り上げの30%の徴収より5%に降参した方が利益が大きいと即決できるが、リスナーは最高のユーザーエクスペリエンスを提供するアプリに群がるだろう。そしてポッドキャスト発見へのSpotifyの投資が報われるのなら、ポッドキャスティング分野で長らく優位性を維持してきたAppleにとっては由々しき事態となる。

カテゴリー:ネットサービス
タグ:SpotifyポッドキャストPodz買収機械学習

画像クレジット:Spotify

原文へ

(文:Amanda Silberling、翻訳:Nariko Mizoguchi

デジタルギフトカードや航空券、ゲームなどのオンライン取引での詐欺を防ぐイスラエルのnSure AI

詐欺防止プラットフォームを手がけるスタートアップ企業のnSure AI(エヌシュアAI)は、DisruptiveAI(ディスラプティブAI)、Phoenix Insurance(フェニックス・インシュアランス)、AXA(アクサ)が支援するベンチャービルダーのKamet(カメット)、Moneta Seeds(モネタ・シーズ)、および複数の個人投資家から、シード資金として680万ドル(約7億5000万円)を調達した。

今回の投資ラウンドで得た資金は、nSure AIによる「世界初」の詐欺防止プラットフォームを支える予測型AIと機械学習アルゴリズムを強化するために使われる予定だ。このラウンドに先立ち、同社は2019年3月にKametからプレシード資金として55万ドル(約6000万円)を調達している。

テルアビブに本社を置くこのスタートアップは、現在16名の従業員を擁し、デジタルギフトカード、航空券、ソフトウェア、ゲームなど、リスクの高いデジタル商品を販売する小売業者に不正検知機能を提供している。ほとんどの不正検知ツールは、それぞれのオンライン取引ごとに分析を行い、どの購入を承認してどの購入を拒否するかを決定しようとするが、nSure AIのリスクエンジンは、深層学習技術を活用し、不正取引を正確に特定する。

保険会社のAXAが支援するnSure AIは、購入時の平均承認率が98%と、業界平均の80%に比べてかなり高いため、小売業者はこれまで正当な顧客を減少させることで失われていた年間1000億ドル(約11兆円)近い収益を取り戻すことができると述べている。同社は自社の技術に自信を持っており、そのプラットフォームで承認されてしまった不正取引については、すべて責任を負うとしている。

nSure AIの創業者であるAlex Zeltcer(アレックス・ゼルサー)氏とZiv Isaiah(ジブ・アイザイア)氏は、デジタル資産の小売業者が直面する独特の問題を経験した後、同社を起ち上げた。彼らのオンラインギフトカード事業は、最初の週に売上の40%が不正取引で、チャージバックが発生することが判明した。しかし、他の不正検知サービスではニーズを満たすものがなかったため、創業者たちはリスクの高いデジタル商品の販売をサポートする独自のプラットフォームの開発に着手した。

同社の共同創業者で最高経営責任者を務めるゼルサー氏は、今回の資金調達によって「詐欺を事業に不可避​なものとして受け入れることなく、よりリスクの高いデジタル商品を安心して販売できる数千の新規加盟店を登録することができる」と述べている。

現在、毎月数百万件の取引を監視・管理しているnSure AIは、2019年に稼働して以来、総額10億ドル(約1100億円)近い取引を承認してきた。

関連記事
不正取引が「これまでになく」増加する中、Outseerは決済セキュリティツールに注力
アップルが詐欺撲滅を目指してApp Storeガイドラインを改訂
Amazonが詐欺商法に関わったインフルエンサーらを提訴

カテゴリー:セキュリティ
タグ:nSure AI詐欺人工知能機械学習深層学習資金調達eコマースイスラエル

画像クレジット:Jason Alden / Bloomberg / Getty Images

原文へ

(文:Carly Page、翻訳:Hirokazu Kusakabe)

技術的な知識が少ない人も利用できるエンタープライズAI「Dataiku」が中小企業向けマネージドサービスを開始

Dataikuは米国時間6月14日「Dataiku Online」と呼ばれる新しい製品でダウンストリームに拡大する。その名が示すように、Dataiku OnlineはDataikuのフルマネージドバージョンだ。これにより、システム管理者や独自インフラを必要とする複雑なセットアッププロセスを経ることなく、同社のデータサイエンスプラットフォームを活用することができる。

Dataikuという名を聞き慣れない方のために説明すると、このプラットフォームでは、生データを高度な分析に変換したり、データの可視化タスクを実行したり、データにづ付けられたダッシュボードを作成したり、機械学習モデルをトレーニングすることができる。Dataikuは特に、データサイエンティストだけでなく、ビジネスアナリストやあまり技術的な知識が少ない人でも利用できる。

同社はこれまで、大企業のエンタープライズ顧客を中心に事業を展開してきた。現在Dataikuは、Unilever(ユニリーバ)、Schlumberger(シュルンベルジェ)、GE、BNP Paribas(BNPパリバ)、Cisco(シスコ)、Merck(メルク)、NXP Semiconductors(NXPセミコンダクターズ)など、400社以上の顧客を抱えている。

Dataikuを使用するには2つの方法がある。1つは、自社のオンプレミスサーバーにソフトウェアソリューションをインストールする方法。2つ目は、クラウドインスタンス上で実行する方法だ。Dataiku Onlineは3つ目のオプションを提供し、同スタートアップがセットアップとインフラの面倒を見てくれる。

共同創業者兼CEOのFlorian Douetteau(フロリアン・ドゥエトー)氏はこう述べている。「Dataiku Onlineを利用するお客様は、当社のオンプレミス製品やクラウドインスタンスが提供するのと同じ機能、つまり、データ準備や可視化から高度なデータ分析や機械学習の機能まで、すべてを利用することができます。中小企業(SMB)やアーリーステージ企業は、AIプロジェクトから価値を得るためのリソースや技術的な専門知識を持っていないというイメージがありますが、そんなことはありません。データサイエンティストや専門のMLエンジニアを持たない小規模なチームでも、当社のプラットフォームを利用することで、技術的な負担を大幅に軽減することができ、実際にAIをビジネスに活用することに集中できます」。

Dataiku Onlineを利用する顧客は、Dataikuの構築済みコネクターを利用できる。例えば、Dataikuインスタンスを、Snowflake Data Cloud、Amazon Redshift、Google BigQueryなどのクラウドデータウェアハウスと接続することができる。また、SQLデータベース(MySQL、PostgreSQLなど)に接続することも可能で、Amazon S3に保存されたCSVファイル上で実行することもできる。

また、データインジェストの作業を始めたばかりであれば、Dataikuは一般的なデータインジェストサービスとうまく連携する。「Dataiku Onlineのお客様の典型的なスタックは、FiveTran、Stitch、Aloomaのようなデータインジェストツールを活用し、Google BigQuery、Amazon Redshift、Snowflakeのようなクラウドデータウェアハウスに同期します。Dataikuはそれらの最新のデータスタックにうまく適合しています」とドゥエトー氏は語る。

Dataiku Onlineは、Dataikuを使い始めるのに最適なサービスだ。高成長のスタートアップ企業は人手が足りない傾向にあり、できるだけすばやくサービスを立ち上げて稼働させたいと考えているので、Dataiku Onlineからスタートするかもしれない。しかし事業が大きくなるにつれて、Dataikuのクラウドまたはオンプレミスインストールに切り替えることを想像できる。そうすれば会社がスケールアップしても、従業員は同じプラットフォームを使い続けることができる。

カテゴリー:ソフトウェア
タグ:Dataiku中小企業機械学習

画像クレジット:Jason Coudriet / Unsplash

原文へ

(文:Romain Dillet、翻訳:Aya Nakazato)

前年比100%の成長を遂げたスウェーデンの遠隔医療サービス「Kry」、パンデミックで地位向上

スウェーデンのデジタルヘルススタートアップKry(クリー)は、臨床医と患者をつなげて遠隔診療を行う遠隔医療サービス(およびソフトウェアツール)を提供している。同社は、パンデミックが西欧を襲う直前の2020年1月に、シリーズCで1億4000万ユーロ(約184億6000万円)を調達した。

2021年4月末に発表されたシリーズDには、前回に続き応募者が殺到し、資金調達額は3億1200万ドル(2億6200万ユーロまたは約339億2400万円)。資金は、西欧地域での事業拡大を加速させるために使われる。

2015年に創業したスタートアップであるKryの今回のラウンドには、新旧入りまじった投資家たちが参加した。シリーズDはCPP Investments(カナダ年金制度投資委員会)とFidelity Management & Research LLC(フィデリティ・マネジメント&リサーチLLC)が主導し、The Ontario Teachers’ Pension Plan(オンタリオ州教職員年金基金)やヨーロッパを拠点とするベンチャー・キャピタルのIndex Ventures(インデックス・ベンチャーズ)、Accel(アクセル)、Creandum(クリアンダム)、Project A(プロジェクトA)などの既存投資家が参加している。

新型コロナウイルス感染症が世界的に大流行し、ソーシャルディスタンシングが必要になったことから、遠隔医療分野の地位が明らかに向上した。そのため、遠隔診察を可能にするデジタルヘルスツールの導入が患者と臨床医の両方で加速している。Kryは2020年、医師によるオンライン診察を可能にする無料サービスの提供にすばやく取りかかった。当時、医療を支援しなければならないという大きな責任を痛感していた、と同社は語っている。

公衆衛生上の危機的状況の中で、Kryの俊敏性は明らかに功を奏し、2020年のKryの前年比成長率は100%になった。つまり1年前に約160万件だったデジタルドクターの予約数が、現在は300万件を超えているということだ。また6000人もの臨床医が同社の遠隔医療プラットフォームとソフトウェアツールを利用している(登録されている患者数は公表されていない)。

しかし共同設立者兼CEOのJohannes Schildt(ヨハネス・シルト)氏によると、医療の需要に関しては、ある意味では穏やかな12カ月だったようだ。

パンデミックの影響で、新型コロナウイルス感染症の検査(Kryが一部の市場で提供しているサービス)など、新型コロナウイルス感染症に関連する特定の需要が高まっていることは確かだ。しかし同氏がいうには、国家的なロックダウンや新型コロナウイルス感染症への懸念から、医療に対する通常の需要がいくらか抑制された。そのため、新型コロナウイルス感染症による公衆衛生上の危機の渦中に、Kryが100%の成長率を達成したのは、医療の提供がデジタル化されていく中での次なる展開を占う出来事にすぎない、と同氏は確信している。

「世界的なパンデミックに関して、言うまでもなく当社は正しい道を進んできました。振り返ってみると、メガトレンドは明らかにパンデミックよりずっと前から存在していましたが、パンデミックがそのトレンドを加速させました。そして当社の活動を支えるという点で、そのトレンドが当社と業界に貢献しました。現在、医療システムの前進に遠隔治療とデジタル医療が重要な役割を果たすという考えは、世界中にしっかりと定着しています」とシルト氏はTechCrunchに語った。

「この1年間で需要が増加したことは明らかです。しかし医療提供をより広い視点から見てみると、欧州のほとんどの国で、医療サービスの利用率が実質的に過去最低になっています。なぜなら、厳しい制限がかけられたことで、多くの人々が病気にならないからです。かなり不思議な力が働いています。一般的な医療サービスの使用状況は、実質的に過去最低になっていますが、遠隔治療は増加傾向にあり、当社は以前よりも多くの業務を行っています。これはすばらしいことです。当社は多くの優秀な臨床医を雇用し、臨床医がデジタルに移行するのを助ける多くの優れたツールを提供しています」。

Kryの無料版の臨床医向けツールは、同社の「地位を大きく向上させた」とシルト氏はいう。パンデミックによってデジタルヘルスツールの導入が加速し、サービスの提供に大きな変化が起こっていることに、シルト氏はとてもワクワクしている。

「私にとって最大のポイントは、今や遠隔治療がしっかり確立され、定着しているということです。ただし成熟度のレベルは、欧州市場の間で差があります。2020年のKryのシリーズCラウンドのときでさえ、遠隔治療は当たり前のものではなかったかもしれません。もちろん当社にとっては、ずっと当たり前のものなのですが。どんな場合にもはっきり分かっていた点は、遠隔治療は未来への道であり、必要不可欠だということです。医療提供の多くをデジタル化する必要があります。そして当社がやるべきことは、着実に前進することだけです」。

(現在のパンデミックによるロックダウンが原因の需要の抑制はさておき)医療資源の需要が高まるなか、デジタルへの移行は(必然的に)制限されている医療資源の活用を拡大するために必要なものだとシルト氏は主張する。どんなときにも、Kryが医療提供における非効率性を解決することに注力してきた理由はここにある。

Kryは、公的医療制度で働く臨床医を支援するツールを提供するなど、さまざまな方法で非効率性を解決しようとしている(シルト氏によると、例えば、税金で賄われているNHSを通して大部分の医療が提供されている英国市場では、全GP[一般開業医]の60%以上がKryのツールを使用している)。さらに(いくつかの市場では)遠隔治療と外来診療所のネットワークを組み合わせた総合的な医療サービスを提供しており、利用者が臨床医の診察を直接受ける必要がある場合には、外来診療所に行くことができる。また、欧州の民間医療機関とも提携している。

要するにKryは、医療提供をサポートする方法にはこだわらない。この考えは技術面にも及んでいる。つまりビデオ診療は、感染症、皮膚疾患、胃の疾患、心理的障害など幅広い疾患に対する遠隔診療を提供する遠隔治療事業の一環にすぎない(いうまでもなく、すべての疾患を遠隔治療できるわけではないが、一次診療レベルの診察の多くは、医師と患者が直接面会する必要はない)。

今回の新たな資金調達によって投資が拡大されるKryの製品ロードマップでは、Internet Cognitive Based Therapy(ICBT:インターネットベースの認知行動療法)やメンタルヘルスの自己評価ツールなどの患者向けアプリを拡張して、デジタル指向の強い治療を提供することにも取り組んでいる。シルト氏によると、同社は、慢性疾患をサポートするためのデジタルヘルスケアツールにも投資する予定だ。このために、(実績のある既存の治療法をデジタル化するか、新しいアプローチを提案するかして)より多くのデジタル治療法を開発したり、買収や戦略的パートナーシップを通じて能力を拡大したりしている。

過去5年以上にわたり、不眠症不安神経症などの疾患、理学療法士の施術を直接受ける必要のある筋骨格疾患や慢性疾患のための、実績のある治療プログラムをデジタル化するスタートアップが増加している。Kryがプラットフォームを拡大するために連携するパートナーの選択肢は確かに豊富にある。しかし同社は、ICBTプログラムを自社開発しているため、デジタル治療分野そのものに取り組むことに不安はない。

「医療の大きな変化と移行の第4ラウンドに入ったことから、臨床医が高品質の医療を極めて効率的に提供するための優れたツールに投資し続けること、そして患者側の経験を深めることは、当社にとって非常に大きな意味があります。そうすることにより、より多くの人々の支援を続けることができるからです」とシルト氏はいう。

「当社は、ビデオやメッセージのやり取りを通して多くのことを行っていますが、それはほんの一部にすぎません。当社は現在、メンタルヘルス管理計画に多くの投資を行い、ICBT治療計画を進めています。また慢性疾患の治療への関与も深めています。当社に、臨床医がデジタル的にも物理的にも高品質な治療を大規模に提供するための優れたツールが存在するのは、当社のプラットフォームがデジタル面と物理面の両方を支えているからです。また2021年は、ときには同社が自力で、ときにはパートナーの力を借りて行っているデジタルでの医療提供と、物理的な医療提供を結び付けるために尽力しています。ビデオ自体はパズルの1ピースに過ぎません。当社が常に大切にしてきたことは、最終消費者の視点、患者の視点から医療を見ることでした」と同氏は語っている。

同氏は次のように続ける。「私自身も患者なので、当社が行っている多くのことは、一部の分野で構築されているシステムの非効率さ加減に対して私が感じたフラストレーションが動力源になっています。世の中には優れた臨床医が数多くいますが、患者目線の医療が足りていません。そして欧州市場の多くで、アクセスに関する明確な問題が発生しています。このような問題が、常に当社の出発ポイントでした。どうすれば、患者にとってより良い方法でこの問題を確実に解決できるのでしょうか。その解決策として、患者のための強力なツールとフロントエンドの両方を構築する必要があることは明らかです。そうすれば患者は簡単に治療を受けることができ、自分の健康を積極的に管理できるようになります。また臨床医が操作、作業できる優れたツールの構築も必要です。当社はそれにも力を入れています」。

「当社が抱えている臨床医だけでなく、提携している臨床医も含め、多くの臨床医が当社のツールを使用してデジタル医療を提供しています。そして当社はパートナーシップの下で、多くのことを行っています。当社が欧州のプロバイダーであることを考えれば、最終消費者が実際に治療を受けられるようにするには、政府や民間保険会社とのパートナーシップも必要です」。

デジタル医療提供分野の別のスタートアップたちは、AIを活用したトリアージや診断用チャットボットを使った医療へのアクセスを「デモクラタイズ」する(多くの人に普及させる)という大きな目標について話している。人間の医師が行っている仕事の少なくとも一部をこれらのツールで置き換えることができるという考えがあるからだ。そのスタートアップたちの先頭に立ち、大きな存在感を示しているのは、おそらくBabylon Health(バビロン・ヘルス)である。

それとは対照的に、Kryは、同社のツールに機械学習テクノロジーが高い頻度で取り入れられているにもかかわらず、AIを派手に宣伝することを避けてきた、とシルト氏は述べている。同社は診断チャットボットも提供していない。方針にこのような違いが出るのは、重視する問題が異なるからだ。Kryは医療提供における非効率性を問題視している。シルト氏は、医師による意思決定は、この分野におけるサービスが抱える問題の中では優先順位が低いと主張している。

「当社はいうまでもなく、製造しているすべてのプロダクトにAIや機械学習ツールだと考えられるものを使用しています。個人的には、テクノロジーを使ってどの問題を解決するかよりも、テクノロジーそのものについて声高に叫んでいる企業を見ると、少しイライラします」とシルト氏は話す。「意思決定支援の面では、当社には他社と同じようなチャットボットシステムはありません。もちろん、チャットボットは本当に簡単に構築できます。しかし私が常に重要だと考えているのは、『何のために問題を解決するか』を自問することです。答えは『患者のため』です。正直に言って、チャットボットはあまり役に立たないと思います」。

「多くの場合、特に一次医療には2つのケースがあります。1つ目は、尿路感染症にかかっており、以前にもかかったことがあるため、患者はなぜ助けが必要なのかをすでに知っているというケースです。目の感染症も同じです。また湿疹が出て、それが湿疹だと確信していれば、誰かに診てもらったり助けを得たりする必要があります。自分の症状に不安があり、それが何なのかよくわからないケースもあります。そして患者は安心感を得たいと考えます。それが深刻なものかどうかに関わらず、チャットボットがそのような安心感を与えてくれる段階にあるとは思えません。やはり患者は人間と話がしたいでしょう。ですからチャットボットの用途は限られていると思います」。

「そして意思決定については、臨床医が適切な意思決定を行えるようにするなど、当社は臨床医のための意思決定支援を行っています。しかし臨床医が得意とするものが1つあるとすれば、それは実のところ意思決定です。そして医療における非効率性について調べると、意思決定プロセスは非効率的ではありませんでした。マッチングが非効率的なのです」。

シルト氏は「大きな非効率性」がもたらすものとして、スウェーデンの医療システムが翻訳者に費やしている金額(約63億7500万円)を挙げているが、この金額は多言語を話す臨床医と患者を適切にマッチングすることで簡単に削減できる。

「ほとんどの医師はバイリンガルですが、患者と同じ時間に活動しているわけではありません。そのためマッチング面では多くの非効率が生じます。当社が時間を費やしているのが、たとえばこの非効率なのです。どうすれば非効率に対応できるか。当社に助けを求めている患者が最終的に適切な治療を受けられるようにするにはどうすればいいか。あなたの母国語を話す臨床医がいれば、互いに理解しあうことができるのか。看護師が十分に対応できるものか。心理学者が直接対応すべきものか、などを考える必要があります」。

「すべてのテクノロジーにおいて常に重要なのは、実際の問題を解決するためにテクノロジーをどのように使用するかであって、テクノロジーそのものはあまり重要ではありません」とシルト氏は付け加えた。

欧州における医療提供に影響を与える可能性のあるもう1つの「非効率性」は、患者が一次医療にアクセスしにくくすることで、コストを削減しようとする(民間の医療機関の場合は、保険会社の利益を最大化しようとする)問題のある動機によるものだ。請求プロセスを複雑にしたり、サービスにアクセスするための情報やサポートを必要最低限しか提供しない(あるいは予約を制限する)ことで、患者は特定の症状に関わる専門医を見つけ出し、その専門医に診てもらうための時間枠を確保するという、面倒な作業をしなければならない。

できるだけ多くの病気を回避するために、できるだけ多くの人々の健康維持に取り組むべき分野で、こうした動きがあるのは非常に残念である。こうした取り組みにより、患者自身にとっても良い結果がもたらされることは明白だからだ。実際に病気の人々を治療するための費用(医療費および社会的費用)を考えた場合、2型糖尿病から腰痛まで幅広い慢性疾患は、治療にかなりの費用がかかる。しかし適切に介入すれば完全に予防できる可能性がある。

患者にとっても医療コストにとっても、あらゆる点で優れた予防医療への移行が切望されているが、シルト氏は、それを促進するための重要な役割をデジタル医療ツールが果たすと考えている。

「本当に頭にきます」とシルト氏は言い、続けてこう述べた。「医療の提供にはコストがかかるという理由から、医療システムは人々が簡単に医療にアクセスできないような構造になっていることがあります。これは非常にばかげたことであり、一般的な医療システムでコストが増加している原因にもなっています。まさにその通りです。なぜなら臨床医と患者が最初に接する一次診療にアクセスできないからです。その結果、二次診療に影響が及んでいるのです」。

「欧州市場のすべてのデータから、そのような問題が見えてきます。一次診療で治療を受けるべき人々が救急処置室で治療を受けています。一次診療へのアクセス方法がないために、一次診療を受けることができなかったのです。一次診療の受診の仕方がわからず、待ち時間が長く、何の助けも得られないまま、さまざまなレベルにトリアージされます。そして最終的に尿路感染症の患者が救急処置室に来ることになるのです。医療システムが患者を寄せつけなければ、莫大なコストがかかります。それは正しいやり方ではありません。システム全体をより予防的で積極的なものにする必要があります。当社は、今後10年間にそのための重要な役割を果たすことができると考えています。その鍵を握るのがアクセスです」。

「患者が当社に支援を求め、当社は患者に適切なレベルの治療を提供する。当社は医療をこのようなシンプルなものにしたいと考えています」。

欧州で医療を提供するには、取り組むべき課題がまだ数多くあるため、Kryはサービスを地理的に拡大することを急いでいない。主な市場は、スウェーデン、ノルウェイ、フランス、ドイツ、イギリスであり、同社はこれらの国々で(必ずしも全国的にではないが)医療サービスを運営している。留意すべきは、同社が30の地域でビデオ診療サービスを提供していることだ。

米国でのローンチの計画はあるかと尋ねられたシルト氏は「現在当社は欧州に非常に注目しています」と答えた。「欧州以外に進出することは決してない、とは言いません。しかし今は欧州にかなりの力を注いでおり、その市場を熟知していますし、欧州の制度の中でどのように行動すべきかを知っています」。

「欧州と米国では医療費の支払いに関する制度が大きく異なっています。また欧州では最上のものが注目されます。そして欧州は巨大な市場です。欧州すべての市場で、医療はGDPの10%を占めているので、大きなビジネスを築くために、欧州の外に出る必要はないのです。当分の間は、欧州に注力し続けることが重要だと考えています」。

関連記事
サイケデリック療法とテックが融合したメンタルヘルスソリューションのNUE Life Health
オリンパスやNTTドコモ他3医療機関が4K映像による消化器内視鏡映像のリアルタイム伝送の実証実験に成功
国内初のIoT型胎児モニターを製造販売する香川大学発「メロディ・インターナショナル」が1.5億円調達

カテゴリー:ヘルステック
タグ:遠隔医療Kry資金調達新型コロナウイルスメンタルヘルス機械学習医療費医療スウェーデン

画像クレジット:Kry

原文へ

(文:Natasha Lomas、翻訳:Dragonfly)

より良い選択を学ぶオートコンプリートで誰でも文章を早くかけるようになるCompose.ai、企業独自の言葉遣いにも対応

今日のGPT-3の世界では、テキストを扱う新しいソフトウェアサービス話題になることも、珍しくなくなった。Compose.aiもそんな企業の1つで、同社は独自の言語モデルを開発し、多くの人が文章をもっと早く書けるようにしてくれる。初期のプロダクトが早くも投資家の関心を引き、Craft Venturesがリードするシードラウンドで210万ドル(約2億3000万円)を調達したことを同社は米国時間6月8日の朝に発表した。

関連記事:Copy.aiのAI利用記事作成システムは「使える」レベルの驚異的な出来、日本語も対応

Compose.aiは、ウェブを閲覧しているときにどこでも使えるオートコンプリート機能を提供する。AIを搭載したバックエンドは、ユーザーの声を学習し、コンテキスト(文脈)を吸収してより良い回答を提供したり、やがては企業の大きな声を吸収して文章のアウトプットを整える機能も備えている。

共同創業者のLandon Sanford(ランドン・サンフォード)氏とMichael Shuffett(マイケル・シャフェット)氏によると、Compose.aiは、5年後に平均的な人たちは書くときにすべてのワードをタイプしていない、と信じている。同社は、Compose.aiのChromeエクステンションで今後はもっと多くの人たちがそうなって欲しい、と述べている。ブラウザーのエクステンションなら、会社の許可がなくても使えるはずだ、と。

サンフォード氏とシャフェット氏の説明によると、同社の言語アルゴリズムはマルチティアのプロダクトだ。最初の段階として、インターネットそのものを読んで学習(主に英語)し、第2段階として具体的なドメイン、たとえばeメールというドメインを扱う。第3段階にはユーザーの声を学習し、そして今後の第4段階では、企業内で一般化している言語へのアプローチ、すなわちその企業独自の言葉遣いのパターンなどを扱う。

企業が従業員に共有言語モデルを提供することで、彼らが文章を書く際に言語や単語選択の好みを提示できるというのは興味深いコンセプトだ。このように強力で中央集権的なトーンという考え方は、役に立つものと知的に厳格なものの中間に位置する。しかし、多くの人は書くことに自分なりの工夫をしたくない、もしくは書くことをまったく好まないものだ。したがって、中央集権的なサポートを増やすことは、ほとんどの人にとって面倒なことではなく、むしろ時間を節約するハックになるだろう。

いずれにしてもCompose.aiは、新たに得た資金でスタッフを増やそうとしている。現在、フルタイムが3名と若干の契約社員だけだ。サンフォード氏とシャフェット氏によると、今後も小さな会社を維持し、少数の経験豊富な技術者と機械学習のスタッフでプロダクトチームを充実させたいという。

Composeの今後、どのような展開を行うのだろうか?創業者たちはTechCrunchに対し、少しずつ企業との対話を始めており、第4四半期末には有料サービスを開始する予定だと語った。これは早期の収益を意味し、スタートアップのランウェイを大幅に延長することになるだろう。

Composeが構築しているものは技術的にシンプルなものではなく、経済性を適切に調整するための興味深い作業が待っている。同社の創業者はTechCrunchに対し、同社のプロダクトが顧客のために実行するパーソナライゼーションの作業は、間違ったやり方をすると高くつく可能性があると述べている。2人は、将来的に月額10ドル(約1100円)のプランを経済的に魅力的なものにすることは可能だが、「ナイーブ」な方法で行えば、Compose.aiは同じアカウントをサポートするために500ドル(約5万4800円)の計算コストを費やす可能性があるという。

それはまずい。

同社は、間近に迫った有料プランが経済的にうまくいくと確信している。TechCrunchでは、機会があればそのバージョンの同社プロダクトを試してみたいと思っている。

関連記事
機械学習を活用してマーケッターのコンテンツ制作を自動化するSimplified
マイクロソフトはGPT-3を使い自然言語でコードを書けるようにする

カテゴリー:人工知能・AI
タグ:GPT-3機械学習Compose.ai資金調達文章

画像クレジット:danijelala/Getty Images

原文へ

(文:Alex Wilhelm、翻訳:Hiroshi Iwatani)

AIサイバーセキュリティ企業SentinelOneが110億円のIPOを申請

AIと機械学習を利用して企業などのデータ保護を支援する後期段階のセキュリティスタートアップSentinelOneが、ニューヨーク証券取引所(NYSE)にIPOを申請した。

このセキュリティ企業は、米国時間6月3日に提出されたS-1文書で4月30日に終わる3カ月で売上が3740万ドル(約41億円)で前年比108%増加し、顧客ベースは前年の2700社から4700社に増加したことを明らかにした。パンデミックがもたらした成長にもかかわらずSentinelOneの純損失は2020年の2660万ドル(約29億1000万円)から6260万ドル(約68億6000万円)へと倍以上に増加した。

SentinelOneは同文書で「今後も成長のための投資が継続するため、弊社の営業費用の増加も予想される。主な増加要因は、弊社プラットフォームのさらなる開発を進めるための研究開発の拡大と営業およびマーケティング活動の拡張、隣接市場に拡大していくための機能性の開発、そして新たな国や地域における顧客獲得のための費用だ」と述べている。

マウンテンビューに拠点を置く同社によると、同社はそのクラスAの普通株をティッカーシンボル「S」で発行する意図であるが、IPOのために用意する普通株の発行数や価格範囲については未定だ。S−1文書が挙げている主な引受人は、Morgan Stanley、Goldman Sachs、Bank of America Securities、Barclays and Wells Fargo Securitiesとなる。

SentinelOneは2020年11月に2億7600万ドル(約302億4000万円)を調達して、評価額は2021年2月の10億ドル(約1095億5000万円)から30億ドル(約3286億6000万円)へと3倍になった。当時、CEOで創業者のTomer Weingarten(トメル・ヴァインガルテン)氏はTechCrunchに、同社にとってIPOは「次の論理的なステップだろう」と語った。

SentinelOneは2013年に創業され、これまで8回の資金調達ラウンドで計6億9650万ドル(約763億円)を調達した。IPOによる調達額は最大で1億ドル(約110億円)を目指しており、この資金を利用してサイバーセキュリティのマーケットプレイスにおける企業の知名度を上げ、また製品開発など「一般的な企業プロセス」にも資金を投じたい、と述べている。

そしてさらに「資金の一部は弊社のビジネスを補完する技術やソリューションや事業の買収に当てるかもしれない」という。同社のこれまでで唯一の買収は2021年2月に行った高速ロギングのスタートアップScalyrの1億5500万ドル(約169億8000万円)の買収だ。

SentinelOneが上場を目指すこの時期は、サイバーセキュリティへの一般的な関心が高まっている時期でもある。パンデミックの間には著名な企業に波のように押し寄せるサイバー攻撃があり、ハッカーたちはリモートワークの広範な必然化に乗じている。

最大の攻撃の1つがロシアのハッカーによるIT企業SolarWindsのネットワークの侵犯で、それにより政府機関や複数の企業へのアクセスを彼らは得てしまった。SentinelOneのエンドポイント保護ソリューションは、関連する悪質なペイロードを検出および停止でき、顧客企業を護った。

ヴァインガルテン氏はSECへの提出文書の中で次のように述べている。「世界は犯罪者や国家犯やその他の悪質な行為者で満ちており、彼らはデータの窃盗や悪用の機会を探して、私たちの生活を破壊しようとしている。弊社のミッションは、情報を保存し処理し共有するデータとシステムという現代社会のインフラストラクチャの大黒柱を、保護しその安全を確保することにより、世界を正常に動かし続けることだ。犯人たちは、経営と操業を破壊、データを侵犯、利潤を転覆し、ダメージを与える彼らのクエストを急速に進化させているため、これは終わりなきミッションである」。

関連記事:セキュリティスタートアップSentinelOneが高速ロギングのScalyrを約162億円で買収

カテゴリー:セキュリティ
タグ:SentinelOne新規上場機械学習人工知能

画像クレジット:Tero Vesalainen/Getty Images

原文へ

(文:Carly Page、翻訳:Hiroshi Iwatani)

機械学習を活用してマーケッターのコンテンツ制作を自動化するSimplified

マーケティングに特化してCanvaに対抗しようとしているデザインソフトウェアのSimplifiedが、Craft Venturesが主導するシードラウンドで220万ドル(約2億4000万円)を調達した。このラウンドには他にSuperhumanのRahul Vohra(ラフル・ボーラ)氏とTodd Goldberg(トッド・ゴールドバーグ)氏、UberのCPOだったManik Gupta(マニック・グプタ)氏、Roomie創業者でPelican VenturesのAjay Yadav(アジェイ・ヤダブ)氏、Form Capital、8Bit Capital、Early Grey Capital、GFR Fund、MyAsia VCなども参加した。

Simplifiedは幅広いチャネルに向けて大量のコンテンツを作る必要に迫られているマーケッターをまさにターゲットにしている。このプラットフォームは機械学習を利用して、コピー、画像、フォーマット、サイズ調整などコンテンツ制作のプロセスを可能な限り自動化する。

例えばマーケッターがソーシャルメディアに心を動かすような引用を投稿したいとする。ソーシャルメディア向けのコンテンツであることを指定し、心を動かすような引用を見つけて、システムに対して適切な背景を自動で作るように指示する。その後はタイプフェイスや画像のトリミングなど何でも好きなように微調整すれば、すぐに公開できる。

画像クレジット:Simplified

Simplifiedは組織全体で作品やアセットを共有する共同作業ツールも提供している。ストックフォトやストックビデオのサービスとも統合できる。

Canvaなどの製品ですでに単純化されているプロセスを、機械学習とGPT-3を利用して次のレベルへ引き上げるのが、この製品の基本的な考え方だ。

創業者のKD Deshpande(KD・デシュパンデ)氏は、とにかくスケールが重要だという。コンテンツを1つだけ作るのがこれまでより簡単になったとしても、量の問題は残る。Simplifiedは機械学習の自動化アルゴリズムを活用してコンテンツ制作のプロセスをスピードアップすることを目指している。

Simplifiedは、ここ数年デザイン分野が大幅に進化している中で登場した。InVisionやFigma、Canvaなどが、新世代のデザイナーやデザイン指向組織の要求に合う新鮮なデザインツールを提供して進化を引っぱっている。

カテゴリー:ソフトウェア
タグ:Simplified資金調達機械学習マーケティングGPT-3デザイン

画像クレジット:Simplified

原文へ

(文:Jordan Crook、翻訳:Kaori Koyama)

新薬発見のために膨大な数の化学合成を機械学習でテストするMolecule.one

ポーランドの計算化学企業Molecule.oneは、理論的な薬剤分子を現実のものとするための活動を拡大するため460万ドル(約5億円)を調達した。同社の機械学習システムは、有益と思われる分子を合成する最良の方法を予測するもので、新薬や治療法を生み出す上で重要な役割を果たしている。

Molecule.oneはDisrupt SF 2019のStartup Battlefieldに登壇し、彼らは大量の理論的治療法を考え出すが、それらの分子すべてを実際に作ることはできないという創薬業界が直面している難題を説明した。

エキゾチックな化合物を発想しそれを実際に試験したいが、その作り方がわからないとき、同社のシステムの出番となる。それらの分子は科学にとってまったく新しいもので、過去に誰も作ったものがないため、その作り方もわからない。Molecule.oneが作ったワークフローは、まず普通のありふれた化学物質からスタートして、段階的に既知の方法を適用していく。AからBへ、そしてCへ、Dへ、というように。もちろん、実際にはこんな簡単な手順ではない。

同社は機械学習と、化学反応に関する大量の知識ベースを利用してこれらの工程を作っていくが、CEOのStanisław Jastrzębski(スタニスワフ・ヤストルツニェフスキ)氏の説明によると、同社はそれを逆方向で行っていく。

「合成計画はゲームに似ています。このゲームの1つ1つの動きにおいて、私たちはボード上のピースを移動するのではなく、1対の原子を結びつけている科学的なボンドを外します。そのゲームの目標は、ターゲットの分子を、市場で一般的に手に入れることができそれらからターゲットを合成できるような分子へと分解することだ。私たちが使っているアルゴリズムは、DeepMindが合成手筋を見つけて碁やチェスをマスターするために使ったものと似ています」とヤストルツニェフスキ氏はいう。

共同創業者のPiotr Byrski(ピオトル・ベルスキ)氏とPaweł Włodarczyk-Pruszyński(パヴェウ・ヴウォダルチク・プルシェンスキスキ)氏によると、有機反応を予測することは決して容易なことではなく、これまで彼らは、システムを効率的かつ検証可能なものにするために大量のリソースを投じてきた。Molecule.oneは良いアイデアだけではなく、実行可能なアイデアを提供していると企業から評価されるように、定期的に社内でテストを行っています。

ベルスキ氏によると、Disruptでデビューしてからは年契約の顧客も増え、同社プラットフォームの機能も多くなった。また、ヴウォダルチク・プルシェンスキスキ氏によると、仕事の効率も上がったという。

画像クレジット:Molecule.one

「システムは成熟し、プラットフォームの拡張により1時間に数千種の分子の合成を計画できるようになりました。大量の分子合成機能を、膨大な量の候補薬剤分子を生成する創薬用のAIシステムと組み合わせると、すごく便利になります。多くの改良によって業界の信頼度も上がり、有意義な企業などとのコラボレーションもできるようになりました」。

確かに、顧客がひと握りではなく何十万もの治療用分子の経路について尋ねるようになると、問題はスケーリングになる。彼らにとって、製造コストを負担するのであれば、検討している化合物の1つが、同様の効果を持つ他の化合物よりもかなり容易に製造できるかどうかを確認するために、最初に出費を行う価値がある。はっきりとは言えないプロセス全体をシミュレーションすることなく、Molecule.oneにリストを送って数日後にレポートを受け取ることができる。

画像クレジット:Molecule.one

成功事例もあると思われるが、企業秘密が関係するケースも多いため、同社は顧客の成功例を明らかにしていない。しかし同社によると、他のバイオテック企業と同じく、現在は新型コロナウイルス治療関連の研究開発が多いという。

「私たちは、新型コロナウイルス関連の創薬に取り組む対象となる研究者にプラットフォームの一部を無料で提供しました。これにより、Yoshua Bengio(ヨシュア・ベンジオ)教授が顧問を務めるMILAのLambdaZeroプロジェクトとの永続的な協力関係が生まれました」とベルスキ氏はいう。

そのようなプロジェクトでは候補分子を、効果だけでなく製造のしやすさでも評価しなければならないため、同社の新たなスケール拡大方法をテストする機会も生まれている。

ベルスキ氏によると「まだ合成されていない薬を探すという意味では、非常に有望な化学空間の新領域を横断することができるため、この分野には非常に期待しています」という。

今回の投資ラウンドをリードしたのはAtmos Venturesで、参加した投資家はAME Cloud Ventures、Cherubic Ventures、Firlej Kastory、Inventures、Luminous Ventures、Sunfish Partners、そしてBayerの役員であるSebastian Guth(セバスチャン・グス)氏などの個人だ。

同社は、資金をチームの拡大と今後の拡大の継続に充てる計画だという。また今後もポーランドの企業でありながら、米国や西ヨーロッパにもオフィスを開きたいとのことだ。

関連記事
コロナ禍で押し進められたDXの中、AIに期待される今後の役割とは
Gタンパク質共役型受容体など膜タンパク質標的の創薬目指すリベロセラが5.4億円を追加調達
クライオ電子顕微鏡による構造解析を活かした創薬事業を手がけるキュライオが約3.1億円を調達

カテゴリー:人工知能・AI
タグ:Molecule.one資金調達ポーランド機械学習創薬計算化学

画像クレジット:Molecule.one

原文へ

(文:Devin Coldewey、翻訳:Hiroshi Iwatani)

Microsoft AzureがPyson向け機械学習プラットフォーム「PyTorch」のエンタープライズサポートを提供

Microsoft(マイクロソフト)は米国時間5月26日、PyTorch Enterprise(パイトーチ・エンタープライズ)を発表した。Azure(アジュール)上でPyTorchを使うための新たなサポートをデベロッパーに提供する新サービスだ。

PyTorchはPython(パイソン)向けのオープンソース機械学習プラットフォームで、コンピュータビジョンと自然言語処理に焦点を当てている。当初開発したのはFacebookで、Google(グーグル)の人気フレームワークであるTensorFlow(テンサーフロー)と似ている部分もある。

Microsoftのコミュニケーション担当コーポレートVPであるFrank X. Shaw(フランク・X・ショー)氏は、新サービスPyTorch Enterpriseについて「データサイエンス業務にPyTorchを使っている組織のデベロッパーに、より信頼性の高い生産体験を提供する」ものであると説明した。

PyTorch Enterpriseは、MicrosoftのPremier(プレミア)およびUnified(ユニファイド)のサポートプログラム・メンバーに、ホットフィックス、バグ、セキュリティ・パッチなどの優先リクエスト、直接サポート、ソリューションなどを提供する、とショー氏は説明した。Microsoftは毎年、長期的なサポートを行うPyTorchのバージョンを1つ選んでいる。

AzureはすでにPyTorchを比較的容易に使用できるように作られていて、Microsoftは2020年、PyTorch for Windowsの開発を引き継ぐなど、長年このライブラリに投資してきた。この日の発表でMicrosoftは、最新リリースのPyTorchはAzure Machine Learningに統合され、デベロッパーから入手したPyTorchコードを公開PyTorchディストリビューションにフィードバックすることを約束した。

PyTorch Enterprizeは、Windows 10およびいくつかのLinuxディストリビューションで動作しているPyTorch バージョン1.8.1以上で利用できる。

「Microsoftが提供するこの新しいエンタープライズレベル製品は、重要なギャップを埋めるものです。PyTorchは私たちの研究者がモデルをデザインしたり実験を行う上で、これまでにない柔軟性を与えてくれます」とNuance(ニュアンス)の上級主任研究員Jeremy Jancsary(ジェレミー・ジャンクサリー)氏はいう。「しかしこれらのモデルを製品化するのはチャレンジです。Microsoftが直接関わることで、私たちはAzure上に新しいバージョンのPyTorchを安心して展開できます」。

この新サービスの提供でMicrosoftは、オープンソースプロジェクトの上に追加サービスを提供することによって、スタートアップにオープンソース収益化戦略の見本を示している。PyTorchはスタートアップが開発したものではないため、メジャーなクラウドサービスがオープンソースコードの上に自社の商品バージョンを載せることも、問題なく受け入れられるだろう。

関連記事

マイクロソフトのブラウザ「Edge」は起動が速くなりタブがスリープする機能も搭載する
マイクロソフトはGPT-3を使い自然言語でコードを書けるようにする
マイクロソフトが今や1日に1億4500万人が利用するTeamsの開発者向け新機能やツールを発表
マイクロソフトのナデラCEOがBuild 2021で「自らテストしてきた」次世代Windowsに言及

カテゴリー:ソフトウェア
タグ:MicrosoftMicrosoft BuildMicrosoft Build 2021Microsoft Azure機械学習自然言語処理PyTorchオープンソース

画像クレジット:Gingagi / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Nob Takahashi / facebook

テスラの北米向けModel 3とModel Yがレーダー非搭載に

北米の顧客向けに製造されるTesla(テスラ)の「Model Y(モデルY)」と「Model 3 (モデル3)」には、レーダーが搭載されなくなる。これは、機械学習を組み合わせたカメラのみを使用して、同社の先進運転支援システムやその他のアクティブセーフティ機能をサポートするようにしたいという、Elon Musk(イーロン・マスク)CEOの意向を反映した変更だ。

センサーの使用をやめるという決定は、多くのテスラの動向と同様に、業界の標準的な考え方に反している。今のところ、レーダーなしのテスラ車は、北米のみで販売される。テスラは、中国や欧州の顧客向けに製造される車両から、レーダーセンサーを削除する時期やその可能性については言及していない。

自動車メーカーは通常、レーダーとカメラを(さらにはLiDARも)組み合わせ、周囲の交通状況に合わせて車両の走行速度を調整するアダプティブ・クルーズ・コントロールや、車線維持および自動車線変更など、先進運転支援システムの機能を実現するために必要なセンシングを行っている。

しかし、以前からマスク氏は、カメラといわゆるニューラルネット処理のみで、車両を取り巻く環境で起きていることを検知・認識し、適切な対応を行うシステムの可能性を喧伝しており、このシステムにはブランド名を冠した「Tesla Vision(テスラ・ビジョン)」という名称が付けられている。

ニューラルネットとは、人間の学習の仕方を模倣した機械学習の一種で、一連の接続されたネットワークを使用してデータのパターンを識別することにより、コンピュータが学習することを可能にする、人工知能アルゴリズムの洗練された形態だ。自動運転技術を開発している多くの企業は、特定の問題を処理するためにディープニューラルネットワークを使用しているが、彼らはこのディープネットワークを壁で囲い、ルールベースのアルゴリズムを使って、より広範なシステムに結びつけている。

Whole Mars Catalog@WholeMarsBlog
ピュア・ビジョンの考え方について、もう少し詳しく教えてください。

レーダーを使わないのは時代に逆行するという意見もありますが、なぜ使わないほうがいいと判断したのでしょうか?

Elon Musk@elonmusk
レーダーと視覚が一致しないとき、あなたはどちらを信じますか? 視覚認識の方がはるかに精度が高いので、複数のセンサーを組み合わせるよりも視覚認識を倍に増やした方が良いのです。

テスラは更新したウェブサイトでレーダーからの移行について詳述し、2021年5月から切り替えを開始したと述べている。このカメラと機械学習(特にニューラルネット処理)を組み合わせた方式は「Tesla Vision」と呼ばれ、同社の車両に標準装備されている先進運転支援システム「Autopilot(オートパイロット)」と、そのアップグレード版で1万ドル(約109万円)の追加料金が必要な「FSD(フル・セルフ・ドライビング)」に使われる。テスラのクルマは自動運転ではないので、人間のドライバーが常に運転に関与し続ける必要がある。

レーダーを搭載していないテスラ車では、当初は運転支援機能が制限される。例えば、Autosteer(オートステア)と呼ばれる車線維持機能が使える速度は最高時速75マイル(時速約120キロメートル)までに制限され、最小追従距離も長くなる。また、緊急車線逸脱回避機能や、駐車場で自車を自分の側まで呼び寄せることができるSmart Summon(スマート・サモン)機能は、納車当初には利用できない可能性があると、テスラは述べている。

同社では、今後数週間のうちにワイヤレス・ソフトウェア・アップデートによって、これらの機能を復活させることを計画しているという。ただし、テスラはその具体的なスケジュールを明らかにしていない。他のAutopilotやFSDの機能は、(注文した仕様にもよるが)納車時にすべて有効になっているとのこと。

一方、Model S(モデルS)とModel X(モデルX)の新車や、北米以外の市場向けに製造されるすべてのモデルには、引き続きレーダーが搭載され、レーダーを使ったAutopilotの機能も利用できる。

テスラは「よくある質問」の中で「Model 3とModel Yは、当社の製品の中でも生産台数が多いモデルです。これらのモデルを先にTesla Visionに移行することで、膨大な実世界におけるデータを短時間で分析することが可能になり、結果的にTesla Visionをベースとした機能の展開を早めることができます」と書いている。

関連記事
マスク氏の「年末までに自動運転を実現」という発言は「エンジニアリングの現実とは一致しない」とテスラ社員
イーロン・マスク氏がビットコインでのテスラ車購入停止を指示、ツイート後ビットコインは下落中
テスラがノルウェーでの判決を受け最大約243億円の補償金支払いに直面

カテゴリー:モビリティ
タグ:TeslaModel YModel 3アメリカカナダイーロン・マスクニューラルネットワーク機械学習コンピュータービジョンオートパイロット

画像クレジット:Tesla

原文へ

(文:Kirsten Korosec、翻訳:Hirokazu Kusakabe)

【コラム】欠陥のあるデータは障がいを持つ人を危険にさらしている

編集部注:Cat Noone(キャット・ヌーン)氏は、世界のソフトウェアをアクセス可能にすることをミッションとするスタートアップStarkのプロダクトデザイナーで共同ファウンダー、CEO。彼女は世界の最新のイノベーションへのアクセスを最大化する製品と、テクノロジーを実現することにフォーカスしている。

ーーー

データは単に抽象的なものではなく、人々の生活に直接的な影響を及ぼしている。

2019年、ある車椅子ユーザーが交通量の多い道を横断していた際、AIを搭載した配達ロボットがその進行を歩道の縁石で妨げてしまうという事故が起きた。「テクノロジーの開発において、障がい者を副次的に考えるべきではありません」と当事者は話している。

他の少数派グループと同様、障がい者は長い間欠陥のあるデータやデータツールによって被害を受けてきた。障がいにはさまざまな種類がありそれぞれ大きく異なるため、パターンを検出してグループを形成するようプログラムされたAIの型通りの構造に当てはまるようなものではない。AIは異常なデータを「ノイズ」とみなして無視するため、結論から障がい者が除外されてしまうことが多々あるのが現状だ。

例えば、2018年にUberの自動運転のSUVに追突されて死亡したElaine Herzberg(エレイン・ハーツバーグ)氏のケースがある。衝突時、ハーツバーグ氏は歩いて自転車を押していたためUberのシステムはそれを「車両」「自転車」「その他」のどれかとして検出し、瞬時に分類することができなかったのだ。この悲劇は後に障がい者に多くの疑問を投げかけた。車椅子やスクーターに乗っている人も、同じようにこの致命的な分類ミスの被害者になる可能性があるのだろうか。

データを収集し処理する新たな方法が必要だ。「データ」とは個人情報、ユーザーからのフィードバック、履歴書、マルチメディア、ユーザーメトリクスなどあらゆるものを指し、ソフトウェアを最適化するために常に利用されているが、データが悪用される可能性や各タッチポイントに原則が適用されていない場合などもあり、そういった不正な方法を確実に理解した上で利用されているわけではない。

今、障がい者を考慮したデータ管理を実現するための、より公平な新しいデータフレームワークが必要とされている。それが実現しなければ、デジタルツールへの依存度が高まる日々の生活の中、障がいを持つ人々はこれからもより多くの危険に直面することになるだろう。

誤ったデータが良いツールの構築を妨げる

アクセシビリティの欠如が障がい者の外出を妨げることはないとしても、質の高い医療や教育、オンデマンド配送など、生活の要となる部分へのアクセスを妨げてしまう可能性はある。

世の中に存在するツールはすべて、作り手の世界観や主観的なレンズが反映された、作り手の環境の産物である。そしてあまりにも長い間、同一のグループの人々が欠陥したデータシステムを管理し続けてきた。これでは根本的な偏見が永続し、これまで光が当てられてこなかったグループが引き続き無視されていくという閉ざされたループに陥ってしまう。データが進歩するにつれ、このループは雪だるま式に大きくなっていくだろう。我々が扱っているのは機械「学習」モデルだ。「X(白人、健常者、シスジェンダー)でない」ことは「普通でない」ことを意味すると長い間教えられていれば、その基礎の下、進化していくのである。

データは私たちには見えないところでつながっており、アルゴリズムが障がい者を除外していないというだけでは不十分である。バイアスは他のデータセットにも存在している。例えば米国では、黒人であることを理由に住宅ローンの融資を拒否することは違法とされているが、融資は有色人種に不利なバイアスが内在するクレジットスコアに基づいて審査が行われるため、銀行は間接的に有色人種を排除していることになる。

障がいのある人の場合、身体活動の頻度や週の通勤時間などが間接的に偏ったデータとして挙げられる。間接的な偏りがソフトウェアにどのように反映されるかの具体的な例として、採用アルゴリズムがビデオ面接中の候補者の顔の動きを調査する場合、認識障がいや運動障がいのある人は、健常者の応募者とは異なる障壁を経験することになるだろう。

この問題は障がい者が企業のターゲット市場の一部として見なされていないことにも起因している。企業が理想のユーザー像を思い描いて意見を出し合う開発の初期段階において、障がい者が考慮されないことが多く、精神疾患のような人目につきにくい障がいの場合は特にその傾向が著しい。つまり、製品やサービスを改良するために使用される初期のユーザーデータには、障がい者のデータが含まれていないということだ。実際、56%の企業がデジタル製品のテストを障がい者に対して定期的に行っていないという。

テック企業が障がい者を積極的にチームに参加させれば、彼らのニーズをより反映したターゲット市場が実現するだろう。さらに技術者たちが、目に見える、あるいは目に見えない除外項目を意識してデータに反映させる必要がある。これは簡単な作業ではないためコラボレーションが不可欠となるだろう。日々使用するデータから間接的なバイアスを排除する方法について、話し合いの場を広げ、フォーラムに参加したり知識を共有することができれば理想的である。

データに対する道徳的なストレステストが必要

ユーザビリティ、エンゲージメント、さらにはロゴの好みなど、企業は製品に対して常にテストを実施している。どんな色が顧客を獲得しやすいか、人々の心に最も響く言葉は何かなど、そういったことは把握しているのに、なぜデータ倫理の基準を設定しないのか。

道徳的なテクノロジーを生み出すことに対する責任は、企業の上層部だけにあるわけではない。製品の土台となるレンガを日々積み上げている人々にも責任があるのだ。フォルクスワーゲンが米国の汚染規制を逃れるための装置を開発した際、刑務所に送られたのはCEOではなくエンジニアである。

私たちエンジニア、デザイナー、プロダクトマネージャーは皆、目の前のデータを認識し、なぜそれを収集するのか、どのよう収集するのかを考えなければならない。人の障がい、性別、人種について尋ねることに意味があるのか、この情報を得ることによりエンドユーザーにとってどのようなメリットがあるのかなど、必要としているデータを調査して自身の動機を分析しなければならない。

Stark(スターク)では、あらゆる種類のソフトウェア、サービス、技術を設計、構築する際に実行すべき5つのフレームワークを開発した。

  • どのようなデータを収集しているのか。
  • なぜそのデータを収集するのか。
  • どのように使用するのか(そしてどのように誤用される可能性があるか)。
  • IFTTT(「If this, then that」の略で「この場合はこうなる」を意味する)をシミュレートする、データが悪用される可能性のあるシナリオとその代替案を説明する。例えば大規模なデータ侵害が発生した場合、ユーザーはどのような影響を受けるのか。その個人情報が家族や友人に公開されたらどうなるのか?
  • アイデアを実行するか破棄するか。

曖昧な言葉や不明瞭な期待値、こじつけでしかデータを説明できないのであれば、そのデータは使用されるべきではない。このフレームワークでは、データを最もシンプルな方法で説明することが求められるため、それができないということは責任を持ってデータを扱うことができていないということだ。

イノベーションには障がい者の参加が不可欠

ワクチン開発からロボットタクシーまで、複雑なデータテクノロジーは常に新しい分野に進出しているため、障がい者に対する偏見がこれらの分野で発生すると障がいのある人々は最先端の製品やサービスにアクセスできなくなってしまう。生活のあらゆる場面でテクノロジーへの依存度が高まるにつれ、日常的な活動を行う上で疎外されてしまう人々もさらに多くなる。

将来を見据え、インクルージョンの概念をあらかじめ製品に組み込むことが重要だ。お金や経験値の制限は問題ではない。思考プロセスや開発過程の変革にコストがかかることはなく、より良い方向へと意識的に舵を切ろうとすることが大切なのである。初期投資は少なからず負担になるかもしれないが、この市場に取り組まなかったり製品の変更を後から余儀なくされたりすることで失う利益は、初期投資をはるかに上回るだろう。特にエンタープライズレベルの企業では、コンプライアンスを遵守しなければ学術機関や政府機関との契約を結ぶことはできないだろう。

初期段階の企業は、アクセシビリティの指針を製品開発に取り入れ、ユーザーデータを収集して、その指針を常に強化していくべきだ。オンボーディングチーム、セールスチーム、デザインチームでデータを共有することで、ユーザーがどのような問題を抱えているかをより詳細に把握することができる。すでに確立された企業は自社製品のどこにアクセシビリティの指針が欠けているかを分析し、過去のデータやユーザーからの新たなフィードバックを活用して修正を行う必要がある。

AIとデータの見直しには、単にビジネスフレームワークを適応させるだけでは十分ではなく、やはり舵取りをする人たちの多様性が必要だ。テクノロジー分野では男性や白人が圧倒的に多く、障がい者を排除したり、偏見を持ったりしているという証言も数多くある。データツールを作るチーム自体が多様化しない限り、各組織の成長は阻害され続け、障がい者はその犠牲者であり続けることになるだろう。

関連記事:インクルーシブデザインの制作に役立つツールを提供するStarkが約1.6億円を調達

カテゴリー:パブリック / ダイバーシティ
タグ:Stark障がいアクセシビリティ機械学習多様性コラムインクルーシブ

画像クレジット:Jorg Greuel / Getty Images

原文へ

(文:Cat Noone、翻訳:Dragonfly)

Google CloudのVertex AIは機械学習を果てしないパイロットから価値を生む実用技術にする

米国時間5月18日のGoogle I/Oにおいて、Google Cloudは開発者が自分のAIモデルをもっと容易にデプロイしメンテナンスできるための、新しいマネージド機械学習プラットフォームであるVertex AIを発表した。I/Oは以前からモバイルとウェブのデベロッパーが対象であり、Google Cloudのニュースはあまりなかったため、やや違和感のある発表にも思えたが、GoogleがVertexの発表を本日行なうと決めた事実は、この新しいサービスが多様な分野の開発者にとって重要と同社が考えている証拠だ。

Vertexのローンチは、Google Cloudのチームが反省をたくさんしたことの結果だ。Google CloudのAI Platformでプロダクト管理を担当しているディレクターのCraig Wiley(クレイグ・ワイリー)氏は、次のように語る。「私見では、エンタープライズの機械学習は今危機にあります。その分野で何年も仕事した者の1人として現状を見れば、Harvard Business Reviewなどに論評を書いているアナリストの誰もが、今や大半の企業が機械学習に投資をしたり、投資に関心を示しているが、どこもそこから価値を得ていないと言っている。こんな状況は、そろそろ変わるべきです」。

画像クレジット:Google

2016年から2018年までAWSのAIサービスであるSageMakerのゼネラルマネージャーを経験して2019年にGoogleに来たワイリー氏によると、Googleのように自分たちのために機械学習を動かすことのできる企業は、どうやればそれが変革への力になるかを実際に見て知っている。しかし彼がいう問題とは、大きなクラウドがそんなサービスを提供するときは何十ものサービスに分割されてしまうことだ。「しかも(Google自身も含めて)そんなサービスの多くが袋小路にあります。そこでVertexの目標は、エンタープライズにとって機械学習への投資からのROIの時間を短縮し、モデルを作ったことが終わりではなく、彼らが作ったモデルから確実に、リアルな価値を得ることです」とワイリー氏はいう。

そこでVertexは、極めて柔軟性に富んだシステムとして、デベロッパーやデータサイエンティストのスキルのレベルがそんなに高くなくても、モデルを迅速に訓練できるようにする。Googleによると例えばモデルの訓練に要するコードの行数は他社の類似製品に比べて80%少なく、しかも彼らはモデルの全ライフサイクルを自分で管理できるようになる。

画像クレジット:Google

このサービスにはGoogleのAIオプティマイザVizierが統合されていて、機械学習のモデルのハイパーパラメータを自動的にチューニングする。これによりモデルのチューニングに要する時間が大幅に減り、エンジニアはより多くの実験をより短時間でできるようになる。

また、Vertexが提供している「Feature Store」でユーザーは機械学習のいろいろな機能をサービスし、シェアし、再利用できるようになる。そしてVertex Experimentsという機能を利用するとモデルの選択が速くなり、モデルの本番へのデプロイが加速される。

デプロイは、継続的モニタリングサービスとVertex Pipelinesが支援する。後者はGoogle CloudのAI Platform Pipelinesからの改名で、モデル用のデータを準備および分析し、モデルを訓練し、それらを評価してプロダクション(本番展開)へとデプロイしていくワークフローの管理を助ける。

いろいろなタイプのデベロッパーにとってとっつきやすいシステムにするために、このサービスには3つのインタフェイスがある。「ドラッグ&ドロップのツール」と「高度なユーザーのためのノートブック」、そして意外かもしれないがBigQueryのデータウェアハウスの中で、SQLの標準的なクエリを使って機械学習のモデルを作り実行するGoogleのツールである「BigQuery ML」だ。

Google CloudのCloud AIとIndustry Solutionsの副社長兼ゼネラルマネージャーであるAndrew Moore(アンドリュー・ムーア)氏は、次のように述べる。「Vertex AIを作るときには、2つのことを指針とした。1つはデータサイエンティストとエンジニアを組織の藪から救い出すこと、もう1つは、AIを果てしないパイロット事業から正規のサイズのプロダクションへと移行させることに誰もが真剣になるために、業界全体としての気運を作り出すことだ。このプラットフォームとして実現したことを、私たちはとても誇りに感じている。それは、データサイエンティストとエンジニアがクリエイティブな仕事に充実感を持てるような、新世代のAIの本格的なデプロイを可能にするものだからだ」。

関連記事
グーグルがAndroid 12の最新情報を公開、近年最大級のデザインアップデート、新ベータ版配信開始
Chromeに漏洩パスワードを自動的に修正する新機能、グーグルのAIテクノロジー「Duplex」を利用
事前トレーニングなしでより自然に会話できる新AI言語モデル「LaMDA」をグーグルが発表
今、Androidは30億台のアクティブデバイスに搭載されている
グーグルが「折りたたみ式」にフォーカスしたAndroidディベロッパー向けアップデートを追加
グーグルが次世代カスタムAIチップ「TPUv4」を発表、1ポッドでエクサフロップ以上の処理能力
グーグルの「Wear OS」とサムスンの「Tizen」が統合、アップルのwatchOSに対抗
Googleがオンラインショッピング拡大でShopifyと提携
グーグルがクロスプラットフォームUIツールキット「Flutter」をアップデート
グーグルの「Workspace」アプリが相互連携を強化し12の新機能を追加、囲い込みがさらに進む
Android TV OSの月間アクティブデバイスが8000万台に到達、新機能も発表
グーグルがWear OSの大規模アップデートを発表、Fitbitの「健康」関連機能も導入
グーグルが実物大の相手がすぐ向こう側にいるかのような3Dビデオ通話ブースを開発中

カテゴリー:人工知能・AI
タグ:GoogleGoogle I/O 2021Google Cloud機械学習Vertex AI

原文へ

(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)

NASAのアーカイブでドキュメント理解の経験を積むDocugamiの新モデル

最近はデータについての話題が多いため、膨大な量の処理が世界中のドキュメントで行われていることを忘れてはいないだろうか。ドキュメントは多様なファイルや形式が混在する動物園のようなものだ。非常に大きな価値はあるが、クリーンな構造化データベースの時代にはまだ適合していない。Docugami(ドキュガミ)はこの状況を変えようとしている。Docugamiのシステムは、任意のドキュメントを直感的に理解した上で、内容に対してインテリジェントな方法でインデックスを作成する。NASAはこの計画に賛同している。

Docugamiのプロダクトが計画どおり機能すると、何年にもわたり積み上げられたドキュメントの山を、誰でも瞬時に使いやすいデータに変換できるようになる。

どんな会社でも、運営していればドキュメントが大量に発生する。契約書や法的書類、不動産の賃貸借契約書や同意書、マーケティング関連の提案書やリリースノート、医療のカルテなどがある。形式もさまざまで、Word(ワード)ドキュメント、PDF、ワードからエクスポートしたPDFを印刷してスキャンしたものなど、多岐にわたる。

この問題に対応しようと何年にもわたって努力が払われたが、すべてのドキュメントを1カ所に集め、社内で共有したり編集したりできるようにするなど、大部分は組織側の対応だった。ドキュメントを理解するということは、それを扱う人間に委ねられてきたケースが多い。ドキュメントを理解するのは難しいので、これはもっともな話だ。

関連記事:自然言語処理ライブラリをオープンソースで提供するHugging Faceが43.6億円調達

賃貸借契約を考えてみよう。借主の名前がJill Jackson(ジル・ジャクソン)だとする。その契約書に「借主」と書かれているのを人間が読むと、借主が誰かは理解できる。また、他に100件の契約書があるとする。そのようなドキュメントに「借主」とあれば、ドキュメントの文脈からそれが先ほどと同じ概念を意味するが、同1人物ではないことを理解できる。一方で、機械学習や自然言語理解システムにとって、このような概念を理解して適用するのは非常に難しい。それでも、もしシステムがこのような概念を理解して応用できるのであれば、世界中の膨大なドキュメントから有用な情報を山のように抽出できる可能性がある。

.docxへの貢献

Docugamiの創業者であるJean Paoli(ジャン・パオリ)氏によると、同社では問題を全面的に解決できたという。大胆な主張ではあるが、彼はそう言える数少ない人間の1人だ。パオリ氏はMicrosoft(マイクロソフト)で何十年も重要な人物だった。とりわけXML形式の作成に力を入れていた。.docxや.xlsxなどの「x」で終わるファイルをご存じだろう。パオリ氏は、そのようなファイル形式の発展に少なからず貢献している。

「データとドキュメントは同じではありません。人間が理解できるものがドキュメントで、コンピューターが理解できるものがデータです。なぜ違うのでしょうか。(マイクロソフトでの)私の最初の仕事は、ドキュメントをデータとして表せる形式を作ることでした。業界の友人たちと一緒にXMLを作り、それをBill(ビル)が承認しました」(そう、あのビル・ゲイツが)と彼は説明した。

このときに作られた形式は広く使われるようになったが、20年経った現在でも問題は解決されていない。さまざまな業種がデジタル化され、問題の規模は大きくなっているが、パオリ氏にとって解決策は同じだ。XMLのコンセプトは「ドキュメントはウェブページのように構造化されるべきだ」である。つまり、ボックス内にボックスがあり、メタデータで明確に定義されているという、コンピューターが処理しやすい階層モデルだ。

画像クレジット:Docugami

「数年前にAIに関わっていた時に、ドキュメントをデータに変換するというアイデアが浮かびました。階層モデルを参照するためのアルゴリズムが必要でしたが、そんなアルゴリズムは存在しないと他の人に言われました。XMLモデルではあらゆる要素が他の要素内にあり、各要素の持つ固有の名前から、そこに含まれるデータが分かります。このモデルは、現在使用されているAIモデルと互換性がありません。これが現実です。AIの専門家がこの問題に取り組むことを期待していましたが、そうはなりませんでした」と彼は説明した(「自分は他の分野で忙しかった」と彼は言い訳を加えた)。

コンピューティングの新しいモデルに互換性がないことは、驚くことではない。新しい技術には特定の条件や制限がつきものだ。AIは音声認識やコンピュータービジョンなど、重要な他の分野に焦点が当てられている。その分野でのアプローチは、ドキュメントを体系的に理解するニーズとは異なる。

「多くの人が、ドキュメントは猫に似ていると考えています。AIをトレーニングすることで、目やしっぽを見つけられるようになるというわけです。しかし、ドキュメントは猫には似ていません」と彼は言った。

当たり前のようだが、ここに制限があるのだ。セグメンテーション、シーンの理解、マルチモーダルのコンテキストなどの高度なAIの手法はすべて、ある意味で非常に高度な猫検出機能であり、猫だけでなく犬、車の種類、表情、場所なども検出できる。一方で、ドキュメントはそれぞれがあまりに異なっている、もしくは似すぎていると言えるかもしれない。そのため、同じようなアプローチでできるのは、せいぜいおおまかに分類することだ。

言語理解については適している面もあるが、パオリ氏が必要とする方法としては不適切だった。「AIは英語の言語レベルのように機能しています。AIは参照するテキストを、そのテキストが含まれているドキュメントと切り離して考えています。私は神経言語プログラミング(NLP)の専門家が好きです。私のチームの半数はNLPの専門家ですが、NLPの専門家はビジネスのプロセスについては考えません。XMLの専門家(コンピュータービジョンを理解している人たち)とNLPの専門家にチームで共同してもらう必要があります。そうすると、違うレベルでドキュメントを見ることができるようになります」と彼は言った。

Docugamiの仕組み

画像クレジット:Docugami

パオリ氏が既存のツール(光学文字認識のような従来の成熟した機能を超えるもの)を採用しても、目標を達成できなかっただろう。そのため彼は独自のAIラボを作り、幅広い専門分野のチームが約2年間いろいろな改造を進めた。

「我々は自己資金でコアサイエンスをこっそりと研究し、特許事務所にかなりの数の特許を提出しました。その後ベンチャーキャピタルと会合を持ち、SignalFireが1000万ドル(約10億8000万円)のシードラウンドを自発的に主導してくれました」と彼は言った。

Docugamiを実用段階まで開発を進めるところまではシードラウンドに含まれなかったが、パオリ氏は作業中のドキュメントでプラットフォームについて説明してくれた。私はアクセス権を付与されず、スクリーンショットや動画も提供してもらえなかった。統合とUIの対応が途中だということで、ここからは想像してもらう必要がある。何かしらの企業向けSaaSサービスを想像してもらえれば、ほぼ間違いない。

Docugamiのユーザーは、任意の数のドキュメントを好きなだけアップロードできる。マシンが理解できるワークフローにドキュメントを移動すると、ドキュメントが解析される。スキャンされたPDFやワードファイルなどが、コンテンツに固有の階層構造にXMLのような形式で解析される。

「例えば、500個のドキュメントを複数のグループに分類するとします。こちらの30個は同じカテゴリー、20個は似ているから同じカテゴリー、そちらの5個をまとめるという感じです。ドキュメントの見た目、内容、使用方法などの手がかりを組み合わせてグループ化します」とパオリ氏は言った。あるサービスでは賃貸借とNDAの情報を区別できるかもしれないが、ドキュメントの種類は多岐にわたるため、事前にトレーニングされたカテゴリーの内容に合わせて分類して解決することはできない。どのドキュメントも内容が重複しない可能性があるため、Docugamiでは毎回トレーニングをやり直す。ドキュメントが1つしかない場合もやり直す。「ドキュメントを分類したら、ドキュメントの全体的な構成と階層を理解します。そうすることで、ドキュメントの内容全体を有効活用できます」。

画像クレジット:Docugami

この作業で可能になるのは、見出しのテキストを選択してインデックスを作成したり、単語が検索できるようになったりすることだけではない。ドキュメントに含まれるデータ(支払元、支払先、金額、支払日、支払いの条件など)がすべて構造化され、同じようなドキュメントの文脈で編集が可能となる(推定された内容を再確認するために多少の入力が必要)。

わかりにくいと思うので、会社で進行中の融資に関するレポートを1つにまとめることを考えてみよう。必要な作業は、サンプルドキュメント内の重要な部分をハイライトするだけだ。「Jane Roe(ジェーン・ロー)」「2万ドル(約210万円)」「5年」などの部分をクリックしたら、対応する情報を取得する別のドキュメントを選択する。すると、ドキュメントから取得された名前、金額、日付などが記載されている整理されたスプレッドシートが、数秒後にできあがる。

当然、このデータはすべて移動可能である。ビジネスで一般的に使用される他のさまざまなパイプやサービスとの統合も計画されている。実現すれば、レポートの自動化、特定の条件下でのアラートの発出、テンプレートや標準ドキュメントの自動作成が可能になる(古いドキュメントを保管したり、重要なカ所に下線を引いたりする必要がなくなる)。

このような処理が、ドキュメントのアップロード後30分で行われることに注目できる。データのラベリングや前処理、クリーニングは不要だ。事前に決まっている特定の概念や、賃貸借ドキュメントの形式に基づいてAIが処理するわけではない。関連がある構造、名前、日付などの必要な情報を、アップロードしたドキュメントからすべて学習するのだ。加えて、異なる業種への対応も可能で、誰でも直感的に理解できるインターフェースを使用する。ヘルスケアデータや建設関係の契約管理など、どんなデータを入力してもツールは処理可能だ。

ウェブインターフェースは、ドキュメントを取り込んで新しいドキュメントを作成できる主要ツールの1つであるが、ワードには別のツールがある。ワードを使用する場合にDocugamiは、使用するドキュメントがどのような形式でも内容を完全に認識するアシスタントのように機能する。そのため、新しいドキュメントを作成したり、標準的な情報を入力したり、規制に準拠したりすることができる。

機械学習の適用対象として法律文書を処理するのはあまり楽しいものではないが、重要ではある。そうでなければ私はこの記事を書いていないだろう(記事の長さはともかく、記事を作成することはなかったかもしれない)。このような深い理解が必要なタイプのドキュメントは、既存業種で使用されている標準のドキュメントタイプ(警察や医療のレポートなど)で一般的となっているが、カヤックレンタルサービス向けに運用できる特注モデルを誰かがトレーニングするまで待っているのは楽しいものである。中小企業のドキュメントにも、大企業のドキュメントと同じような価値が眠っている。中小企業ではデータサイエンティストを雇う余裕がなく、大企業でもすべて手作業で行うことはできない。

NASAのお宝

画像クレジット:NASA

極めて難しい問題でも、人間にとっては些細なことがある。似たような20個のドキュメントに名前と金額のリストが含まれていても、誰でも簡単に目を通せるだろう。おそらくDocugamiがクロールしてトレーニングするよりも短い時間で、内容を把握することが可能だ。

AIを活用する目的は、人間の能力を模倣してそれを超えることにある。経理担当者が20件の契約に対するレポートを毎月作成することと、1000件の契約に対するレポートを毎日作成することは別問題だが、Docugamiではその両方をどちらも簡単に実現できる。このような運用を調整できることが重要な企業システムにとっても、ドキュメントのバックログに埋もれたデータからクリーンなデータやインサイトを集めることを望んでいるNASAにとっても、Docugamiは適していると言える。

NASAが大量に保有しているもの、それはドキュメントだ。合理的かつ適切に管理されたアーカイブは、設立当初までさかのぼれる。数多くの重要なドキュメントをさまざまな方法で利用できる。私は長い時間をかけて、楽しみながら歴史あるドキュメントの情報を精査した

NASAは、アポロ11号に関する新しいインサイトを探しているわけではない。今に至るまでのプログラム、募集、補助金プログラム、予算、エンジニアリングプロジェクトを通じて、膨大なドキュメントが生成されている。これは結局のところ、連邦政府の官僚制度の大部分を占めている。さらに、何十年にもわたって書類を管理してきた他の大規模組織と同じように、NASAのドキュメントにはさまざまな可能性が隠されている。

ファイル内には専門家の意見、研究の産物、エンジニアリングのソリューション、その他さまざまなカテゴリーの重要情報が存在しており、簡単なワードで検索できると思われるが構造化されてはいない。例えばファイルに保存されている情報をジェット推進研究所で働いている人が理解し、ノズル設計に取り入れることができれば有用ではないだろうか。また、あるトピックについて、種類、日付、作成者、ステータスごとに整理された包括的なリストの最新版を数分で入手できたらどうだろう。特許アドバイザーが、従来の技術に関するNIAC助成金の受領について、情報を提供する必要がある場合はどうだろう。特定のキーワードで調べた場合よりも具体的に、特許や申請に関する古い情報を取得できるのではないだろうか。

2020年授与されたNASAのSBIR助成金は「Johnson Space Center(ジョンソン宇宙センター)の特定の種類のドキュメントをすべて収集する」ような、特定の業務を対象とするものではない。これは、このような助成金の多くと同様に探索や調査を目的とした契約であり、DocugamiはNASAの研究者と協力して、アーカイブにテクノロジーを適用する最もよい方法を見つけるよう取り組んでいる(優れた適用方法として、SBIRとその他の中小企業向け資金提供プログラムが挙げられるかもしれない)。

米国立科学財団(NSF)が提供する別のSBIR助成金とは次の点で異なる。NASAでは、さまざまな種類のドキュメントに重複する情報が含まれていても、チームで適切に整理することを検討している。その一方でNSFでは「小さなデータ」を適切に特定することを目指している。「我々は小さなデータに注目しています。非常に細かい点です。例えば名前が記載されている場合、貸主の名前か借主の名前か、医者の名前か患者の名前かに注目します。患者の記録にペニシリンに関する記載がある場合、それが処方されているか禁止されているかに注目します。アレルギーという欄と処方という欄がある場合に、そのような項目を関連付けることができます」とパオリ氏はいう。

「私がフランス人だからかもしれません」

SBIR助成金の予算がやや少ないため、その金額では会社の経営に影響がある可能性を指摘すると、彼は笑った。

「我々は助成金に頼って運営しているのでも、助成金が重要なのでもありません。私にとって、助成金は世界最高のラボで科学者と働くための方法なのです」と彼は言った。一方で彼は、助成金によるプロジェクトがいくつも予定されていることにも言及していた。「私にとって科学は燃料です。ビジネスモデルは非常にシンプルです。Docusign(ドキュサイン)やDropbox(ドロップボックス)のような、サブスクリプション形式のサービスです」。

この会社はビジネス運営を開始したばかりであり、インテグレーションパートナーやテスターとの多少のつながりを作っている。しかし今後1年で、独自のベータ版を展開した上で一般公開する予定だ。ただし明確な日程は決まっていない。

「我々は新興企業です。1年前は社員が5~6人でしたが、このシードラウンドで1000万ドル(約10.8億円)を獲得し、波に乗っています」とパオリ氏は言った。彼はこれが儲かるビジネスであるというだけでなく、企業の仕組みを大きく変えるものになると確信している。

「人々はドキュメントが好きです。私がフランス人だからかもしれませんが、テキストや本、文書は重要だと考えています。人間にはそういうものが必要です。人間は機械が上手に考えることを助け、機械は人間が上手に考えることを助けるもの。我々はそう考えています」と彼は言った。

関連記事:企業向けノーコードAIプラットフォームのNoogataがシードラウンドで約13億円を調達

カテゴリー:人工知能・AI
タグ:Docugami機械学習NASA

画像クレジット:cifotart / Getty Images(Image has been modified)

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)