医療アルゴリズムを開発することと、それが本当に機能することを証明することは、まったく別の話だ。そのためには、入手しにくいある重要なものが必要だ。医療データである。現在、とあるスタートアップ企業が、そのようなデータを、検証研究を容易にするツールとともに提供する準備を整えている。
今週、2021年に創業されたGesund(ゲズンド)が、500 Globalが主導する200万ドル(約2億3000万円)のシードラウンドでステルスから浮上した。CEOで創業者のEnes Hosgor(エネス・ホスゴー)氏はTechCrunchに対して、同社はすでに多くの実績を残していて、実行可能なプラットフォーム、30社の見込み顧客との取引、今四半期の売上見込みなどを見込んでいると語る。
基本的にGesundは、医療アルゴリズムを開発するAI企業や、自身のモデルをテストするアカデミアのためのCRO(Contract Research Organization、医薬品開発業務受託機関)なのだ。一般のCROが医薬品や医療機器企業向けの臨床試験をデザインするのと同じように、Gesundのプラットフォームは、AI企業が自社の製品をテストするためのデータをキュレーションし、その比較をスムーズに行うためのITインフラを構築する。
ホスゴー氏は「私たちは、自分たちを機械学習運用企業だと考えています」という。「私たち自身はアルゴリズムを手がけません」。
医療アルゴリズムは、学習させるデータがあってこそ役に立つが、多様で有用なデータセットの入手は困難であることが知られている。例えば、2020年にJAMAで発表された研究では、放射線科、眼科、皮膚科、病理科、消化器科などの分野にわたる深層学習アルゴリズムを説明した74の科学論文を分析し、これらの研究で使われたデータの71%がニューヨーク州、カリフォルニア州、マサチューセッツ州からもたらされたものだということを報告している。
実際、米国の34の州は、これらのアルゴリズムの学習に使用したデータを提供しておらず、より広い母集団に対する一般化の可能性が疑問視されている。
また、この問題は医療機関の種類を越えて存在している。大規模かつ権威ある大学病院で収集されたデータを使ってアルゴリズムを学習させることは可能だ。しかし、それを地域の小さな病院に導入しようと思っても、そうしたまったく異なる環境ではうまくいく保証はない。
BMJに発表された152件の研究のメタレビューによれば、アルゴリズムを訓練するために使用されるデータセットは、一般的に、必要とされるものよりも小さいという。当然ながら、アルゴリズムの成功例もあるものの、これは業界全体の問題なのだ。
テクノロジーだけでこれらの問題を解決することはできない。そもそも、そこにないデータを分類したり、提供したりすることはできないのだ。ヨーロッパ人以外の祖先を持つ人々の遺伝子研究が、非常に不足していることを考えてみて欲しい。しかしGesundは、既存のデータへのアクセスを容易にし、データ共有の新たな道を開くパートナーシップを構築するという、テクノロジーを役立てられる可能性のある問題に焦点を絞っている。
Gesundのデータパイプラインは「各臨床施設と締結している、データ共有契約」に基づいているとホスゴー氏はいう。現在、Gesundはシカゴ大学医療センター、マサチューセッツ総合病院、ベルリンのシャリテ大学で収集された画像データにフォーカスしている(同社は今後、放射線医学以外の分野にも拡大する計画だ)。
機械学習アプリケーションで使用するためのデータの集約と配信は、Nightingale Open Science Project(ナイチンゲール・オープンソースプロジェクト)のような、研究者に臨床データセットを無料で提供する他の企業によっても行われている(物議を醸しているGoogleの「Project Nightingale」[プロジェクト・ナイチンゲール]とは提携していない)。だが、データそのものも重要な要素だが、実はホスゴー氏が秘密兵器と見ているのは、同社のテクノロジー・スタックなのだ。
「誰もがクラウドでML(機械学習)をやっています。ですが、一般的な医療機関はクラウドを持っていないので、すべてが失われてしまうのです」とホスゴー氏はいう。「そこで私たちは、病院のファイアウォール内に設置できる技術スタックを構築しました。これは機械学習にはつきもののサードパーティのマネージドサービスには一切依存していません」。
そこを起点として、プラットフォームには「ローコード」のインターフェイスが搭載されている。つまり、医師や医療機関は、基本的に必要なデータセットをドラッグ&ドロップし、そのデータに対して自身のアルゴリズムをテストすることができるのだ。
ホスゴー氏は「創業して約6カ月ですが、すでに本格的に走っています。私たちは開発した最初の製品は、クラウドリソースにアクセスできない高度なコンプライアンス環境において、モデルの所有者がデータに対して自身のアルゴリズムを実行し、正確なメトリクスをその場で生成できるようにするものです。それが私たちの強みなのです」と説明する。
現時点では、GesundはNightingaleと同様に、一部のサービスを無料で提供している。同社のCommunity Edition(コミュニティエディション)では、手持ちのアルゴリズムがある研究者たちが、自分たちのアルゴリズムを無料でテストできる(ただし、自分たちのデータセットをアップロードする必要がある)。
一方、同社の「プレミアム」版の費用を払うのは、AI企業だ。これによって、お金を払っている顧客は、独自のデータセットにアクセスできるようになるとホスゴー氏はいう。そして、必要なデータにはお金を払うという実績もある。現在、Gesundは30の潜在顧客との交渉中だとしていて、今期中に収益を上げる予定だという。
「私たちは2021年11月にシカゴで開催されたRSNAに出席しましたが、話を聞いたあらゆるAI企業から『ああ、もっと早く知りたかったです』という発言を聴きました」。
現在Gesundが調達した資金は今回の200万ドル(約2億3000万円)のプレシードラウンドだけだが、ホスゴー氏は2022年中に再び資金調達を行えることを期待している。近い将来、同社は研究開発に注力しつつ、米国および欧州における臨床提携を拡大する予定だ。
画像クレジット:Gesund
[原文へ]
(文:Emma Betuel、翻訳:sako)