【編集部注】著者のNancy BrinkerはSusan G. Komenの創業者であり、癌の啓蒙に関する国際的コンサルタントである。この記事で示された意見は彼女個人による見解である。また共著者のElad Gil博士はColor Genomicsの会長兼共同創業者である。
癌治療の探求の複雑さは、何十年にもわたって研究者たちを困らせてきた。治療法は目覚ましい進歩を遂げてきたものの、癌は世界の主要な死因の1つとして残っているため、まだまだ厳しい闘いは続いている。
しかし、科学者たちはまもなく、その複雑さを別の方法で攻撃できる重要な新しい味方 — インテリジェント・マシン — を手に入れるかもしれない。
ゲームの世界の例を考えてみよう:昨年Googleの人工知能プラットフォームであるAlphaGoは、この宇宙にある星の数よりも多い動きを擁する囲碁という壮大で複雑なゲームの中で、韓国のグランドマスター李世乭(Lee Sedol)をディープラーニングという技術を用いて打ち負かした。
機械学習とAIに用いられたものと同じ技術を、癌の治療が必要とする大規模な科学的パズルに適用することができる。
1つのことは確かである。より多くのデータを扱うことができなければ、これらの新しい方法で癌を克服することはできない。しかし例えば医療記録や、遺伝子検査、そしてマンモグラムなどを含む多くのデータセットが、私たちの最高の科学する心と私たちの最高の学習アルゴリズムからは手の届かないところに隔離されている。
良いニュースは、がん研究におけるビッグデータの役割が中心に置かれるようになり、大規模で政府が主導する数々の新政策が次々に進んでいることだ。例えばそうしたものの例には、米国退役軍人省のMillion Veteran Program、英国の100,000 Genomes Project、1万1000人以上の患者のデータを保持していて、あらゆる場所の研究者がクラウドを介して分析することができるNIHのThe Cancer Genome Atlasなどが挙げられる。最近の研究によれば、2025年までに20億ものヒトゲノムが配列決定される可能性がある。
遺伝子検査を含んだ新鮮なデータの需要を促進する他の傾向もある。2007年には、1人のゲノムの配列決定には1000万ドルのコストがかかった。現在はこれを1000ドル以下で行うことができる。言い換えれば、10年前は1人に対して配列決定を行ったものと同じ費用で、今は1万人をまかなうことができるのだ。その意味合いは大きい:特定の種類の癌のリスクが高いという突然変異があることを発見することは、ときに命を救う情報にもなり得る。コストが大衆にも手の届くようになるにつれ、研究もより大規模なものになる。
研究者たち(および社会)の主な課題は、現在のデータセットには、量と民族の多様性が欠けていることだ。さらに、研究者はしばしば制限的な法的条項や、共有パートナーシップを嫌う態度に直面する。組織がゲノムデータセットを共有している場合でも、契約は一般的に個々のデータセット毎に個々の機関の間で行われる。今日では偉大な作業を行ってきた大規模な情報センターとデータベースがあるが、アクセスを加速するためには標準化された規約やプラットフォームに関するより多くの作業が必要だ。
これらの新技術の潜在的な利点は、リスクの特定とスクリーニングを超えて行く。機械学習の進歩は、癌薬剤の開発と治療の選択を促進するのに役立つ。医師が患者と臨床試験を組合わせることが可能になり、癌患者のためのカスタム治療計画を提供するための能力を向上させるのだ(最も初期の成功例の1つがハーセプチンだ)。
私たちは、癌研究やAIプログラムにデータを利用しやすくするためには、3つのことが必要だと考えている。第1に、患者がデータを簡単に提供できるようになるべきだ。これは、医療記録、放射線画像、そして遺伝子検査などが含まれる。検査会社と医療センターは、データ共有が容易かつ合法的に行われるように、共通の同意書を採用する必要がある。第2に、AI、データサイエンス、そして癌の交差点で働く研究者には、より多くの資金が必要だ。チャン・ザッカーバーグ財団が医薬品の新しいツール開発に資金を提供しているように、医療アプリケーションのために新しいAI技術へ資金を提供する必要がある。第3に、すべての民族の人びとに焦点を当てて、新しいデータセットが生成されるべきだ。私たちは、癌研究の進歩にすべての人がアクセスできるようにする必要がある。
[ 原文へ ]
(翻訳:Sako)