2020年末、DeepMind(ディープマインド)は、同社のAIモデルAlphaFold2(アルファフォールド2)がタンパク質の構造を正確に予測(一般的で非常に難しい問題だ)することで生物学界を驚かせた。数十年来の問題を「解決できた」と多くの人が宣言したからだ。今回研究者たちは、このときDeepMindが世界を飛び越えてみせたように、今度はRoseTTAFold(ロゼッタフォールド)でDeepMindを飛び越えたと主張している。RoseTTAFoldは、わずかな計算コストでほぼ同じことを行うシステムだ(しかも無料で使用できる)。
AlphaFold2は、2020年11月に開催されたCASP14(タンパク質を構成するアミノ酸の配列から、その物理的構造[フォールディング]を予測するアルゴリズムを競う仮想イベント)で競合他社を圧倒し、業界の話題となった。DeepMindのモデルは、他のモデルをはるかに凌駕し、非常に高い信頼性のある精度を誇っていたため、この分野の多くの人たちが(半ば真剣に、そしてユーモアを持って)新しい分野への転身を口にしていた。
しかしDeepMindによるこのシステムの計画だけは、誰も満足させていないように思えた。その内容が網羅的かつオープンに記述されていなかったため、(Alphabet / Googleが所有する)DeepMindが、秘密のソースを多かれ少なかれ独り占めしようとしているのではないかと心配する人もいたのだ。もちろんそれは彼らの特権ではあるものの、科学の世界における相互扶助の精神にはやや反するものだと思われた。
【更新】ちょっとしたサプライズだが、DeepMindは米国時間7月15日に、手法に関するより詳細な内容を「Nature」誌に発表した。コードはGitHubで公開されている。このことにより、前述の懸念はかなり軽減されたものの、以下に説明した先進技術の内容にはまだ十分意味がある。記事の最後にはチームからのコメントも付けておいた。
関連記事
・Alphabet傘下のAI技術企業DeepMindがAIベースのタンパク質構造予測で歴史的なマイルストーン
・新型コロナ治療に道を開くワシントン大ベイカー教授の研究に3.2億円のブレークスルー賞
この懸念は、ワシントン大学のDavid Baker(デビッド・ベイカー)氏とMinkyung Baek(ミンギヨン・ベイ)氏を中心とする研究者が、最新の科学誌『Science』に発表した研究によって、少なくとも部分的には解消されたようだ。ベイカー氏は、ご存知の方もいると思うが、人工的に作られたタンパク質を用いて新型コロナウイルス(COVID-19)に対抗する研究でBreakthrough Prize(ブレイクスルー賞)を受賞したばかりだ。
研究チームが開発した新モデルRoseTTAFold(AlphaFold2の手法を参考にしたとベイカー氏がメールで率直に答えている)は、AlphaFold2に匹敵する精度で予測を行うことができる。
ベイカー氏は「AlphaFold2グループは、CASP14ミーティングでいくつかの新しいハイレベルなコンセプトを発表しました。そうしたアイデアからスタートし、グループの仲間と一緒にブレインストーミングを重ねたことで、ミンギョンはわずかな時間で驚くほどの成果を上げることができました」と語った(「彼女は本当にすごいよ!」と彼は付け加えた)。