新型コロナの流行で分子科学のクラウドソーシング演算パワーがエクサフロップ級に

分子相互作用を解明するという複雑なタスクを、長い間クラウドソーシングによって運営してきたFolding@Homeプログラムが、大きな節目を迎えている。多くのユーザーが新規登録して自身のコンピューターの演算パワーの提供を始めたからだ。ネットワークが現在提供する計算パワーは「エクサフロップ」に達した。これは1秒あたり100京(1,000,000,000,000,000,000回)の演算を行えるということだ。

Folding@Homeが始まったのは約20年前。このプロジェクトは多大な計算量を要求する問題を適当な大きさに分割し、個々のコンピューターに割り当てる手段を提供するために登場した(現在は休眠中のSETI@Homeが切り拓いた、斬新な方法だった)。これはいわば、世界中に分散しているスーパーコンピュータに相当する。計算を一気呵成に行う「本物の」スーパーコンピューター程は効率的ではないものの、複雑な問題を短時間で処理することが可能だ。

セントルイスのワシントン大学の研究グループによって管理されているこのツールが対象としている問題は、タンパク質の折り畳み問題(Protein Folding)である。タンパク質は私たちの体を機能させている多くの化学構造物の1つであり、それらは比較的よく理解されている小さな分子から、本当に巨大なものまでさまざまなものが存在している。

タンパク質の性質は、温度、pH、他の分子の有無などの条件によって形状が変化することだ。この形状の変化によって、しばしばそれらは役に立つものとなる。たとえば、キネシンタンパク質は、一対の脚のような形状に変化して、物質を細胞内で運ぶ役割を果たすようになる。またそれとは別に、イオンチャネルのようなタンパク質は、その鍵穴に鍵のように差し込まれる別のタンパク質が存在する場合にのみ、荷電原子を通過させる。

画像クレジット:Voelz et al

こうした変化、もしくは畳み込み(Convolutions)の中には、よく解明されているものもあるが、ほとんどのものは完全に未知なままである。しかし、分子とその周囲に関する堅実なシミュレーションを行うことで、重要な発見につながる可能性のあるタンパク質の新しい情報を発見できる。例えば、あるイオンチャネルが開いているときに、別のタンパク質がそのチャネルを通常よりも長く開けたままにしておけたり、素早く閉じることができるとしたらどうだろうか?このような条件を見つけることが、この種の分子科学で一番大切なことなのだ。

だが残念ながら、そのための計算コストは、非常に高価なものとなる。これらの分子間および分子内の相互作用は、スーパーコンピュータがあらゆる組み合わせの可能性を、果てしない計算を通して試していかなければならない種類の問題なのだ。20年前には、スーパーコンピュータは現在よりもはるかに珍しいものだった。そのため5億ドル(約545億円)でCrayを導入する代わりに、この手の重い計算タスクをこなすためにFolding@Homeが始まったのだ。

このプログラムは誕生以来ずっと継続していて、SETI@Homeが自身の代替物としてこのプログラムを多数の既存ユーザーに推薦したときには、ユーザーが一気に増加した。そして今回、コロナウィルスの危機によって、自分のリソースをより大きな使命に提供するという考えが俄然魅力的なものになった。こうして多数のユーザーが増えたために、いまでは各人のコンピューターに解くべき問題を振り分けるためにサーバーが大忙しになっている。

Folding@Homeによって視覚化された新型コロナウイルス関連タンパク質の例

記念すべきマイルストーンは、エクサフロップの計算パワーの達成である。これは毎秒100京(10の18乗)回の演算に相当するはずだ。1回の演算はANDやNORのような論理演算であり、それらを組み合わせることで数式が表現される、その積み重ねによって、最終的に「摂氏38度以上の温度で、このタンパク質は変形し、薬物がこの部位に結合して、それを無効にする」といった有用な知見が引き出されるのだ。

エクサスケールコンピューティングは、スーパーコンピューターが目指す次の目標だ。IntelCrayは、国立研究所向けに今後数年後の稼働を目指してエクサスケールコンピューターを構築中である。だが、現在稼働中の最速のスーパーコンピューターの速度は数百ペタフロップス程度である。これはエクサフロップのおよそ半分から3分の1程度の速度だ。

当然、これら2つは直接比較することはできない。Folding@ Homeは個々の計算パワーを統合することでエクサフロップに相当する計算パワーを生み出しているが、他のエクサスケールシステムののように単一の問題を解くための単一のユニットして動作しているわけではない。ここで使われる「エクサ」というラベルは、スケール感を表現するためにつけられているのだ。

この種の分析はコロナウイルス治療につながるのだろうか?おそらく将来的には。だが近い将来に即効性があるということはないだろう。タンパク質の構造と機能を大規模に研究するプロテオミクスは、私たちの周り(そして私たちの中)の世界を、よりよく理解することを中心テーマとした「基礎研究」なのだ。

新型コロナウイルスは、パーキンソン病、アルツハイマー病、ALSなどと同様に、単一の問題ではなく、未知のものが広がった境界のはっきりしない大きな塊である。プロテオーム(対象にするタンパク質の総体)と関連するそれらの相互作用はその塊の一部なのだ。重要なのは、魔法の弾丸を見つけることではなく、理解のための基礎を築くことだ。そうしておくことで、潜在的なソリューションを評価する際に、この状況では、この分子が、あのように機能することを、たとえ1%程度だとしても速く判断することができるようになるのだ。

なおプロジェクトはブログ投稿の中で、新型コロナウイルス関連タスクの開始を発表している。

このプロジェクトの最初のタスクでは、コロナウィルスがヒト宿主細胞へのウイルスの侵入に必要な、ヒトACE2受容体とどのように相互作用するかをよりよく理解し、その相互作用を阻害する可能性のある新しい治療用抗体や低分子をデザインすることによって、研究者がコロナウィルスにどのように干渉できるかに焦点を当てます。

研究に協力したい場合には、Folding@Homeクライアントをダウンロードして、余っているCPUとGPUサイクルを提供することができる。

画像クレジット: Science Photo Library – PASIEKA / Getty Images

新型コロナウイルス 関連アップデート

原文へ

(翻訳:sako)