【コラム】ソーシャルメディアは科学と「根本的に対立」している可能性がある

米国時間2月11日に発行されたScience(サイエンス)に掲載された特別論説が、現在の形式のソーシャルメディアは、事実や道理を提示したり広めたりする目的には根本的に適していないのではないかと論じている。論説は、現在はアルゴリズムが主導権を握っており、システムの優先順位は残念ながら逆になっていると主張している。

ウィスコンシン大学マディソン校のDominique Brossard(ドミニク・ブロサール)氏とDietram Scheufele(ディートラム・ショイフル)氏は、その鋭い(そして無料で読むことができる)意見の中で、科学者が必要とするものとソーシャルメディアプラットフォームが提供するものとの間の基本的な断絶について説得力のある説明を行っている。

彼らは「科学的な議論のルールや、証拠の体系的、客観的、透明な評価は、ほとんどのオンライン空間における議論の実態と根本的に対立している」と述べる。「ユーザーの怒りや意見の相違を収益化するように設計されたソーシャルメディアプラットフォームを、懐疑的な人々を説得するために用いる(たとえば気候変動やワクチンは確立した科学領域では議論の余地はないということ)ことが、生産的な手段であるかどうかには疑問が残る」。

科学者によるコミュニケーションの効果を減少させるソーシャルメディアの最も基本的な特性は、広汎な分類ならびに推奨エンジンの存在だ。これにより、ブロサール氏とショイフル氏が「homophilic self-sorting(同一傾向自己分類)」と呼ぶものが生みだされる。つまり、あるコンテンツを見せられる人は、すでにそのコンテンツに馴染んでいる人なのだ。言い換えるなら、彼らは聖歌隊に向かって説教しているのだ。

「科学に好意的で好奇心旺盛なフォロワーを、科学者のTwitter(ツイッター)フィードやYouTube(ユーチューブ)チャンネルに連れてくるのと同じ営利目的のアルゴリズムツールが、一方では最も緊急に科学を必要としている人たちから、科学者をますます遠ざけることになるだろう」と彼らは書いている。ここには、明らかな解決策は存在しない「その原因は、科学情報のエコロジーにおけるパワーバランスの地殻変動にある。ソーシャルメディアプラットフォームとその基盤となるアルゴリズムは、急速に拡大する情報の流れをふるいにかけようとする受け手の能力を上回り、その過程で感情的・認知的な弱点を利用するようにデザインされている。このような事態になっても不思議はない」。

Scienceの編集長であるH. Holden Thorp(H・ホールデン・ソープ)氏はいう「だがそれはFacebook(フェイスブック)にとって収益化の良い手段なのです」。

このテーマで論説も書いているソープ氏は、私に対して、最近の科学者とソーシャルメディアの関わり方には、少なくとも2つの明確な問題があると話してくれた。

「その1つは、特にTwitterでは、科学者たちがそれを使って、詳しく議論したり、アイデアを公然と広めたり、支持したり、撃墜したりするのが好きだということです。これらはかつて、科学者たちが黒板を囲んだり、会議をしている時にやっていたことです」と彼はいう。「こうしたことはパンデミック以前から行われていましたが、今ではそのようなやりとりが行われる主要な手段となっています。その問題点は、もちろん、今や永久的な記録が残るようになっているということです。そして、通常の科学の検討過程では当然破棄されるような、一度は提出されたものの間違っていることが判明した仮説のいくつかが、私たちのやっていることを台無しにしようとしている人々によって選ばれてしまうのです」。

そして「2つ目は、素朴すぎるアルゴリズムです。特にFacebookのアルゴリズムは、意見の相違や意見の相違を広める非公式な投稿に非常に高い評価を与えています。たとえば『私の叔父はマスクをして教会に行ったが、新型コロナウイルスに感染した』というような情報も、拡散すれば権威ある情報に勝るものとして扱われることになるでしょう」と彼は続けた。

ブロサール氏とショイフル氏が指摘するように、このような状況が重なると、科学者は「明らかに不利な立場に置かれる【略】わかりやすい結論よりも、専門的な規範や倫理的立場から信頼性のある累積的な証拠を優先する、公開討論における少数派のようなものだ」。

関連記事:ソーシャルメディアCEO3人が米下院公聴会で反ワクチン誤情報アカウントを削除するか聞かれ言葉を濁す

残念ながら、科学的な面では誰もができることではない。間違いなく、システムに参加すればするほど、自分の周りのサイロを強化することになる。私たちはあきらめるべきだと主張する者はいないものの、問題は科学コミュニティが、ソーシャルメディア上で偽情報の行商人たちよりも発信力が弱いことだけではないということを認識する必要がある。

ソープ氏は、これは数十年前から続く反事実主義的な傾向と政治化の最新局面に過ぎないと認めていいる。

「人々は、これが非常に単純なことであることを認識せずに、少し感情的になっている傾向があると思います。たとえば政党は同じ立場を取ることはないでしょう、すると片方が科学的に厳格な場合、もう1つは科学に反する立場をとることになります」と彼は説明する。彼は、民主党が科学の側に立つことが多いのは確かだが、遺伝子組み換え作物や原子力では反対側に立ったこともあると指摘した。重要なのは、誰が何に賛成しているかではなく、2つの政党が反対の意見を唱えることで自らを定義していることだ。

「これは、科学に賛成するよりも、科学に反対する方が政治的に有利だということに気づいた政党の振る舞いなのです」と彼はいう。「なので科学者がただ『メッセージが伝わらない』と言っているのは呑気な態度なのです、彼らが直面しているのは、今やFacebookの力を背景にした政治マシーンなのですから」。

ブロサール氏とショイフル氏は、最後の論点として、Deep Blue(ディープ・ブルー)によるGarry Kasparov(ガルリ・カスパロフ)氏の敗北を示した。その敗北後、スーパーコンピュータを出し抜くための特別なトレーニングを追求するひとはおらず、カスパロフ氏のプレイが不十分だと非難するひともいなかった。そのショックが去った後、我々はチェスだけでなく、コンピューティングとアルゴリズムの可能性においても新しい局面を迎えたことは誰の目にも明らかだった(少し前に、カスパロフ氏自身も私に対して、その見解が進化したことを語ってくれた)。

「科学者にも同じ理解が求められている」と彼らは書いている。「公共の場における議論に、事実と証拠を用いた情報を持ち込む新しい時代であり、良い方向に変化しているものもあるのだ」。

画像クレジット:erhui1979 / Getty Images

原文へ

(文:Devin Coldewey、翻訳:sako)

科学者である創業者たちに議決権を譲渡するアクセラレーターかつファンドのSciFounders

2021年1月に600万ドル(約6億8000万円)の支援を受けて設立された、アクセラレータープログラムかつファンドのSciFounders(サイファウンダーズ)が、科学者である創業者たちが自分の会社を経営することを支援する新しい提案をしている。通常は投資にともなって得られる議決権を、投資対象の一部のチームに与える計画を立てているという。

なぜそれが重要なのだろうか?まあ、いろいろな意味で時代の流れを感じる。ベンチャーキャピタルは創業者に多くの要求をすることで知られてきたが、その一方でここ数年はトップの座を維持するためにあらゆる努力をしている。新しいオフィスを開設したり、独自の編集部門を設けたり、記録的な速さでタームシートを提供したり、資金調達を完了した直後の創業者への各種チェックを免除したりという具合だ。このため創業者は運転席に悠々と座ってきた。

しかし、SciFoundersの共同創業者であるMatt Krisiloff(マット・クリシロフ)氏は、SciFoundersの考えにはそれ以上のものがあるという。SciFoundersは、学界で満足できるポジションを得られない博士号取得者の増加に対応するために2021年設立された組織だ。

クリシロフ氏自身も、幹細胞を人間の卵子に変換するバイオテック企業Conception(コンセプション)を創業者として経営を行っているが、特にバイオテック企業の創業者たちが会社をコントロールできなくなるのを見るのはうんざりだと語る。

クリシロフ氏は「こうしたスタートアップ企業は、非常に多くの資本を必要とするため、このようなことが頻発するのです」と指摘する。「ソフトウェア企業なら数千ドル(数十万円)のプレシード資金でを立ち上げることができますが、ライフサイエンス企業の場合はおそらく数百万ドル(数億円)の資金が必要です」。このため創業者にとっての状況はいとも簡単に変わってしまい、所有権も発言権も弱められてしまうのだ。

彼の組織が望んでいるのは、科学者たちがより多くの力を発揮できるようにすることであり、それがSciFoundersから提供できるなら望むところだ。クリシロフ氏は「ソフトウェアの世界でStripe(ストライプ)のCollison(コリソン)兄弟やAirbnb(エアービーアンドビー)の創業者が自分の会社を取り仕切っているように、科学者が『私たちがすべてを担当する一級市民です』と言えることは、長期的にはすばらしいことだと考えています。私たちは、科学者の創業者の世界にも、そのようなことが広く行われるようにしたいと考えているのです」と語る。

SciFoundersは、これまでに7社に40万ドル(約4550万円)を提供し。10%の株式と引き換えにメンターシップを提供してきたが、この規模の企業が与えられる影響は限られている。

会社の課題について少なくとも発言権を持つことができる、議決権という現在のリミテッドパートナーが自由に使える数少ない手段を手放すようなVCに、賛同するパートナーはあまりいないだろうと私たちが言っても、クリシロフ氏がたじろぐ様子はなかった。

その動きをどこかで始めなければならないと彼は考えているのだ。さらに、SciFoundersは、学術関係者がこれまで受けてきたよりも多くの助言を行うことで、すでに神経を逆なでしていると考えている。クリシロフ氏によると、現在SciFoundersが支援しているのは7つのチームだが「イテレーションサイクルには非常に長い時間がかかる」ため、アクティブな支援は最長で1年間を予定している。その一方で、現在1000件以上の応募を抱えているが、その多くはツイッターでSciFoundersのローンチを告知した後に到着したものだ。

SciFoundersは、Y Combinator(Yコンビネーター)と提携して研究プロジェクトのポートフォリオを運営していたクリシロフ氏に加えて、分子生物学者でGenentech(ジェネンテック)の博士研究員だったAlexander Schubert(アレクサンダー・シューベルト)氏と、Mammoth Biosciences(マンモス・バイオサイエンス)の共同創業者で最高科学責任者のLucas Harrington(ルーカス・ハリントン)氏が共同で設立した。

ハリントン氏とMammoth Biosciencesを創業した、他の3人の共同創業者の中には、CRISPR-Cas(クリスパー・キャス)ゲノム編集技術の発明者であるJennifer Doudna(ジェニファー・ダウドナ)氏がいる。ダウドナ氏は長年の共同研究者であるEmmanuelle Charpentier(エマニュエル・シャルパンティエ)氏とともに2020年ノーベル化学賞を受賞した。

画像クレジット:Andrew Brookes/Cultura/Getty Images

原文へ

(文:Connie Loizos、翻訳:sako)

マイクロソフトはクラウドコンピューティングで自然災害モデルの再構築を目指すが課題は残る

気象予測は難しい分野として知られているが、地球の日常機能の理解のためには、この分野がますます重要になってきている。気候変動により、山火事や台風、洪水やサイクロンなどの自然災害の規模や被害が拡大している。災害がいつ、どこで発生するかを正確に知ること(あるいは数時間前に知らせること)は、被災者の状況に大きな違いをもたらす。

この分野を、Microsoftは、自社のクラウドコンピューティングサービスであるAzureにとって、利益を生むニッチな分野であると同時に、良いことをする機会でもあると考えている。2017年の立ち上げ時にTechCrunchが取り上げたAI for Earthプログラムを通して、Microsoftは一連のサービスを「Planetary Computer(プラネタリー・コンピュータ)」と呼ぶものにまとめた。このプログラムは、物体や動植物の種類を識別するためのAPIを含んでいる。AI for Earthは、科学者などが自らの研究やモデリングにAzureを利用するための助成金を提供しており、このプログラムは、AI for HealthAI for Accessibilityといった他のMicrosoftのクラウドイニシアチブに加わる。

関連記事:AI利用のヘルスケアの実践や研究を支援するマイクロソフトのAI for Health事業

私はこの数カ月間、災害対応のあらゆる側面に注目していたため、Planetary Computerと呼ばれるものの性能はどうなのか、自然災害のモデリングを改善するための障壁はどこにあるのかに興味を持っていた。このプロジェクトのプログラムディレクターであるBruno Sánchez-Andrade Nuño(ブルーノ・サンチェス=アンドラーデ・ニーニョ)氏は、このプロジェクトの野望はこれまでと同様に強いものであると語った。

「目標は、誰もが地球の生態系を管理できるようにするためのPlanetary Computerを手に入れることです。それは災害が起きた時の唯一の有効手段ですから」。このプログラムは「削減、対応、復興」に焦点を当てているが、できるだけ早く決断を下さなければならない「対応」が最も興味深い段階だ。

サンチェス=アンドラーデ・ニーニョ氏は、ここ2、3年の間に、特に環境に関連する領域でAIが驚異的な速さで進歩していると指摘した。「AIは多くの人が考えているほど多くのデータを必要としないのです」と彼は言った。「アルゴリズムに多くの進展がありましたし、私たちは、AIを理解し、非常に効率的な深層学習(モデル)を構築する方法を人々に理解してもらうために、多くの仕事をしています」。

地球システムにAIを適用する際の大きな課題の1つは、モデリングを成功させるために必要な専門分野の数だ。しかし、多くの分野は互いに隔てられており、科学者とAI研究者の間にはこれ以上ないほどのギャップがある。サンチェス=アンドラーデ・ニーニョ氏は、地球が直面する最も困難な課題に立ち向かうために、このプログラムがあらゆる分野の人々を継続的に巻き込む機会になると考えている。

「科学者のコミュニティには、より多くの知識を生み出したいというインセンティブがありますが、モデラーにとっては、良い答えをすばやく生み出したいというインセンティブがあります」と彼は説明した。「どうやって不確実性の中で迅速な意思決定を行えるでしょうか?」。

このギャップを埋める方法の1つが「アップスキリング」と彼が呼ぶ、科学者にAIのトレーニングを提供することだ。「これはすべて、環境分析をより速く、より良く行えるようにするという、同じ戦略の一環です」。特に地理分析分野ほど難しいものはない。「コンピュータは一次元を得意としていますが、近くにある複数のものを扱うのは苦手です」。彼は、もともと宇宙物理学を専攻していたが、GIS(地理情報システム)の「アップスキル」をしたと語った。

高度なAIスキルを身につけるための労力は、ライブラリが拡充し、一般的なAIモデルがうまく動作するようになり、さらにAIモデルを理解するための膨大な教材が用意されるようになったことで減少している。「かつては博士号が必要でしたが、今では10行のコードが必要です」。

そのAIの能力の増大により、人々はAIがあらゆる惑星規模の問題を解決できると信じ始めている。しかし、それは不可能であり、楽観的な見方をするとすれば、少なくとも今はまだ不可能だ。「私たちはAIの誇大広告を減らそうとしています」と彼はいう。「AIとは何かを知らなければ、それを信用することはできません」。このAI for Earthでは、科学者とAI研究者が一緒になってモデルのアウトプットを理解できるように、多くの取り組みで説明可能性を重視している。

このミッションは、関連する政府機関との連携を強めている。最近、AI for Earthは、米国陸軍エンジニア研究開発センターとパートナーシップを結び、同機関の沿岸監視システムの改善に取り組んでいる。

やるべきことが多くても、多くのモデリングの成熟度は高まっている。サンチェス=アンドラーデ・ニーニョ氏はこう言った。「今はまだ、発展途中の段階です。多くのプロセスで、必要以上にアドホックな処理が必要になっています」。良いニュースは、ますます多くの人々がこの分野に足を踏み入れ、点と点を結びつけようとしていること、そしてその過程で世界の災害対応能力を向上させようとしていることだ。

関連記事:テクノロジーと災害対応の未来4「トレーニング・メンタルヘルス・クラウドソーシング、人を中心に考えた災害対応スタートアップ」

画像クレジット:EDUARD MUZHEVSKYI / SCIENCE PHOTO LIBRARY / Getty Images 

原文へ

(文:Danny Crichton、翻訳:Yuta Kaminishi)

新型コロナのアルファ株・デルタ株変異体発見に貢献、ゲノム情報に特化した情報共有プラットフォームのSeqera Labsが約6億円調達

ビッグデータ時代の現在、あらゆる場所に存在する非構造化情報に秩序をもたらして理解するということは、最も重要なブレークスルーの1つだろう。ライフサイエンス分野において、この課題に取り組むためのプラットフォームを構築してきた欧州のスタートアップ(同社のプラットフォームは複数の研究所によって新型コロナウイルスの変異株の配列と特定にも活用された)が現地時間9月7日、より多くのユースケースに対応するためのツールを開発し、北米に進出するための資金調達を発表した。

バルセロナを拠点とするSeqera Labs(セケラ・ラブス)。シード資金として550万ドル(約6億円)を調達した同社は、データオーケストレーションやワークフローのカスタムプラットフォームを提供しており、科学者やエンジニアがクラウドベースのゲノムデータから情報を得たり、複数の場所からの複雑なデータを利用するライフサイエンスの応用に取り組んだりするのを支援している。

今回のラウンドはTalis Capital(タリス・キャピタル)Speedinvest(スピードインベスト)が共同で主導し、以前からの支援者であるBoxOne Ventures(ボックスワン・ベンチャーズ)も参加している。また、Mark Zuckerberg(マーク・ザッカーバーグ)氏とPriscilla Chan(プリシラ・チャン)博士が科学応用のためのオープンソース・ソフトウェア・プロジェクトを支援するために設立したChan Zuckerberg Initiative(チャン・ザッカーバーグ・イニシアチブ)も助成金を提供している。

Seqeraは「sequence(配列)」と「era(時代)」を組み合わせた造語で、シーケンスデータの時代を意味している。同社はこれまで100万ドル(約1億1000万円)以下の資金しか調達してこなかったものの、現在では世界最大の製薬会社5社の他、バイオテクノロジーやその他のライフサイエンス分野の顧客を持ち、収益を伸ばしている。

Seqeraはバルセロナのバイオメディカル研究センターであるCentre for Genomic Regulation(CGR、ゲノム規制センター)からスピンアウトしたもので、Seqeraの創設者であるEvan Floden(エヴァン・フローデン)氏とPaolo Di Tommaso(パオロ・ディトマソ)氏が、オープンソースのワークフローおよびデータ・オーケストレーション・ソフトウェアであるNextflow(ネクストフロー)の商用アプリケーションとしてCGRで構築したのが始まりだ。

SeqeraのCEOであるフローデン氏はTechCrunchに対し、Nextflowがライフサイエンスのコミュニティで多くの支持を得て、その後さらなるカスタマイズや機能を求める多くのリクエストを繰り返し受けたことが、同氏とディトマソ氏が2018年にSeqeraを創設する動機になったと話している。NextflowとSeqeraはともに多くの利用実績があり、Nextflowのランタイムは200万回以上ダウンロードされ、Seqeraの商用クラウドサービスでは現在50億件以上のタスクを処理しているという。

新型コロナのパンデミックのような深刻な課題は、Seqera(およびその関連としてのNextflow)が科学者コミュニティで解決しようとしていることの典型例である。新型コロナの大流行は世界中で発生しており、研究所で新型コロナの検査が行われる度にウイルスの生きた遺伝子サンプルが採取される。こういった何百万件もの検査結果は新型コロナウイルスがいつ、どこで、どのように変異しているかを示す情報の宝庫であり、さらにまだ解明されていない新しいウイルスにとってもこれは非常に貴重なデータとなる。

つまり問題は、より深い洞察を得るためのデータが存在するかどうかではなく(間違いなく存在するからだ)、既存のツールを使ってそのデータを総合的に見ることがほぼ不可能だということなのである。データはあまりにも多くの場所に存在し、その量はあまりにも多く、日々増加し続けている(そして日々変化し続けている)。データを中央に集めて分析を行うという従来のアプローチは効率的ではなく、実行には莫大なコストがかかってしまう。

そこで登場するのがSeqeraだ。同社のテクノロジーでは異なるクラウド上の各データソースを重要なパイプラインとして扱い、データがすでに存在しているインフラの境界を離れることなく、1つのボディとして統合・分析することができる。ゲノム情報に特化してカスタマイズされているため、科学者らはその情報を照会してより多くの知見を得ることが可能だ。新型コロナウイルスが世界中で猛威を振るう中、Seqeraはアルファ株とデルタ株の両方の変異体の発見に貢献したのである。

同社はいわゆる「プレシジョン・メディシン」の領域など、他のタイプの医療応用でも使用されており、がんなどの複雑な分野では非常に大きな可能性を秘めている。がんは患者自身の遺伝子の違いなど、多くの要因によって変異や行動が異なるため、画一的な治療では効果が出にくいためだ。

機械学習やビッグデータ解析を活用して、個々のがんやそれが異なるグループ間でどのように発症するかを理解してより個別化された治療法を生み出すアプローチが近年増えているが、Seqeraはそのようなデータをシーケンスする方法を提供しようと取り組んでいる。

Seqeraプラットフォームのもう1つの特徴として、データの専門家でなくてもデータを分析する人、つまり研究者や科学者自身が直接利用できるという点が挙げられる。同社にとってこれは優先事項だったとフローデン氏は話しているが、高度に技術的なプロセスを技術者ではない人々が使えるように設計された、今流行の「ノーコード・ローコード」ソフトウェアをこのプラットフォームが意図せずして取り入れているというのは興味深い事実である。

既存の可能性と、将来的にクラウド上に存在することになる他の種類のデータにSeqeraをどのように適用していくかという両点が、この会社を興味深いものにしており、また投資先としても興味深いものとして考えられているのだろう。

Talis CapitalのプリンシパルであるKirill Tasilov(キリル・タシロフ)氏は声明の中で次のように述べている。「機械学習の進歩とデータの量と種類の増加により、ライフサイエンスや生物学におけるコンピューター科学の応用がますます増えています。これは人類にとって非常にエキサイティングなことですが、一方で、コンピューターを駆使した複雑な実験は、コストが非常にかかり、プロジェクトごとに数百万ドル(数億円)になることもあります。Nextflowはすでにこの分野ではユビキタスなソリューションであり、Seqeraはその機能を企業レベルで推進しています。その過程で彼らはライフサイエンス業界全体を近代化しているのです。Seqeraの今後に関わって行けるということに、弊社は胸を躍らせています」。

SpeedinvestのプリンシパルであるArnaud Bakker(アルノー・バッカー)氏は「安価で商業的なDNAシーケンシングによる生物学的データの爆発的な増加にともない、増え続ける複雑なデータを分析する必要性が高まっています。Seqeraのオープンでクラウドファーストなフレームワークがもたらす高度なツールキットにより、組織は複雑なデータ分析の展開を拡大し、データ駆動型のライフサイエンスソリューションを実現することができるでしょう」と話している。

現在のSeqeraにとって、医療やライフサイエンス分野は最もタイムリーで明らかな活用分野ではあるものの、もともと遺伝学や生物学のために設計されたこのフレームワークは他のさまざまな分野にも応用することができる。AIトレーニング、画像解析、天文学の3つが初期のユースケースだとフローデン氏はいうが、天文学には限度がないため非常に適した分野なのではないだろうか。

「私たちは、現在が生物学の世紀であると考えています」とフローデン氏。「生物学は活動の中心であり、またデータ中心になりつつあります。我々はそれに基づいてサービスを構築しているのです」。

Seqeraは今回のラウンドでの評価額を公開していない。

画像クレジット:zhangshuang / Getty Images

原文へ

(文:Ingrid Lunden、翻訳:Dragonfly)

データ量の多い科学の再現をサポートし科学者たちのコラボを容易にするCode Ocean

科学のあらゆる分野で、ビッグデータとその分析への依存度が高まっている。そのため、フォーマットやプラットフォームがますます混乱に陥っている。これは不便なだけでなく、査読プロセスや研究の再現に支障をきたす。Code Ocean(コード・オーシャン)は、あらゆるデータセットや手法に対応した柔軟で共有可能なフォーマットとプラットフォームを提供することで、科学者同士のコラボレーションを容易にしたいと考えており、その構築のために総額2100万ドル(約22億8100万円)を調達した。

科学界には確かに「選択肢がどんどん増えていってしまう」といった雰囲気がある(これに関するXKCD漫画もある)。しかしCode Oceanは、Jupyter(ジュピター)やGitLab(ギットラブ)、Docker(ドッカー)のような成功したツールの競合製品を作っているわけではない。Code Oceanが作っているのは、データや分析に必要なすべてのコンポーネントを、どのようなプラットフォーム上であっても簡単に共有できる形式にまとめることができる小規模なコンテナプラットフォームだ。

問題となっているのは、自分がやっていることを他の研究者と共有する必要があるときだ(相手がすぐ側にいても、国内の大学にいても同じ)。再現する時は、他の科学技術と同じように、データ解析をまったく同じ方法で行うことが重要だ。しかし、他の研究者が同じ構造、フォーマット、表記、ラベルなどを使うという保証はない。

仕事を共有するのが不可能なわけではない。しかし、同じ方法を用いているか、同じバージョンのツールを同じ順番で使っているか、同じ設定で使っているかなど、複製や反復を行う人が何度も確認しなければならないため、多くの余計なステップが必要になる。小さな不整合は、将来的に大きな影響を及ぼす可能性がある。

この問題は、多くのクラウドサービスが生み出される過程に似ていることがわかった。ソフトウェアの展開は科学実験のように難しいが、その解決策の1つがコンテナだ。コンテナとは、小さな仮想マシンのようなもので、コンピューティングタスクを実行するために必要なものすべてを、さまざまなセットアップに対応するポータブルなフォーマットで管理する。この方法は、研究の世界にも当然当てはまる。データ、使用したソフトウェア、ある結果を得るために使用した特定の技術やプロセスを、1つのパッケージにまとめておくことができるからだ。Code Oceanは、このプラットフォームと「Compute Capsules(コンピュート・カプセル)」を提案している。

画像クレジット:Code Ocean

あなたは微生物学者で、ある筋肉細胞に対する有望な化合物の効果を調べているとしよう。あなたはUbuntuパソコンのRStudioでRを使用しており、データはin vitro観察で収集したものだ。発表する際にこれらのことをすべて公開しても、すべての人がRStudioが動作するUbuntuのパソコンを持っているとは限らないので、たとえあなたがすべてのコードを提供したとしても、それが無駄になるかもしれない。

しかし、このようにCode Oceanに載せれば、関連するすべてのコードが利用可能となり、クリックするだけで修正されずに検査・実行できたり、ユーザーが特定の部分が気になる場合には、その部分を微調整したりすることができる。Code Oceanは、単一のリンクとウェブアプリ、クロスプラットフォームで動作し、ドキュメントや動画のようにウェブページに埋め込むこともできる。(以下ではその方法を試してみるが、私たちのバックエンドは少し好き嫌いが激しい。カプセル自体はこちらを参照。)

さらに、コンピュート・カプセルは、新しいデータや修正を加えて他の人が再利用することができる。もしかしたら、自分が公開している技術は、適切にフォーマットされたデータを与えれば機能する汎用のRNA配列解析ツールであり、もし他の人が特定のプラットフォームで利用しようとしたら最初からコーディングしなければならなかったものかもしれないのだ。

他の人のカプセルを複製し、自分自身のデータで実行すれば、その人のカプセルを検証するだけでなく、自分の結果の検証もできる。これは、Code Oceanのウェブサイトを介して行うこともできる他、zipファイルをダウンロードして自分のコンピュータで実行することもできる(互換性のあるセットアップが必要)。その他のカプセルの例はこちらを参照。

画像クレジット:Code Ocean

このような研究手法の相互交換は、科学の世界では古くから行われているが、データを多用する現代の実験では、技術的にはコードを入手できても、共有や検証が容易ではないため、サイロ化してしまうことが多い。つまり、他の研究者が研究を先に進めて自分だけの研究を作り、サイロシステムをさらに強化してしまうのだ。

現在、Code Oceanには約2000のパブリックコンピュート・カプセルが存在し、そのほとんどが発表された論文と関連している。ほとんどのものは、他の人が複製したり、新しいことを試したりするために使用されており、中にはかなり特殊なオープンソースのコードライブラリのように、何千人もの人が使用しているものもある。

もちろん、個人情報や医療上の機密データを扱う場合にはセキュリティ上の懸念があるが、企業向け製品であるCode Oceanでは、システム全体をプライベートクラウドのプラットフォーム上で稼働させることができる。これによりCode Oceanを内輪でのツールとして活用でき、大手の研究機関ではそのこと自体が非常に役に立つかもしれない。

Code Oceanは、コードベース、プラットフォーム、コンピューティングサービスなどをできるだけ包括的に提供することで、最先端のコラボレーション環境を実現したいと考えている。

その野望は他の人の共感を呼んでいる。同社はこれまでに2100万ドル(約22億9400万円)を調達しており、そのうち600万ドル(約6億5500万円)は以前は未公開の投資で、1500万ドル(約16億3900万円)は現地時間5月17日に発表されたAラウンドで調達した。Aラウンドは、Battery Ventures(バッテリーベンチャーズ)が主導し、Digitalis Ventures(ジギタリスベンチャーズ)、EBSCO、Vaal Partners(バール・パートナーズ)をはじめとする多数の企業が参加した。

この資金により、同社はプラットフォームの開発、拡張、普及を進めることができるだろう。運が良ければ、必要性があり、深く統合されていて収益性の高い、事情に精通したSaaS業界にすぐに仲間入りできるはずだ。

関連記事
マイクロソフトが今や1日に1億4500万人が利用するTeamsの開発者向け新機能やツールを発表
クラウドを使わずドキュメント共同編集機能を実現するP2Pソフトウェア「Collabio」
簡単にコラボができる画面共有サービスCoScreenが約5億円調達

カテゴリー:ネットサービス
タグ:Code Ocean科学者資金調達コラボレーションビッグデータ

画像クレジット:Code Ocean

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)