今週から、ひと握りの学術研究チームが、世界最大のソーシャルネットワーク上のほぼすべてのデータをリアルタイムに集約するために設計された、Facebook(フェイスブック)の新しいツールにアクセスできるようになった。
誰がどのようにFacebookのデータにアクセスできるのかということに関しては、現在Meta(メタ)となったFacebookは、2018年に起きたケンブリッジ・アナリティカ(CA)のスキャンダルの余波をいまだに受けている。このスキャンダルでは、政治コンサルティング会社であるCAが何百万人もの無自覚なFacebookユーザーの個人データを入手し、有権者に関する詳細なプロファイルを構築した。Facebookはその後の3年間、何千ものAPIを停止していたが、ようやく学術研究のための幅広いアクセスを再開し始めたところだ。
TechCrunchは、このFacebookの新しい学術研究用APIをプレビューし、さらにFacebook Open Research & Transparency(FORT)チームでこのプロジェクトを率いたFacebookプロダクトマネージャーのKiran Jagadeesh(キラン・ジャガディーシュ)氏に話を聞いた。
関連記事:フェイスブックがSNSを研究する学術コミュニティ向けに「Researcher API」リリース予定
ジャガディーシュ氏はTechCrunchに「これは始まりに過ぎません」と語り、このResearcher API(リサーチャーAPI)は同社が最終的に提供したいツールキットのベータ版であると説明した。2021年のF8で初めて発表されたこのAPIは、Python(パイソン)ベースで、オープンソースのノートブックインターフェースであるJupyterLab(ジュピターラボ)上で動作する。
Facebookが遭遇した過去の多くのプライバシー問題が考慮されて、新しいResearcher APIには最初にいくつかの注意が払われている。まずこのAPIは、少数の身元の確かな学術研究者にのみ、招待制で提供される。2022年2月には、最初のテストグループ以外にもアクセスを拡大することが計画されている。そこではトライアルで得られたフィードバックをもとに、すべての学識経験者に広く提供が行われる予定だ。
もう1つの注意点は、このResearcher APIが、ジャガディーシュ氏が「デジタル・クリーンルーム」と表現する、厳しくコントロールされた環境で動作するということだ。APIにアクセスできる学術研究者は、FacebookのVPNを介して環境に入り、データを収集して数値計算を行うことができるが、生データではなく分析結果のみがエクスポートできる。
これは、ユーザーのプライバシーを保護し、分析されたデータからユーザーが再識別されることを防ぐためのものだが、Researcher APIが収集する公開データはすでに出回っているものなのに、Facebookの既存ツールでは集約して分析するのが難しいという制限は、同社の批判者の一部を刺激するかもしれない。
このAPIでは、ページ、グループ、イベント、投稿の4種類のリアルタイムFacebookデータにアクセスできる。いずれの場合も、このツールは公開データのみを利用し、当初は米国およびEU内のソースからのみの抽出を行う。グループとページについては、APIでデータを利用するためには、少なくとも1人の管理者がサポート対象国にいる必要がある。
このツールを使うことで、研究者は大量の生のテキストを感情分析のような手法を使って分析することができる。なお感情分析とは、人があるテーマについて話すときに、その人が表現している価値や感情を追跡するものだ。研究者は、データの大半を占めるテキストベースの投稿に加えて、グループやページの説明、作成日、投稿へのリアクションなどの関連情報にもアクセスすることができる。ただし生の画像のようなマルチメディアデータや、コメント、ユーザーの属性データ(年齢、性別など)は含まれない。また、このAPIはInstagramからデータを収集することもないが、ジャガディーシュ氏は、研究者にとってInstagramは非常に価値のあるプラットフォームであることを認識していて、彼のチームはInstagramのデータを利用できるようにする方法を模索している最中だ。
FORTチームは、学術研究者と密接に協力して、ジャガディーシュ氏が「現在進行形」と表現する現在のツールを開発・構築していきたいと考えている。Metaは、最初のアカデミックパートナーはまだ決まっていないとしながらも、開始にあたって世界の23の学術機関から研究者を招待している。
チームのオンボーディングプロセスを完了し、プライバシーポリシーに同意した研究者には、米国時間11月15日(月)にアクセスが許可された。Facebookは、研究内容にアクセスする人に対して、データ内の特定の個人を再識別しないことなどを含む、プライバシーに関する制約に同意することを求めている。
現在、この研究用APIはひと握りの学術機関のみに提供されているが、FORTチームはジャーナリストを含む他のグループへのアクセス許可を検討する予定だ。その目的は、研究者やジャーナリストたちに、チームが何を目指しているのかを透明性をもって示す、公開ロードマップを作ることだ。
同社は、研究コミュニティでの信頼を築くために多くの努力を払わなければならない。8月にFacebookは、ニューヨーク大学のCybersecurity for Democracy(民主主義のためのサイバーセキュリティ)プロジェクトに所属する、著名な研究者2名の広告データへのアクセスを遮断し、多くの学者や規制当局の非難を誘発した。この研究者たちは、Ad Observer(アド・オブザーバー)と呼ばれるオプトイン方式のブラウザツールを使って、誤報や政治広告の追跡に焦点を当てていた。9月になってFacebookは、Social Science One(ソーシャル・サイエンス・ワン)と呼ばれるエリート研究者グループに対し、不完全なデータを提供したことを謝罪したが、これは数カ月にわたる作業と分析を台無しにするミスだった。
関連記事
・・Facebookが2020年の米大統領選挙に関する広告のターゲティングデータを研究者に公開
・フェイスブックがニューヨーク大学研究者からのアクセスを遮断、議員から反発を受ける
・・フェイスブックが「Meta」に社名変更、メタバースを中核事業に
画像クレジット:TechCrunch
[原文へ]
(文:Taylor Hatmaker、翻訳:sako)