研究者にデータへの「有意義な」アクセス権を与えることとプライバシーは両立する

欧州委員会の委員らは年末までに起草予定のデジタルサービス法(Digital Services Act :DSA)に盛り込まれる透明性要件を討議中である。これはインターネットプラットフォームに対し拘束力を持つ要件である。しかし、規制当局や研究者にデータへの有意義なアクセス権を提供し、プラットフォームが自ら拡散するコンテンツに対し責任を負うことができるようにするガバナンス構造をどう構築するかという問題は一筋縄ではいかない。

データを外部に公開するというプラットフォーム自身の取り組みは、控え目に言っても困難なものになっている。2018年、FacebookはSocial Science Oneイニシアチブを発表し、厳選された研究者グループに対し約1ペタバイト相当のデータおよびメタデータを共有するアクセス権を提供すると述べた。しかし、研究者がデータにアクセスできるようになるのに約2年かかった。

「私の人生の中で最もストレスのたまる出来事でした」と、このイニシアチブに参加した研究者の1人は今年始めProtocolに語った。公開されるデータを厳密に決めるFacebookとの交渉は20ヶ月にも及んでいた。

Facebookの政治的広告アーカイブAPIも同様に研究者を苛立たせている2019年、Mozillaは「Facebookは自らのプラットフォームに掲載される全広告の全体像をつかむことを不可能にしている(これは彼らがやっていると言っていることのまさに逆の行為である)」と述べ、同社による上辺だけの透明性を非難した。

一方Facebookは、米国のFTCによる介入後に同社の事業に付された欧州データ保護規則およびプライバシー要件を指摘し、データへのアクセスに関する進展が遅々としていることを正当化している。しかし、Facebookを非難する人々は、これが皮肉にも透明性や説明責任から逃れる隠れ蓑になっていると主張している。さらに言えば、そもそもこれらの規制はいずれもFacebookが人々のデータを取得することを妨げてはいないのである

2020年1月、欧州の主要データ保護規制当局はデータ保護および研究に関する予備的見解を書き、透明性や説明責任逃れに対し警告を発している。

EDPSのWojciech Wiewiorówski(ヴォイチェフ・ヴィエビオロフスキ)氏はその見解の中で、「支配的力を持つ企業が、透明性や説明責任を逃れる手段としてデータ保護の義務を悪用することがあってはならない。それゆえ倫理的なガバナンスフレームワーク内で研究活動を行っている研究者は、有効な法的根拠を持ち、比例性原則と適切な保護手段を条件として、必要なAPIやその他のデータへアクセスできるようにすべきである」と記した。

もちろん、Facebookだけが反則者というわけではない。Googleは、同社が「透明性」を主張する領域で、自らがリリースするデータを極めて厳重に管理し、ユーザーデータへのアクセスを厳格に掌握していることを根拠に自らを「プライバシーの擁護者」としてブランド化している。一方、Twitterは何年にもわたり、そのプラットフォーム内でのコンテンツの流れを把握することを目的とした第三者による研究を非難していた。TwitterのAPIはプラットフォームの全データやメタデータへの完全なアクセスを提供するわけではないので、そうした研究は全体像を説明するものではないと主張していたのである。これは説明責任を回避するもう一つの便利な隠れ蓑である。

最近、同社は研究者に対し期待を抱かせる発表を行った。ルールを明確にするために開発ポリシーを更新し、またCOVID関連のデータセットを提供するというのである。ただしそのデータセットに含まれるツイートをTwitterが選択するという点に変更はない。つまりTwitterが研究に対する実権を握ったままというわけである。

AlgorithmWatch(アルゴリズムウォッチ)による新たなレポートは、プラットフォームがデータへのアクセスを仲介することによって説明責任を回避するという、複雑に絡み合った問題に取り組んでいる。レポートでは、議論されているガバナンス構造の中でも特に医療データへのアクセスを仲介する方法からインスピレーションを得るといった、透明性を実現し、研究を強化するための具体的なステップが示唆されている。

目標:研究者に対しプラットフォームデータへの「有意義」なアクセス権が提供されること。(あるいは、レポートのタイトル通り:プラットフォームガバナンスにおける研究アクセスの運用:他の業界から何を学ぶか?)

「その他の多くの業界(食品、輸送、消費財、金融など)には、説明責任と公益を実現するための厳格な透明性ルールが適用されています。COVID-19が大流行し、私たちは仕事、教育、人とのつながり、ニュース、メディア消費においてオンラインプラットフォームへの依存度を強めています。そんな時節だからこそ、透明性のルールをオンラインプラットフォームにも適用する必要があります」と、Jef Ausloos(ジェフ・オスルース)氏はTechCrunchに語っている。

同レポートの執筆者らが読者として想定しているのは、ガバナンスフレームワークをいかに効果的なものにするかを熟考中の欧州委員会の委員である。レポートでは、独立したEU機関が、データを公開する企業とデータの受け手との間を仲介する形での、義務的データ共有フレームワークが提案されている。

もちろん、こうしたオンライン管轄機関が検討されたのは初めてではないが、ここで提案されているのは、欧州で提案されている他のインターネット管轄機関よりも目的の点で限定的である。

レポートの要旨には、「この機関は、安全な仮想運用環境、公共データベース、ウェブサイト、フォーラムなどを含むアクセスインフラストラクチャを管理するとともに、開示にふさわしいデータを確保するため、企業データの検証および前処理に重要な役割を担う」と書かれている

オスルース氏は、このアプローチについてさらに踏み込み、現在の「データアクセス」に対する信頼の行き詰まりを打開するためには「二元的思考」から離れることが重要であると主張している。「開示vs不透明/不明化、とういう二元的思考ではなく、様々な度合いのデータアクセス/透明性を備えた、より繊細で階層化されたなアプローチが必要です。そうした階層化されたアプローチなら、データを要求する側のタイプや目的に合わせ柔軟に対処することができます。」

市場調査目的の場合は、極めて高いレベルのデータにしかアクセスできないが、学術機関による医学研究の場合は、厳格な要件(研究計画、倫理委員会審査による承認など)を満たすことを前提に、よりきめ細かいアクセスが与えられるというのはどうか、と彼は提案している。

「これを促進し必要な信頼を生み出すためには、独立した機関が間に立つことが必要不可欠なのではないでしょうか。私たちは、管轄機関の任務は特定の政策からは切り離されている必要があると考えています。その機関は、データ交換に必要な技術的・法的環境を整える、透明性/開示の促進者としての役割に集中すべきです。このようにして整えられた環境は、メディア/競争/データ保護/などの規制当局がその執行措置のために利用することができます。」

オンラインプラットフォームを監督する独立管轄機関設立に向けて多くの議論があるが、その中であまりに多くの任務と権限が提案されているため政治的コンセンサスを得るのが不可能となっているとオスルース氏は言う。透明性/開示に関し限定された権限を託された無駄のない組織こそ様々な反対意見を切り抜けられる、というのが彼の持論である。

Cambridge Analytica(ケンブリッジ・アナリティカ)の悪名高い例が「研究のためのデータ」に大きく立ちはだかっているのは確かである。この企業は、ケンブリッジ大学の研究者を雇いアプリを使ってFacebookユーザーのデータを取得し、政治的な広告の対象を絞り込むという恥ずべき行為を行った会社として知られている。Facebookはこの大きなプラットフォームデータの誤用スキャンダルを平気で、データを開示させることを目的とする規制法案を撃退するための手段とした

しかし、Cambridge Analyticaの例は、透明性、説明責任、プラットフォーム監視の欠如が招いた直接的な結果である。また、データを使用された人々から政治的な広告の対象となることへの同意を得られていなかったことを考えると、もちろんこれは大きな倫理的失敗でもある。したがって、これはプラットフォームデータへのアクセスの規制に対する反論としては全く良い議論ではないように思われる。

自己本位のプラットフォームジャイアントがこのような「シャープではない」技術的論点を、ガバナンスに関する話し合いへの働きかけに使用しているのを受け、AlgorithmWatchのレポートは、こうした議論に対する歓迎の意を伝えるとともに、現代のデータジャイアントを管理する効果的なガバナンス構造をどう構築するかについて堅固な提案を行っている。

レポートでは、階層化されたアクセスポイントに関し、プラットフォームデータへ最もきめ細かいアクセス権が与えられる場合は、最も厳密な管理の対象となることが示唆されている。これは医療データモデルを参考にしたものだ。「ちょうどFindata(フィンデータ:フィンランドの医療データ機関)が現在行っているように、きめ細かいアクセスについては、独立機関により管理された閉鎖仮想環境でのみ有効にすることもできます」と、オスルース氏は述べている。

同レポートで論じられているもう一つのガバナンス構造は、European Pollutant Release and Transfer Register(欧州環境汚染物質排出・移動登録制度:E-PRTR)である。同レポートではこれを、透明性を奨励し、それによって説明責任を果たさせる方法を引き出すための研究事例として取り上げている。この制度はEU全域での汚染物質の排出報告を管理するものである。これにより専用のウェブプラットフォームを介して排出データを独立したデータセットとして自由に誰でも利用できる。

同レポートはE-PRTRについて、「一貫した報告の仕組みがあるため、報告されたデータに信憑性、透明性、信頼性があり比較可能であることを保証することができ、その結果信用を築くことができる。企業側はこれらの完全性、一貫性、信頼性の基準を満たすため、可能な限り最善の報告手法を用いるよう勧告されている」と述べている。

さらに、「こうした透明性の形式を通して、E-PRTRは欧州の企業に対し、一般社会、NGO、科学者、政治家、政府、規制当局へ向けた説明責任を課そうとしているのである」とも説明している。

EUの委員らは、ある特定のコンテンツに係る問題への説明責任を実現する手段として、少なくとも違法なヘイトスピーチなど論争の少ない分野で、法的拘束力のある透明性要件をプラットフォームに課す意思を表明すると同時に、(非個人的な)データの再利用を促進することにより、ヨーロッパのデジタル経済を活性化させる包括的な計画を打ち出している。

研究開発やイノベーションをサポートするために産業データを利用することは、野心的なデジタルフォーメーションの一環として欧州委員会が今後5年間で行おうとしている、テクノロジーを駆使した優先政策の重要施策である。

これは、EUの委員らがデータの再利用を通した研究を可能にする基本的なデジタルサポート構造を作るというより広い目標を推進していることを考えると、プラットフォームデータを公開させようとする地域的な動きは、説明責任を実現するだけにとどまらない可能性が高いことを示唆している。したがって、プライバシーを尊重する形でデータを共有するフレームワークを作り込むことができれば、公的機関により管理されたデータ交換をほぼ何もせずに可能にするよう設計されたプラットフォームガバナンス構造を欧州で実現する可能性は高いだろう。

「汚染に関する研究事例で扱ったように、説明責任を果たさせることは重要です。しかし、研究を可能にすることも、少なくとも同じくらい重要です。特にこれらのプラットフォームが現代社会の基盤を構成していることを考慮すると、社会を理解するためにデータを開示する必要があります」と、アムステルダム大学情報法研究所でポスドク研究を行っているオスルース氏は言う。

AlgorithmWatchのプラットフォームガバナンスプロジェクト責任者のMackenzie Nelson(マッケンジー・ネルソン)氏は声明の中で、「DSAに向け、透明性に関する措置を検討する際、システムを再発明する必要はありません。同レポートは、委員会がユーザーのプライバシーを保護しつつ、必要不可欠な研究を行うため主要プラットフォームのデータへ研究者がアクセスすることを可能にするフレームワークをデザインするにあたり、どのようにすべきか具体的な提案を行っているのです」と説明している。

レポート全文は、ここで読むことができる。

関連記事:グーグルがプライバシーポリシーを一部変更、ユーザーがデータを自動削除可能に

カテゴリー:セキュリティ

タグ:プライバシー コラム

[原文へ]

(翻訳:Drgonfly)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。