Facebook、フェイク記事追放には人力よりも機械学習アルゴリズムを重視する方針

2016-11-15-facebook-human-algorithm-news-scan

Facebookにはフェイク・ニュースを拡散してドナルド・トランプの大統領当選を助けたという非難が殺到している。Gizmodoの記事によるとFacebookは右派メディア多数に対する影響が大きすぎるという理由でフェイク・ニュースを探知するアップデートを延期したという。

Facebookはこの報道を直接に否定し、TechCrunchに対して「記事の主張は真実ではない。われわれは特定の政治的立場への影響を考慮してニュースフィードへの変更を行ったり、延期したりしたことはない」と語った。

TechCrunchはコンテンツの中立性に関してFacebookから直接詳しいアップデートを得る機会があった。

news-feed-machine-screengrab

2015年の1月にFacebookは捏造ニュース記事を追放するためのアップデートを発表した。これはユーザーによって多数の「報告」フラグが付けられた記事の表示ランクを下げるものだった。こうして降格された記事の多くは後で投稿者自身が削除している。このシステムは現在も作動中だ。

その後2016年8月にFacebookはさらにニュースフィードのアップデートを行った。 これは クリックベイトと呼ばれる記事を抑止することを目的としたもので、 Facebookは人間が選んだ典型的なクリックベイト的記事タイトルを資料として機械学習システムに学習させた。機械学習はクリックベイト的タイトルを認識し、そのような記事の表示ランクを自動的に下げることが期待された。

Facebookによると、 今年のクリックベイト対策アップデートで、開発チームは2種類のオプションを用意した。一つは2015年のユーザー報告にもとづくフェイク検出システムで、他方はもっぱら機械学習のアルゴリズムに頼るコンピューター・システムだった。

Facebookによれば、機械学習を利用したクリックベイト探知システムは間違った陽性反応(クリックベイトでないものをクリックベイトと判定すること)もその逆のエラーも人間の場合より少なく良好な実績だったという。そこでFacebookはこのシステムをリリースした。もちろん開発過程でリリースされなかったバージョンをGizmodoが取り上げている可能性はある。Facebookの担当者に対するインタビューでは、「右派の言論の降格が適切であるかどうかはクリックベイト抑止策を実際に選択するにあたって全く考慮されなかった」ということだ。しか政治的バイアスの有無はやはり懸念事項だろう。

Facebookの決断は ユーザーの「報告」に基づく人間のキュレーションより機械学習アルゴリズムに重きを置くというものだった。これは「人間の介入によるバイアスの可能性を減らす」というFacebookの最近の方針にも一致する。ただしこの立場自体がさまざまな問題を含んでいる。

fb-clickbait1

今年に入ってGizmodoに掲載された記事には「Facebookのトレンドをチェックする人間のキュレーターは編集権の一環として主観によって保守派の傾向の記事を排除している」という主張が紹介されていた。Facebookはこの主張を否定したが、同時にキュレーション・チームを解雇し、人力に頼らずアルゴリズムによってトレンドを設定する方向に舵を切った。すると今度はFacebookはフェイク記事をトレンドとして表示したとして非難された。New York Timesの記事は「トレンドの記事選定方法はFacebookの客観性を麻痺させるもの」と激しく攻撃した。

仮に Facebookが保留されているクリックベイト対策版をリリースしていたとするなら、フェイク記事の選択はユーザーからの報告を検討する担当スタッフの主観に依存することになっていただろう。しかしクリックベイトを選び出すにあたって、あからさまなデタラメと巧妙なトリックとの間の線引は非常に難しい。一方、政治活動家やトロルはFacebookの記事報告機能を乱用して、自分たちに不利であれば正確な記事に対しても組織的に報告フラグを立てるという攻撃をしかけるだろう。

この難しい状況はソーシャル・フィードの掲載ランク付けにあたってユーザー・エンゲージメントをベースとしていること必然的な結果だ。国民を2分するような政治的状況における選挙活動やどんな記事であろうと閲覧されれば広告収入が得られるということがフェイク記事の氾濫の大きな動機となっている。

facebook-news-feed-algorithm

誰が真実の審判者となるのか?

Facebookとともに大きなニュースのチャンネルであるTwitter、Googleも前途に難関が予想される。事実によって簡単にそれと見分けられるフェイクは問題の一部に過ぎず、対処も比較的簡単だろう。誇張が極端な記事、あからさまなテクニックを用いた釣り(クリックベイト)記事への対応はもっと難しい。

というのも、Facebookなどのプラットフォームはユーザー・エンゲージメントに比例する報酬システムを用いているため、ニュース媒体にはセンセーショナリズムによってページビューを稼ごうとする動機が存在するかだらだ。政治的立場が明らかな伝統あるニュース媒体の場合、不当な誇張がないよう責任を持つことが求められる。しかしFacebookのようなネットワーク上である目的のために特別に設定され、口コミのパワーだけ頼ろうとするニュースサイトの責任を問うのは難しい。こうした媒体はその場限りのトラフィックと収入を目的としているので、読者が誇張やフェイクにうんざりしても、単にそのサイトを閉鎖して新しい名前で別のサイトを立ち上げればすむ。

誇張ないしフェイク記事を報告する手順をシンプルにする、実否が疑わしい記事にはファクトチェック・サイトへのリンクを追加する、正確性が立証されていないサイトの記事の拡散を保留する、などはそれぞれ有効だろう。しかしフェイク記事がマネタイズに有効だという構造そのものを再検討するのがフェイクの追放にあたって最優先されるべき事項だ。

facebook-news-feed-equation

しかしFacebookのようなネットワークに真実の警察となるよう求めるのは危険過ぎる。どのニュースを削除しろという圧力は現在よりはるかに増え、それに伴って非難のボルテージが上がるのは必然的だ。少なくともテクノロジー・プラットホームがユーザー・エンゲージメントによって記事のランキングを行うならば、仮にフェイク・ニュースの検出で誤りがあったとしても、それは個々のユーザーが誇張やフェイクであるかどうかを判断すればよいことだ。FacebookのCEO、マーク・ザッカーバーグはこの立場を強調し、「われわれ自身が真理の審判者であるかのような立場に立つことにはこの上なく慎重でなければならない」と書いている。

現在 Facebookは難しい立場に置かれている。ユーザーの判断を信頼するとしてフェイク・ニュースが拡散するに任されば非難されるだろう。しかしフェイク・ニュースを発見して削除する立場を取れば、それは検閲と同じでありユーザーから選択の自由を奪うことなるとして非難されるはずだ。世界最大のソーシャル・ネットワークは次の行動を慎重に選ばねばならないだろう。

[原文へ]

(翻訳:滑川海彦@Facebook Google+

Facebookの新アルゴリズムはクリックベイトを判定―トラフィック稼ぎの釣り記事は排除へ

2016-08-05-fb-clickbait1

Facebookはニュースフィードの表示アルゴリズムに新しくアンチ・クリックベイト機能を追加し、順次公開していく。この新機能のおかげで、 重要な情報を歪めたり、隠したり、誇張したりするページや記事へのリンクはニュースフィードに表示されなくなる。

Facebookは人力で何万という記事のクリックベイト指数 〔clickbaitiness score〕を算定し、このデータを用いて新しいアルゴリズムを訓練した。これにより、システムは「ベッドの下を覗くとなんとこれがいました! 大ショック!」、「ニンニクを靴に入れた結果が信じられないことに」、「犬が配達人を吠えた―その結果が大爆笑もの」といった記事を自動的に発見できるようになった。

このアルゴリズムは単なる二分法で「これはクリックベイト」、「これはクリックベイトではない」とラベルを貼るのではなく、記事の悪質さの度合いに応じてクリックベイト指数を付与する。仕組みはメールのスパムフィルターと似ており、主として通常の記事にはめったに使われない迷惑記事特有の表現を探す。

個々の記事のクリックベイト指数が高いほどアルゴリズムはその記事へのリンクを掲載、共有したFacebookページ、あるいはウェブサイトを全体として罰する。つまりこうしたページやサイトの表示順位がダウンする。Facebookのニュースフィード・プロダクト・マネージメント担当副社長、Adam Mosseriは私の取材に答えて、「毎日50回も投稿している場合、1回くらいクリックベイトが混じっていても問題はない。逆に一日中クリックベイトをアップしているスパマーの場合影響は非常に大きいはずだ」と説明した。

さいわい「パブリッシャーがクリックベイトを投稿するのを止めればリンクのトラフィックも元に戻る」とMosseriは言う。アルゴリズムはFacebookページとウェブサイトのドメインの双方のレベルで違反者を特定するので、スパマーはページに掲載する記事のURLを細かく変えることでクリックベイト発見アルゴリズムを逃れることはできない。

これまでもクリックベイトはニュースフィードで最大の苦情の原因だった。一部のユーザーはこれをニュースフィードの表示アルゴリズムのバグとしてレポートを出している。今回のアルゴリズムのアップデートはFacebookが最近発表したニュースフィードの価値〔News Feed Values〕という考え方に沿ったものだ。 価値の判定に用いられる5つのカテゴリーのひとつは「コミュニケーションの正統性(“Authentic Communication)」だ。これは「友達と家族を優先」する。先月のフィード・アルゴリズムの変更で新たなパブリッシャーの表示順位が下げられたのもこの考えに基づくものだ。

Facebookはクリックベイト対策の詳細を他のソーシャルメディアやサービスのデベロッパーと共有していくという。「われわれがどういう方法を採用しているか他社が研究し、採用することを歓迎する」とMosseriは語った。

しかしFacebookはこの情報を一般に公開するつもりはないという。「ドキュメントの大部分はクリックベイトと判定されるタイトルの例なので、スパマーに悪用されるおそれがあるからだ」という。

以前、Gizmodoは匿名の情報源のデータを基に「Facebookはトレンドから保守的な記事を不当に排除している」と主張したことがあった。それと関係があるのかどうか、Facebookの文書中のクリックベイトのサンプルのドメイン名はGizmotecho.comだった。〔下のポールペンの画像。誇大宣伝の例としてFacebookが作ったもの〕

Facebook Clickbait

Facebookは2014年にもユーザーのリアクションに基づいたアンチ・クリックベイト・アルゴリズを導入している。このアルゴリズムはユーザーが「いいね!」をして記事を見に行ったものの、すぐにFacebookに戻って「いいね!」を取り消したリンクを探すものだった。

この2月のアップデートではユーザーがクリック先のサイトに滞在した時間をクリックベイトの判定に用いるようになった。多数のクリックがあるのに滞在時間の合計が少なく、後まで残った「いいね!」の数も少ないサイトが対象だった。今日のアルゴリズムの改良は、個々の記事がクリックベイトであるかどうか判断するだけでなく、パブリッシャーそのものをスパマーとして特定するところに主眼がある。

Facebookはパブリッシャーがクリックベイトと判定されることを避けるための方法を紹介している。 Facebookは「赤絨毯の上でつまづいて転んだのはなんとあの人」などという情報の重要部分をタイトルから隠し、続きを読むためにクリックさせる手法を避けるよう求めている。また「このボールペンは絶対、決してインクが切れません。購入は早い者勝ち!」といった誇張もクリックベイトと判定される可能性があると警告している。

当然ながらニュースのパブリッシャーはニュースフィードのアルゴリズムの変更に神経質になっている。リンクのトラフィックに大きな違いが出てくるからだ。先月、「ページより友達を優先する」という方針が発表されたことはパブリッシャーを不安にさせていた。

今回のクリックベイト対策が功を奏するなら、正当と認められたパブリッシャーの掲載するニュースへのトラフィックはアップするだろう。投稿されたURLがクリックベイトではないと安心できればクリックするユーザーは増えるはずだ。

9月12日から14日にかけて開催されるのTechCrunch Disrupt SFでFacebookのAdam Mosseri副社長がニュースフィードについて講演する予定。

画像: Bryce Durbin

[原文へ]

(翻訳:滑川海彦@Facebook Google+

Facebook、クリック稼ぎの釣りネタ投稿の排除へ

「なんとこんな信じられないことが起きた! このビデオは必見!」などという投稿にうんざりしているのはFacebookのユーザーばかりではなかったらしい。

Facebookは今日(米国時間8/25)、 公式ブログで、「クリックベイト(クリックを釣る)見出し」、つまり「内容について有益な情報を与えずに人々に記事をクリックさせようとするような見出し」を排除する努力を始めたと発表した。

クリックベイトに対する苦情は目新しいものではないが(たとえばOnionのClickHoleという釣りネタ記事のパロディーサイトは私のお気に入りだ)、Facebookは「こうしたクリックベイト記事が友達やフォローしているページからの有益な情報を埋もれさせる」と憂慮する。

それではFacebookはどうやってクリックベイト見出しを見分けるのか? Facebookチームはユーザーの反応に注目する。クリックした記事を読む時間(Facebookに戻るまでの時間)、クリック数と「いいね!」や「シェア」の比率などを参考にして記事の価値を推定するのだという。

こうした間接的な手法ではニュースフィードからクリックベイトをすぐに大きく減らすのは無理だろう。しかしリンクをクリックした途端に「なんだこりゃ?」となってすぐにFacebookの戻るユーザーが多かった記事に表示上のペナルティーが課されるならよいことだ。

数ヶ月前、Facebookはニュースフィードへのスパムを減らす努力をしていると発表した。Facebookページが増加しているのにユーザーのFacebook滞在時間は変わらない以上、ページ間でのユーザーの奪い合いは激化しているわけだ。

なお、Facebookは今日のブログで「写真のキャプションではなく、テキスト中にリンクを埋めた投稿を優先する」としている。

[画像 via Flickr/SamahR]

[原文へ]

(翻訳:滑川海彦@Facebook Google+