これまでウェブサイトのコメント欄に書き込んだり、フォーラムやソーシャルメディアである程度時間を過ごしたことがあるのなら、おそらくソックパペット(sockpuppets:元の意味はソックスで作った簡単な指人形という意味)に出会ったことがあるだろう。これは1人の人間によって操られている偽のアカウント群のことである。あなたがそのときには気が付いていなかったこともあり得る。新しい研究が、こうした過剰なコメンテーターたちを自動的に識別することを可能にするかもしれない。これはウェブ上で正気の議論を行うためには良いニュースだ。
メリーランド大学のSrijan Kumarは、ソックパペットアカウントについて、それらが登録したユーザー名同士で書き込みを行ったりやり取りをした内容に関して、徹底的な静的統計分析を行うチームを率いてきた。彼らの発見はパースで開催されたWorld Wide Web Conferenceで、今週発表された。
データはコメントプラットフォームとしてDisqusを使用するサイトから集められた。同社からは「9つのコミュニティの、289万7847人の利用者による、212万9355件のトピックと6274万4175件の投稿」のユーザーアクティビティの完全なトレースが提供された。
研究チームはそれ自身興味深いソックパペットの特性を発見したが、同時にそれらを識別するために役立つ発見も行った。そうしたアカウントは、同時に同じスレッド内でアクティブになる傾向にあるが、自分自身で新しい議論を始めることは殆ど無い。それらのユーザー名は大きく異なっているが、アカウントのメールアドレスはしばしば同一である。そして、彼らは普通のユーザーとは区別される特定の言語的特徴を持っている。より多くの”I”と”you”を使い、一般に悪い文法を使うのだ。そして彼らは多くの場合、時事問題に注意を向けている。
これら(と更に多数の)要素を測定することで、チームはあるアカウントがソックパペットであるかをその時点で3分の2の精度で見抜くことができた。しかしもっと興味深いことは、2つのアカウントが同じ「パペットマスター(人形使い)」に属しているかどうかを91パーセントの精度で決定できたということだ。
記事トップのイラストにはAV Clubでのコメントが視覚化されている。青い点は普通のユーザーで、赤い点がソックパペットだ。ソックパペット同士は頻繁にやりとりを行うためクラスターを形成する傾向がある。また彼らはより活発に活動するため、より中心に位置している。
まだソックパペットの正体を自動的に暴くまでには達していないものの、このデータ(公開されているものに加えて、Disqusと共有されているものがあるに違いない)は、モデレータや管理人に対して、オンライン議論の混乱を鎮めるための判断材料を提供することだろう。ほどなくコメントを読むことも安全になるかもしれない…し、ならないかもしれない。
もしソックパペットに関して発見された他の側面について興味がある場合には、ここで論文のフルバージョンを読むことができる。統計の話はさておくとしても、とても読みやすい論文だ。
[ 原文へ ]
(翻訳:Sako)