New York Timesの人気統計ブロガーであり、2012年の大統領選挙で50州中50州を予想的中させたNate Silverが、データ・ジャーナリズムに特化した専用ニュースサイトをスタートした。従来のブログ名、538を残したまま再公開した同サイトで、Silverは数字に対してより厳格な姿勢で書こうとしている。豊富なESPNの資金を得たSilverは、統計解析、データのビジュアル化、プログラミング、およびデータ知識を踏まえた報道のできるライター群を雇った。
データ・ジャーナリズムに特化したメディアは、Wall Street Journalの “Numbers” コラムから、The Guardianのデータブログまで、既に数多く存在する。では、Silverの538は何が新しいのか?
ここに538が他と一線を画すと私が考える理由を3つ挙げる。
1. テーマ毎の新しい統計解析
通常ジャーナリストが使うグラフや図は、完全に説明的であり、労働省の失業傾向グラフ等の既存データセットに基づいている。ライターはそれを元に、トレンドが何を意味するかについて独自の解釈を加える。
Silverのライターたちは、むしろ議論するためにグラフを使う学者に似ている。例えば、538の特集記事、「政治はすべて大統領で決まる」では、近年州知事選挙が、益々大統領候補の人気に連動していることを指摘している。それを説明するためにライターのDan Hopkinsは、下のグラフで政党への投票と知事への投票との相関が強くなっていることを示している。
これは、学者が個人ブログを始める時とすることと似ている。例えば、ラトガース大学教授のBruce Bakerは、このように影響力のある教育ブログを開設した。しかし、グラフで議論するこの学術的アプローチは、メディア界ではかなり斬新だ。
2. 数字について書く
538の大きな賭けは、調査を話題にする際、読者はそこに一定の懐疑精神を求めているという仮定だ。例えば、538は独自のガジェットレビューを行っており、FitbitやJawbone UP等の様々なフィットネス・トラッカーが、一日の歩数をどう測っているかに注目した。以前私が見たこの記事では、ライターは試した各デバイスが表示した数値の違いに注目していた。
538のアプローチでは、異なるアクティビティー毎に、各ヘルストラッカーがどうやって歩数を測定しているかを細かく分析し、例えばこのグラフは、ジョギングとアルティメット・フリスビーを1分毎に比較している。
この種の記事は、大量の記事を流し読みするインターネットサーファーには向いていない。実際私も、金塊を拾い出すためには深く掘り下げなくてはならなかったが、それはこの主題に関する最も撤底した一次情報だった。
3. 数式。そこには数式がある
ニュース記事で数式を見ることは稀であり、あの有名なベイズの定理に基づくものなどなおさらだ。メディアがどのように健康アドバイスについて報じているかを調べた記事で、ライターのJeff Leekは、読者が見出しを信じるべきかどうかを理解するのを助けるために、この数式を使った。
見出しの結論 = (初めの直感)×(見出しを裏付ける研究)
1600語からなる長文記事で、Leeksは「一般に、健康関係の見出しは広告である。目的は記事を読ませることであり、研究内容を正確に表しているとは限らない」と指摘した。
そのためにLeeksは、無作為対照試験から、研究がヒトに対して行われたかどうかまで、健康に関するあらゆる要素に注目し、健康アドバイス記事が読者にとって有意義かどうかを、数学的に決める方法を説明している。
最近私が見た中で、いちばんこれに近いアプローチは、先週The Guardianに掲載された、大規模健康調査に個人的アドバイスを求めるのは現実的ではない、という論説だ。538のアプローチでは、The Guardianの記事を既知であると認めた上で、この事実に基づいて行動するための詳細かつ数量的方法を概説している。
大きな賭け:読者はみなオタクである
保守的ラジオファン、有名人ゴシップ好き、およびインターネットサーファーのベン図を描くと、538読者はグランドキャニオンの彼方にいる。Silverが求めているのは、懐疑精神や微妙なニュアンスや検証可能な仮説を楽しむ教養ある読者たちだ。
私は、(まさしく)偏向しているので、あえて538の評価はしない。かつて私は、一人世論調査専門家を体験し、自らのカフェイン摂取量を測定し、自らの性生活におけるカロリー消費プロファイルを分析し、豊富な例証に基づく統計の誤り暴露を行った。
Silverの実験は、データ・ジャーナリズムが有効であるかどうかの試験ではない。これは、インターネットのニュース読者がいかにオタクであるかの試験だ。538は常にデータがすべてだ。もしSilverが成功すれば、その理由は大衆がどれほどデータ駆動型分析を求めているかをニュース業界が過少評価してきたためだ。
[原文へ]
(翻訳:Nob Takahashi / facebook)