AP通信社が自社の記者たちのためのデータサービスをData.worldの協力で一層充実

ap-data

The Associated Press(AP通信社)は2013年から、自社の記者たちへのデータ提供サービスを始めている。たとえば情報の自由法(Freedom of Information Act)に基づくデータリクエストを手伝ったり、4名のエンジニアを起用してデータの視覚化や、大量のスプレッドシートからのインサイトの取り出し、などをやってきた。そして今日(米国時間3/3)から同社はData.worldとの共同パイロット事業により、記者たちにこれまでよりも詳細なデータを提供していくことになった。

データ分析企業Data.worldB corpの認定企業でもあるので、自分たちの事業の社会性をつねに意識している。今回のAPとのパートナーシップでもそれは変わらず、データの提供者が個々のデータ集合のパーミッションを自分で設定できるようにした。たとえばAPは、インポートしたデータとその分析結果をとりあえずプライベートにしておき、その真実性に確信を持てた段階で一般公開することができる。

APのデータジャーナリズムチームの編集長Troy Thibodeauxはこう語る: “データにフォーカスしたプラットホームが欲しかった。ほかのものは今ますますヴィジュアル性が重視されるようになってきたが、ユーザーがデータにアクセスしてそれらを深く正しく理解することも重要、と考えている”。

Thibodeauxたちは最初、そんなデータプラットホームを内製するつもりでいたが、最終的にはData.worldを起用することに決めた。過去にAPは、データ配布のためのいろんなWebサイトを作っていた。でも今では、その新しいプラットホームが、データへのアクセス性の向上以上のことを、やってくれる。たとえば一つの調査課題に対して一般公開データとプライベートなデータの両方を取り出して、状況がより詳しく分かるようにする。それにより、一つのことに関して、複数の異なった考え方があることも、分かるのだ。

複数の報道機関の共同体でもあるAP通信は、データを配布するためのハブとしても理想的だ。たとえばAPのメンバーである各地の地方紙はそれらのデータを利用してインサイト(とくにニュースに対する解釈や意味)を、読者が求める方向へ調整できる。

“最近は、アメリカに来た難民たちの現状に関するデータを公開した。7つの国からの10年におよぶ移民データだ。そのデータの要約のような短い記事も付けたが、データの利用者であるうちの記者たちの方が、もっとずっと良い記事を書いてくれた”、とThibodeauxは語る。

今後は、データの読み方や使い方に関する記者たちへの教育も行っていく予定だ。そしてシステムが効果的に稼働するようになったら、その結果として実現するデータドリブン(data-driven, データ駆動型)なジャーナリズムが、ニュースの信頼性と透明性と妥当性(適切性)を向上させるだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

AP通信、マイナーリーグ野球の記事を「ロボット」記者が報道

今日(米国時間7/3)Associated Pressは、全国のマイナーリーグ野球(MiLB)の試合記事を人工知能を使って書くことを発表した。人工知能システムは、Automated Insightsのソフトウェア、およびマイナーリーグ野球の公式データ提供元であるMLB Advanced Media(MLBAM)のデータを利用する。

自動生成された記事が配信されるのは、AP Sportsの人間記者が取材も報道もしない、142のMLB協讃チームと13のリーグにわたるトリプルA、ダブルAおよびクラスAの試合だ。

したがって、もしテクノロジーが有望なスポーツ記者から「仕事を奪う」ことを心配しているなら、安心されたい。

APのスポーツ部門副ディレクターのBarry Bedlanによると、APはこのシステムの開発と運用のために、自動化の専門家を雇った。

この動きは全くの予想外ではなかった。この会社は、Zacks Investment Reseachのデータを使って、2014年7月からビジネスおよび金融の報道に人工知能を利用している。

APが、いわゆる「ロボット」報道を拡大する上で心配しているのは何かと尋ねられたBedlanは、「配信される内容は100%正確であることを確かめる必要がある。しかし、ひとたびソフトウェアが適切に設定されれば、正確性の問題はなくなる」。

AP Sportsは、一年をかけてAutomated Insightsのプラットフォーム、WordsmithをMiLBの記事作成のためにテストをした結果、AP Sportsの顧客である地方の放送局や新聞に配信し、彼らの視聴者や契約者に届けることになった。

統合は技術的には難しくなかったが、APでトップクラスの野球担当編集者や記者たちに、自動生成された野球記事の品質をチェック、評価、編集してもらうため一年かかった。

彼らはメジャーリーグを春季キャンプからワールドシリーズまで追いかけているため、捕まえるのは容易ではなかった。

APは、ソフトウェアとAIの利用を野球以外のスポーツにも拡張するに違いない ― 良いデータを早く揃えることさえできれば。

Bedlanは、「可能性はいくらでもあるが…スポーツ団体が正確性100%のお墨付きを与えるのに何時間、何日もかかるなら、新聞や放送やウェブサイトにとってニュース価値はなくなる。

MLBとAutomated Insightsは、MilBゲームのデータを数分以内に提供している、と彼は言った。

Bedlanは、APが記事は自動生成されたものであり人間が書いたのではない時は、そのことを明確に公表すると強調した。そして彼は、自動システムの利用によって、編集者や記者は、もっと調査の必要な大きなプロジェクトに専念できるようにすることが目的だと話した。

ニュース配信の自動化を進めているのはAssociated Pressだけではない。Celeste LeCompteが2015年9月に、NiemanReports.orgで“Automation in the Newsroom”と題してこう書いている。

「ProPublica、Forbes、The New York Times、Oregon Public Broadcasting、Yahoo、その他の会社はアルゴリズムを使ってビジネスやスポーツから教育、機会均等、公共の安全等に関する報道に役立てている。多くの企業にとって取材と配信の一部を自動化することは、記者の負担を減らすとともに、新しいデータ資源を活用する手段でもある」

果たして自動化が進むことによって、記者や編集者にスキルの衰えが起きるかどうか、今後に注目したい。

[原文へ]

(翻訳:Nob Takahashi / facebook