花王とPFN、健康や生活など1600項目以上のデータを推定できる統計モデル「仮想人体生成モデル」プロトタイプを共同開発

花王とPFN、健康や生活など1600項目以上のデータを推定できる統計モデル「仮想人体生成モデル」プロトタイプを共同開発深層学習を中心とした最先端技術の研究開発を行うPreferred Networks(PFN。プリファード・ネットワークス)と花王は2月28日、「仮想人体生成モデル」のプロトタイプを共同開発したと発表した。1600以上のデータ項目で構成される人体の統計モデルで、ある項目のデータを入れると、別の項目の推定値が示されるというものだ。

たとえば、健康診断の結果から内臓脂肪量を統計的に推定できる。その他のデータと組み合わせて、その人のライフスタイル、運動や食事の習慣などに合わせた最適な健康管理方法を提案するといった使い方も可能だ。また、今の体重から2kg減ったら他の項目にどれだけの影響があるかを推定するといったこともできる。

1600の項目には、健康診断などで示される身体に関する情報のほか、食事・運動・睡眠などのライフスタイル、性格・嗜好・ストレスの状態・月経といった日常生活で関心の高いものまで多岐にわたって含まれる。これらのいずれかの項目にデータを入力すれば、他の項目の推定値が出力される。この項目も入出力可能だ。

これは、人の身体、心理、生活など多岐にわたって研究を重ねてきた花王の研究資産と、深層学習などPFNの最先端の計算科学技術によって生み出されたものだ。この仮想人体生成モデルは、協業する事業者や研究機関などにAPIで提供されることになっているため、事業者は自社製アプリなどに機能を組み込み、エンドユーザーにサービスを提供することができる。入力されたデータが収集されたり蓄積されることはなく、利用者のデータが二次利用される心配はない。花王とPFN、健康や生活など1600項目以上のデータを推定できる統計モデル「仮想人体生成モデル」プロトタイプを共同開発花王とPFN、健康や生活など1600項目以上のデータを推定できる統計モデル「仮想人体生成モデル」プロトタイプを共同開発

まだプロトタイプの段階だが、2022年中の実用化を目標に検証を進めてゆくという。2023年初頭にはAPI経由での提供し、新規デジタルプラットフォーム事業を開始する予定。

2019年のWebはモバイル化がさらに進展、トップ100サイトの月間訪問は2230億回

モバイル化の進展が、世界のWebトラフィックに大きな影響を与えていることが統計で裏付けられた。2月11日にWebマーケティングのコンサルティング会社であるSimilarWebが発表したレポートによると、2019年のモバイルのWebトラフィックは2017年以降30.6%増加したのに対し、同期間のデスクトップのWebトラフィックは3.3%下落していた。

変化はこうした数字だけではなかったようだ。モバイルユーザーの行動はデスクトップとはかなり違うことがわかった。モバイルユーザーのページ滞在時間はデスクトップよりかなり短い。これはWebサイト運営者が参考にする統計数字の意味に影響を与える。

レポートによると、2019年のWebのトラフィックは2018年から8%アップ、2017年から18.8%アップ、月平均2230億回のトラフィックがあった。2019年のWebトラフィックで最大のアップは4月と6月で、トラフィックは2018年と比較してそれぞれ10%以上アップした。

ただしレポートによると、モバイル化は訪問回数の増大の主因であるものの、モバイルユーザーがサイトに滞在する時間は短いため、プラットフォームを通算してWebサイトにおける滞在時間は2017年から2019年にかけて49秒ダウンしている。

またあるカテゴリーでは、モバイルがデスクトップを抑えて主要なアクセス経路となっている。デスクトップに比べてモバイルが圧倒的に好まれているカテゴリーはアダルト、ギャンブル、料理と飲み物、ペットと動物、ヘルス、コミュニティとソーシャル、スポーツ、ライフスタイルだ。さらにこの数年、ニュース、自動車、トラベル、調べ物、ファイナンスなど他のカテゴリーでもデスクトップからモバイルへのシフトが顕著だ。

しかしながら、こうしたモバイル化によってすべてのサイトがメリットを得ているわけではない。

例えばニュースサイトのトラフィックは減っている。レポートによれば、メディアサイトのトップ100は2018年から2019年にかけて5.3%のトラフィックを失っている。訪問者数にすれば40億回だ2017年からの減少は7%にのぼる。

こうしたトラフィックの減少はすべてのニュースカテゴリーに及んでいる。特にエンターテインメント関連、地域関連などのニュースは25%以上減少している。ビジネスとファイナンス、女性の権利に関するニュースだけがトラフィックが増加した。

モバイルへのトラフィックのシフトはまた大手パブリッシャーに有利に働いており、巨大サイトはさらに地位を固めた。トップ10サイトの月間訪問回数はトータルは1675億回で、2018年から2019年にかけて10.7%アップしている。これに対し、11位から100位までの90サイトでは同一期間で2.3%の増加にとどまっている。

GoogleはトラフィックをメインのサイトであるGoogle.comに集めようと努力し、効果を上げている。同時にYouTubeも成長もしている。一方、トラブルが続くFacebookでは、トラフィックの数字にもそれが現れており、2019年だけでトラフィックを8.6%失った。レポートはFacebookが失ったトラフィックの多くがYouTubeに流れたとみており、Facebookが最近ビデオに力を入れているのはこれが原因だろう。とはいえ、Facebookがモバイルに力を入れていることはビデオ以外では効果を上げており、例えばInstagram、WhatsAppへのトラフィックは対前年比で74%もアップしている。

Facebookと並ぶ減少組の代表はアメリカのYahooで、2017年以来トラフィックは33.6%ダウンした。Tumblrは2018年にアダルトコンテンツを禁止したことにより1年で33%のトラフィックを失った。

FacebookはWebトラフィックの減少を補おうとして2019年にアプリの再構築行った。これは効果を上げており、アプリのセッション数は増加した。Facebook同様、YouTubeもユーザーを惹きつけるためにデザイン変更を行っており、両者はビデオ視聴回数でほとんどタイとなった。

このレポートが扱っているデータは2017年1月から2019年12月までのもので、デスクトップとモバイルのWebトラフィックに加えてAndroidアプリの利用状況を調査している。

レポートの全文はこちらで読める。レポートはショッピング、トラベル、ファイナンス、メッセージなど重要なカテゴリーについて掘り下げた分析も行っている。

画像:Towfiqu Photography / Getty Images

[原文へ]

(翻訳:滑川海彦@Facebook

チンパンジーにならない方法をFactfulness共著者、アンナ・ロスリング氏に聞いてきた

Factfulness Night

Factfulnessがベストセラーとなっている。この本は半年前にTechCrunchで書評したのでご記憶の読者もあるかと思うが、発行部数はシリアスな翻訳ノンフィクションとしては異例の41万部となっているという。副題の「10の思い込みを乗り越え、データを基に世界を正しく見る習慣」が内容をよく表している。この本はその役目を間違いなく果たすと思う。

主著者のハンス・ロスリング博士はスウェーデン人で公衆衛生に関する世界的権威だったが2017年に急逝したため、子息のオーラ・ロスリング氏と妻のアンナ・ロスリング・ロンランド氏が原稿を整理、補筆、ビジュアル化して本書に仕上げた。日本で大きな注目を浴びたことを機に共著者のアンナ・ロスリング氏が来日して講演し、メディアのインタビューを受けた。TechCrunchでも話を聞く機会があったので紹介したい。インタビューは丸の内北口ビルのWeWorkの会議室で行ったが、その後アンナ氏を囲むパーティーで尋ねた部分も含まれている。

Anna Rosling

Q:連日休みなしに取材に応じてると聞きましたが大変ですね。

A:平気です。実はこんなに大きな反応があるとはまったく思っていませんでした。嬉しい驚きです。

Q:ハンス・ロスリング博士とはどういう関係ですか?

A:夫のオーラの父です。義父ということになります。

Q:ではある意味ファミリービジネスですね。しかし誰もが義父のビジネスに入るわけではない?

A:そうですね。私はデータのビジュアル化ということに長年興味がありました。その背景については私自身のことを少しお話する必要があるかと思います。私は小さいころ一人で独立して生きて行けるようになることが夢でした。就職するのもイヤ、結婚するのも、家族を持つのもイヤと思っていました。これは実は全部外れて、今は結婚して子供たちもいるんですが。

Q:アーティストになろうとしたのですか?

A:実は大学で写真と社会学を学びました。

Q:それはかなり珍しい組み合わせですね。

A:スウェーデン中部のイェテボリ大学で写真、南端のルンド大学で社会学を勉強しました。大学が300km近く離れていたので往復が大変でした。ともあれすぐに社会学は退屈な話ばかりだと思い始めたし、フォトグラファーとなるほどには写真にも打ち込めませんでしたが…そうですね、ここで得た知識や技能はデータをビジュアル化することの重要性に気づかせてくれたと思います。

Q:社会学と写真の接点にデータのビジュアル化の秘密があったのですね。

A:今でも写真は好きです。裏表紙側の写真は私が撮ったものです。

Q:そうでしたか。グラフといえば表紙側のグラフがすばらしいですね。膨大な数のデータが巧妙にまとめられ、一見して所得と寿命には強い相関があることが分かります。しかし米国は日本より所得が高いのに寿命が短い。それどころか平均回帰直線より下です。逆にキューバは米国わ日本より所得がずっと低いのに平均寿命は米国と同水準ですね。眺めているだけで次々に発見があります。

A:こうしたデータは国連や各国の官庁が大量に持っていると思います。しかしたいていの場合、数字がぎっしり詰まった表に過ぎません。無味乾燥な数字のままでは誰も意味を読み取ろうとしません。オーラ(ハンス・ロスリング博士の子息)と結婚して義父の原稿に目を通しているうちに私の能力が役に立つのではないかと気づきました。

Q:統計というのは学問から日常生活まであらゆる面でわれわれの行動の指針を提供してくれるのですがなかなか興味を集めることができません。

A:義父は貴重なデータを膨大に持っていました。オーラと私はそのデータを整理して説得力ある形で提供しようと考えました。もちろん大勢の友人の協力を得たわけですが、これほど大きな反響があるとは思いませんでした。

Q:この本では「チンパンジー」をランダムな推測の例にしていますね。「世界の1歳児でなんらかの予防接種を受けている子供はどのくらいいる?A:20%、B:50%、C:80%」という質問があります。チンパンジーなら33%の確率で当たるはず、というのですが、人間の正解率はチンパンジーより低い。(正解は「80%」)。

A:残念ながらそうなのです。しかもジャーナリストのほうが一般の人よりさらに成績が悪いという傾向が出ています。

Q:これが「賢い人ほど世界の真実を知らない」ということですね。

A:この本ではこうしたバイアスに陥らないためのチェックポイントを10章に分けて説明しています。

Q:恐怖本能、犯人探し本能などバイアス生む「10の本能」ですね。たいへん詳しく説明されています。

A:ひとつひとつのコンセプトはシンプルなのですが、義父は膨大なデータによって実例を挙げているので取捨選択がたいへんでした。たとえば、多くの人に「世界はどんどん悪くなっている」という思い込みがありますが、データはそれと逆です。世界の多くの地域で生活水準はアップし、寿命も伸びています。

Q:最後にひとつ質問です。私(滑川)もその昔、統計を扱う仕事をしていたことがあり、職場ではランダムな推測を「ゲス(guess)回答」と呼んでいました。「チンパンジー」というのはユーモラスですし、誰でも直感的に分かる比喩だと思うんですが、このアイディアはアどこから来たのですか?

A:これは義父がTED講演でも使っていたのですが、もともとは霊長類の研究者との会話から思いついたものです。つまりチンパンジーは複雑な問題に対しても必ずしもランダムな選択をするわけではないというのですね。

Q:なるほど。われわれは不用意に主張を始める前に、まずファクトを確認する習慣を身につけてチンパンジーに負けるようなことがないよう努力しなければなりませんね。どうもありがとうございました。

インタビューは東京駅を見下ろすWeWork丸の内北口の会議室で行われたが、これはWeWorkの鈴木裕介プロダクト・マネージャーがアンナ氏がシンガポールでTED講演をしたとき知り合ったことがきっかけだったという。

本書の成功は正確かつ読みやすい翻訳も大きな役割を果たしているが、インタビュー後のパーティーで「ゼロ・トゥ・ワン」の翻訳でも知られる共訳者の関美和・杏林大学准教授(写真下)に話を聞くことができた。それによるとボリューム(370ページ以上)とテクニカルな内容から上杉周作氏と共訳することを選んだという。上杉氏はパーティーでは会えなかったが、カーネーギーメロン大学修士、Palantir Technologiesのエンジニアなどを経てフリーランスとなったという経歴で、翻訳後にはオンラインでチンパンジー・クイズや日本のデータをベースにしたニホンザルクイズを公開するなど積極的にコンセプトの普及に努めている。

 

トップ画像はアンナ・ロスリング氏と担当編集の日経BP中川ヒロミ部長(会場は「豚組しゃぶ庵」)。

(翻訳:滑川海彦@Facebook

Facebookの災害支援機能で「無事」を反射的にクリックしてはいけない理由

まず断っておかねばならないが、Facebookの災害支援ハブは素晴らしいサービスだ。寄付やボランティアを申し出るために信頼できる場所であり、大規模な災害が起きたときに人々を大いに助けてきた。

しかしそう述べた上で注意を要する点がある。身近で災害が起きてFacebookのセーフティーチェックがオンになったとき、反射的に「無事」をチェックしてはいけない。

安否確認できるのはよいことだが、「世界は危険に満ちており、恐ろしいことが始終起きている」という誤った観念を強化するようなことがあってはならない。こういう考えは問題を解決するのではなく悪化させる。

たとえば、去年の秋、カナダのオンタリオ州オタワ市で竜巻というページが掲載された。実はわたしはオタワ市に住んでいたことがあり、現地に友達が何人もいる。Facebookを見るとトッドとジェニファーは「無事」をチェックしていた。しかしジョーは?ステファンは? 他の連中はどうだったのだろう?

安心してもらいたいが、みな無事だった。実のところ、人口130万のオタワでこの竜巻の結果病院に運ばれたのはたった6人だった。それにカナダで竜巻はしょっちゅう起きている。ちょっと割り算をしてみれば竜巻で被害にあった運の悪いオタワ市民は21万6666人に1人だったとわかる。仮に人口21万6000人の町で1人が負傷したらFacebookは災害安否チェックをオンにするのだろうか?

そんなことをしたらFacebookのユーザーはのべつまくなしに「無事」をクリックし続けねばならない。逆にニュースフィードは「無事」の報告で埋め尽くされてしまう。世界は災害で煮えたぎる魔女の大鍋のように見えてくるに違いない。こういう不注意な考え方をすると「一歩でも外に踏み出せばありとあらゆる予測不可能の危険が待ち受けている」という印象を受けることになる。新しいものごとに挑戦しようとする意欲が失せるかもしれない。少なくとも行ったことのない場所へ行ってみようという気持ちは大きくくじかれるだろう。

われわれの頭脳は恐怖や不安に過敏に反応することはよく知られている。悪いことが起こるであろう客観的な確率よりも、センセーショナルな映像や記事がわれわれの行動を支配する。本当に恐ろしい事象の可能性より、たまたま拡散されてきた過激な画像のほうが強い印象を与える。われわれは悪いことに対して過敏に反応する。仮にニューヨークの地下鉄でテロリストが15人を殺害したらFacebookは安否チェックを立ち上げるに決まっている。

しかし統計的いえばニューヨークでは毎月15人以上が交通事故で死んでいる。しかしFacebookは月末ごと「交通事故に遭わず無事だった」というハブを立ち上げることはない。極端な例に思えるかもしれないが、この仮定では交通事故で死ぬ確率のほうがずっと高いのだ。

つまりこういうことだ。ささいな問題でいちいち「無事」をチェックし、Facebookの友達全員に「無事」を知らせることは、短期的に何人かの友達の不安を軽減するかもしれないが、大局的にみるなら、不必要な不安を煽り、誤った世界認識を拡散する結果を招く結果になりかねないない。

ときとして本当に大規模が起きることがある。そのような恐ろしい事態なら上に述べたようなことはもちろん当てはまらない。その地域で1年間に交通事故で死亡するよりずっと高い確率で死亡するような災害であるかどうかは一つの目安になるだろう。Facebookがそういう本当の災害だけに「無事」をチェックする機能を制限するならこれはたいへん有益な機能だ。誤った不安を拡散しないようFacebookが災害対策関連のアルゴリズムを改善することを期待する。

(日本版)ちなみに東京都の交通事故統計によれば2018年の死者数は143人だった。母数を昼間人口の1600万人とすると、11万2000人に1人の確率となる。全国の交通事故死者数は3532人、日本の人口は1億2649万人だった。最近のベストセラー、『Factfulness』がこのバイアスを取り上げている。TED講演の再生3500万回という著者、ロスリング博士によれば「ジャーナリストは常に記事が注目されることを目指す必要があるため不安を煽る偏向がかかりやすい」という。ソーシャルメディアにもそのまま当てはまるろう。『Factfulness』はKindle版、印刷版とも刊行中。

原文へ

滑川海彦@Facebook Google+