トランプの新大統領補佐官は、ケンブリッジ・アナリティカとつながっていた

トランプ政権3代目の国家安全保障担当補佐官、ジョン・ボルトン氏は、初代補佐官だったマイケル・フリン氏と少なくとも1つ共通点がある。ふたりとも、炎上するFacebookのプライバシー問題の中心をなす政治データ分析会社、Cambridge Analyticaと結びつきがある

The New York Timesの最新記事によると、ジョン・ボルトンの政治活動団体であるThe John Bolton Super PACは、Cambridge Analyticaと2014年8月に契約を結んでいた。同社が設立された数カ月後で、まだFacebookデータを収集していた時期だ。

Cambridge Analyticaの設立当初、Boton Super PACは、市場調査および「サイコグラフィック・メッセージング」を用いた精密な行動ターゲティングのために2年間にわたり120万ドルを同社に注ぎ込んだ。

この作業を行うために、Campbridge社はFacebookのデータを使ったことが、文書および本件に詳しい元従業員2名の証言からわかったとThe New York Timesは報じている。

調査結果は、共和党のトム・ティリスの2014年上院議員選挙に貢献した。記事によると、ボルトン氏のSuper PACはデータの出所がFacebookユーザーであることを認識していたが、データがFacebookデベロッパーから同意なく取得されたことをボルトン氏が知っていたかどうかは明らかにされていない。

Cambridge Analyticaは、同社が不正にデータを取得したとする報道に対して今も反論を続けている。同社の新たな声明で、CEO代行のAlexander Taylorは、親会社がFacebookデベロッパーからライセンスしたデータを、同社が不正入手した認識はないとの立場を貫いている。

当社は問題のデータがFacebookの利用規約およびデータ保護法に沿って入手されたものと信じている。

私は2015年10月にCambridge Analyticaの最高データ責任者に就任した。その少しあと、Facebookからデータを削除するよう要求があった。当社は直ちにファイルサーバーから原データを削除するとともに、システム内の派生データを探し削除する作業を開始した。一年前にFacebookが再度確認を求めてきた際、当社は内部監査を行い、データ、派生物、およびバックアップがすべて削除されていることを確認し、その旨の証明書をFacebookに提出した。私は2016年米国大統領選挙で当社が実施した作業でGSR社のデータを利用していないことを確信している。

Cambridge Analyticaと同じく、ボルトン氏の政治団体は、トランプ政権に多大な影響力をもつ保守系資本家であるRobert Mercerから資金提供を受けていた。

[原文へ]

(翻訳:Nob Takahashi / facebook

建設現場の健康環境をモニタするSmartSiteのハードウェアは一般市販のセンサーを使って低価格を実現

smartsite_screen

Y Combinator出身のSmartSiteが、建設労働者の労働環境をモニタするハードウェアとクラウド上のソフトウェアのペアをリリースした。

癌や呼吸器障害、皮膚炎などは肌や粘膜が危険物質に触れることで起こり、また過度な騒音や振動も健康被害をもたらす。これらの劣悪な環境にさらされることは、とくに建設労働者において多い。

アメリカ労働省のデータによると、建設労働者の労災死は最近増加傾向にあり、2014年には874名を数えた。

そこでSmartSiteのシステムは、ノイズのレベルと、空気中の微粒子、および紫外線をモニタする。

協同ファウンダーのMichael AndreaとJames Batstoneによると、SmartSiteのモニタリングハードウェアは一般市販のセンサーを使っており、それらは、マイクロフォン、レーザーによる微粒子カウンター、そしてUVセンサーだ。

SmartSite's system monitors particulates, UV rays and more on construction sites.

SmartSiteのシステムは建設現場の微粒子と紫外線などをモニタする。

一方彼らのソフトウェアは、完全に独自製品だ。それにより建設チームは、現場の安全な場所と危険な場所を見分けることができる。

AndreaとBatstoneが建設労働者の健康と安全に関心を持ったのは、彼らがロンドンのRoyal College of Art(王立芸術大学院)のプロジェクトでプロダクトデザイナーおよびスマートシティの研究者として仕事をしていたときだ。

そのとき知ったのは、建設企業は大も小も、環境の有害無害を、各現場の過去の情報や経験に基づいて評価していることだった。

ときどきは正確な測定を行うが、そのための装備は高価であり、また測定には長時間を要した。

SmartSiteのねらいは、建設現場を毎日正確にモニタすることだ。しかも、現場作業の邪魔をすることなく。またそのための器具等は、持ち運びや設置が極力簡単でなければならない。いろいろ、複数のものを持ち込む方式は、もってのほかである。

Andreaは語る、“結局、どの企業も労働者のために正しいことをしたいと思ってはいるけど、しかし実際に疾病等を見つけて誠実に対応していたら時間と費用を要し、訴訟に持ち込まれることもある。だから、積極的なモニタリングを、さぼりがちになる”。

今某社とパイロット事業を進めているが、その社名は明かせないそうだ。

SmartSiteはY Combinatorの今の学期の‘生徒’で、すでにこのアクセラレータから若干の資金をもらっている。そのほかの資金調達計画や、過去の調達額に関しては、ノーコメント、だそうである。

画像提供: SmartSite Inc.

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

ビッグデータ分析には直感とサイエンスの双方が必要

編集部: この記事はSteven Hillionの寄稿。HillionはAlpine Data Labsの共同ファウンダーであり、同社のエンタープライズ向けビッグデータ分析プラットフォームの開発責任者である。Alpineを起業する以前は、Siebel 、Greenplumなどでエンジニアのチーム責任者を務めていた。

現在、データは今までにない規模とスピードで動いている。これを分析にするにはきわめて高度なハード、ソフトを必要とする。ではビッグデータ分析が登場してからは昔ながらの「直感」は無用となったのだろうか? データは「進め」と言っているのに経営者の直感は「待て」だったときにはどうすればいいのだろう?

私のような人間―数学とテクノロジーの専門家―がこういうと意外に聞こえるかもしれないが、私はビジネスマネージャーはデータに加えて直感を重視しなければならないと強く信じている。

一部の人々は所与のデータ・セットから適切なモデルを組み立てるには数学とマシンパワーさえあれば十分だというように考えがちだ。しかしデータの機械処理だけでビジネス上の適切な意思決定ができるなどというのは愚かしい考えだ。データ・サイエンスでは分析と直感は車の両輪であり、互いに他を必要としている。

そもそも直感は分析を方向づける。分析の結果は何もないところからいきなり現れるわけではない。まず観察に基づいた何らかの直感があり、そこから構築された仮説を検証するためにコンピュータによる数値処理が行われる。またデータ・サイエンティストがどんな数値処理の手法を用いるかについても直感が導きとなる。どのデータが本質的に重要なのか? どの変数が、どの過程が意味があるのか? どれが原因でどれが結果らしく思えるか? どのモデルがいちばん適切か? こうしたことはすべて直感が関係してくる。

次に分析が直感に根拠を与える。 教師なし(unsupervised)モデリングは、一見しただけでは不明な関連やパターンを巨大なデータ・セットから探し出すことができる。分析は単なる観察では発見が不可能であり、時には直感に反するような方向を探索するきっかけを与える。ビジネス運営者の経験に基づく直感とデータ・サイエンティストの分析が適切に補いあわなければ必ず問題が発生する。

いくつか私が経験した例を紹介しよう。

あるチームは銀行の一般個人顧客について、口座を閉じそうな顧客を事前に予測するモデルを作ろうとしていた。しかし生成されたデータからはそれらしいパターンが発見できそうになかった。預金、ローン、クレジットカード、すべての分野を通じて顧客が解約する兆候らしきものは見つからなかった。顧客の預金引き出しやクレジットカードによる消費のパターンに特に変化はみられないのに、突然に解約が行われる。

しかし銀行チームが顧客のセグメントごとにさらにデータを詳しく検討していくうちに、あるアナリストの直感が貴重な発見をもたらした。彼女はある顧客セグメントに注目した。このセグメントは平均より飛びぬけて多額のローンを組んでおり、契約期間も長いなど、いくつの特異な属性を示しており、全体として顧客価値が極め高かった。 アナリストはこのセグメントの顧客はスモールビジネスのオーナーではないかと思いついた。そして個別の顧客情報を確認するとそのとおりだった。

アナリストは「これらのオーナーたちは一般個人向けのローンやクレジットカードよりも有利なスモールビジネス向け融資の仕組みがあることを知らないのではないか?」と考えた。そこでこうした高価値顧客を発見し、適切な金融商品を売り込むことにプロジェクトの目標が急遽、変更された。チームは.さらにデータ分析を続け、特定のセグメントの顧客に特化したセールスを行った場合の効果を検証した。その結果、セグメントごとにカスタマイズした金融商品の売り込みは効果があることが明らかになった。

データにいかに数値処理を加えてもこの結果―あるセグメントの顧客はスモールビジネスのオーナーである―は出て来なかったに違いない。ビジネスの経験に基づくこうした直感とデータ処理が統合されるときわめて価値ある結果がもたらされる。

こうした例でも明らかなように、ビジネス経験に基づく直感はデータ分析の決定的に重要な部分だ。にも関わらず、データ分析でビジネス側の経験者がプロセスから排除され、最後に結論だけを知らされるという例があまりにも多い。ビジネス・サイドの知識を持つメンバーをプロセスの当初から招き入れることが絶対に必要だ。私は、チームのプロセスをこうした線に沿って改革し、生データをレビューするもっとも早い段階からすべてのメンバーが参加するようにした。

われわれが経験したもう一つの例では、クライアントは巨大飲料会社だった。日本におけるセールスを予測するというのが彼らの依頼だった。われわれは経済動向と価格を変数として来年の売れ行きを予測するモデルを作った。クライアントは「売れ行きは景気に正比例するはずだ」とわれわれに告げた。日本の景気が徐々に回復すればそれに比例してソフトドリンクの売上も伸びるというわけだ。

クライアントはモデル中の景気の変数として日経平均を用いるよう要請してきた。このモデルは当初は適切な予測をするように見えた。しかし翌年入って時間が経つに連れてモデルは馬鹿げた予測を出し始めた。これは日経平均が当初予想した範囲の上限を超えて上昇したため、モデルが破綻したのだとわかった。もっと優秀なモデル設計者だったら、そもそも日経平均を変数に組み入れるような危険なことはしなかっただろう。

直感が重要な場合も多い。同時にデータサイエンスではモデリングの限界を知る慎重さが必要だ。われわれは清涼飲料水の売上予測モデルから日経平均を外した。するとモデルはうまく作動するようになり、翌年のマーケティング戦略の立案に重要な役割を果たすことができた。

データサイエンティスト側とビジネス実務側の間にはとかく緊張が生まれやすい。データ分析の結果が直感に反するように思える場合―たとえば派手なマーケティング・キャンペーンの効果がゼロに近いなどという結果が出たときには特にそうだ。われわれデータサイエンティストは往々にしてテーブルの向こうに座ったクライアントのマーケテティング担当者から「いったい全体、そんあ数字はどこから出て来たんだ?」と詰問される。

しかし私はこうしたやりとりは非常に重要だと考えている。数学と科学的分析はビジネス側の疑問に正しく答えることができなくてはならない。あるときはデータ分析の結果が直感が間違っていることを明らかにする。しかしあるときはデータ分析の欠陥を直感が明らかにすることがある。こうして直感と分析があい補っていくのが理想だ。

カット画像:Shutterstock USER Stocksnapper (IMAGE HAS BEEN MODIFIED)

[原文へ]

(翻訳:滑川海彦@Facebook Google+


DatameeerがシリーズDで$19Mを調達, Hadoopとデータ分析/BIの市場は成熟期に入る

データ分析市場のブームが始まっている。Clouderaなどのビッグデータ企業が提供するHadoopディストリビューションが成熟し、またリアルタイムのデータ処理ができるようになって有用性も増した。今では安価な日用雑貨のようなハードウェアを集めてクラスタを作り、データの分散処理を行い、その結果を分析する。そして顧客たちはHadoopとデータ分析を組み合わせたデータハブを作って、それまでのデータウェアハウス技術よりも安上がりな代替技術を備えようとしている。

Datameerは、このようなトレンドに乗じようとしているビジネスインテリジェンス(BI)企業だ。同社は今日、Next World Capital(NWC)が率いるラウンドにより、1900万ドルの資金を調達した。これには、WorkdayCiti Ventures、そしてSoftware AGが新たに参加し、既存の投資家Kleiner Perkins Caufield & ByersRedpoint Venturesも参加した。今回のシリーズDのラウンドにより、同社の獲得資金総額は3660万ドルになった。

Datameerの技術はMapReduceをその内部で利用し、データをノードのクラスタにマッピング、さらにそれを縮小してデータの統合化やデータ分析、データの視覚化などのアプリケーションへ供給する。HadoopはDatameerのデータハブとして機能し、BIのためのプラットホームを提供する。

Searsなどのモデル企業はDatameerのこのようなデータ処理構造を、クレジットカードの不正防止に利用し始めている。また、機械類の予防的メンテナンスや、広告料金の設定の最適化などにも使われている。

これらのユースケースは、Hadoopの真価を実証している。企業はますます、自社独自のデータハブの構築に巨費を投じるようになっている。NWCのパートナーBen Fuは、今週行った電話インタビューでこう語った。

“われわれは、Hadoopの利用が一つの山場にさしかかった、と感じている”、Fuはそう言った。“しかも今のトレンドは、今後数年は続くだろう”。

NWCはヨーロッパで顔を広め、このデータ分析市場に関して企業にカウンセリングを行うアドバイザー組織を構築した。オープンソース製品を幅広く利用していることもあって、同社にとっての機会は急速に開けつつある。

“企業の理解と取り組みのペースは合衆国よりも速い”、とFuは言った。

データ分析とその上のBIの市場は、今ブームになりつつある。したがってDatameerの競合他社もたいへん多い。新進のHadaptKarmasphereなどのほかに、Tableau SoftwareJaspersoft、それにMicroStrategyなども、この分野での競争相手だ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))