Apple、Twitter分析のTopsyを2億ドル以上で買収。SiriやAppStoreの関連性強化に利用か

Appleは、ソーシャル分析会社のTopsyを買収した。Twitterのデータ解析に特に力を入れている会社だ。The Wall Street Journalによる。契約金額は「2億ドル以上」と思われると同紙は報じている。

Topsyは、Twitterのデータ収集、解析に注力しているいくつかの会社のひとつだ。顧客は2006年以来4250億件以上のツイートにアクセスして、トレンドを感じとることができる。TopsyのTwitterデータ再販におけるライバルには、DataSiftやGnipがいるが、そのトピック・トレンド検索等のユーザー向けツールは、世間でツイートされていることを理解しようとする人々の間で人気が高い。

AppleはすでにTwitterのパートナーであり、iOSとOS Xプラットフォームにログインや投稿機能を組み込んでいることから、買収の目的がTwitterの全データにあるとは考えにくい。おそらくAppleは、Topsyの持つトレンド分析のテクノロジーと技術者を、何らかの形で自社製品に取り込みたいのだろう。

あえて推測するなら、これはAppleがAppStoreとiTunes Storeの関連性エンジンを作ろうとしていることと関係しているかもしれない。自社ストアの検索アルゴリズムにソーシャル信号を加えることによって、検索の関連性を改善し、Appleはユーザーにとってより魅力的で興味深いアプリを表面化できる。複数のソーシャルネットワークを横断してアプリのトレンドを追跡することで、アプリのカテゴリーや品揃えを微調整し、人気アプリをいち早く浮上させられる。

これを先に進めれば、AppleはあなたのTwitterフィードデータを利用して、「一般的」ではなく、より個人的な基準でアプリを推奨することも可能になる。Appleは現時点でこの種の個人的推奨を殆どやっていないが、何事も初めての時はある。

WSJの記事は、iTunes Radio広告とiAdプラットフォームも、Topsyエンジンの恩恵に預かる候補だと指摘している。理論的に、Appleはソーシャルデータを使って、広告主がより関連性の高い視聴者に広告を打てるよう手助けできる。これは、これまで絶好調とは言えなかった、Apple広告プラットフォームにおける売上と関連性を強化するものだ。

Appleは、アプリ検索会社のChompを昨年売収したが、結局使ったのは主にその「カード風」インターフェースだけで、一部が予想していた優秀な発見モデルではなかった。残念ながらこの買収は、AppStoreの検索結果に大きな改善をもたらしていないようだ。また、最近Appleはストア内検索に手を加え、ミススペリングやタイプミスの修正を強化した。

AppleがTopsyのトレンドデータやTwitter生データを使って、Siriの検索を改善しようとしている可能性もなくはない。そうなればSiriが質問された時、Twitterにおけるトレンドトピックや検索結果を利用者に提示できる。

Topsyはソーシャルネットワークに関連して、10件以上の特許を申請している。その中には、予測ベースでソーシャルメディアネットワークをクロールするためのシステムおよび方法や、ソーシャルネットワークから収集したソーシャルメディアコンテンツのカスタマイズ化フィルタリングと分析のシステムおよび方法がある。

Twitterの全データにアクセスできる数少ない会社の1つで、Twitter初の認定パートナーでもあるTopsyが買収されたことによって、残された者たちの市場は変わっていくだろう。

Topsyのチームや製品が何に利用されるにせよ、その強味は巨大データセットのリアルタイム解析にあるので、時間に依存する、あるいは、流れくる情報の影響を受け続ける何かに使われるだろう。これは、Twitterのようなネットワークを流れるデータに対する、Appleの興味の高まりを示すものであり、ある意味で新鮮な考えだ。これまで同社は、この分野にあまり熱心ではなかった。Appleはこの買収をWSJに対して正式に認めた。

[原文へ]

(翻訳:Nob Takahashi facebook


Topsy、2006年以来の全ツイートを検索可能に。他のソーシャルメディアのインデックスも作成中

Twitterは,ソーシャルネットワークとしてトップクラスの地位を確立し、FacebookやLinkedIn、YouTubeなどのサイトと同列に語られるようになり、さらには最新ニュースの目的地にもなった。しかし、リアルタイムメディアのGoogleになるべく検索エンジンとしては、未だにTwitterは成功していない。TwitterのデータパートナーであるTopsyにとって、それは好機だった。

もしウェブが今、ページランクされたウェブサイトと同じくらい、近況ステータスとハッシュタグ付の記事で埋まっているのだとすれば、大きな部分が失われていることになる。Twitterの場合、2006年に遡る歴史のごく表面を撫でているだけだ。現時点でそのアーカイブには4250億件からのツイートが入っている。

わずか 4社しかないTwitterデータ認定リセラーの一つであるTopsyは、これまで発信されたツイートすべてをインデックスしていると言っている — これはTwitterもやっていないことであり、必要な基盤作りとコストゆえ容易には真似できない(Topsyは、2008年以来3500万ドルのベンチャー資金を調達したと言っている)。

一方、今日のTwitterの関心事は「今」と「最近」であり、遠い過去ではない。search.twitter.com に行くと、見つかるのは「日」単位のツイートであり、月でも、もちろん年でもない。そして、季節が変わるごとにこの時間幅は狭まっていく。現在Twitterのインデックスはわずか1週間しか遡らないと同社は言っている。去る2009年、それは1週間半だった。それ以前はひと月だった。

Topsyは今年8月、システムの拡張によってTwitterのアーカイブを2010年まで遡れるようになった。そして今、7年間のデータすべてを掘り起こせる。これは、無料の公開利用向けとして、史上最大にして最も包括的なTwitterデータアーカイブだ。Twitter以外でこのデータをアクセスしたこ
とがあるのは、Gnipなどのデータパートナーおよび議会図書館だけだ — ただし、一般利用者が検索できる形式ではなかった。そしてもちろん、無料ではなかった。 

Topsyの共同ファウンダー・CTOのVipul Ved Prakashによると、Twitter開始以来の全ツイート — 現在4250億項目、3500サーバーにわたる — をインデックスすることは大掛かりなデータ技術だった。「われわれの第3世代のインデックス技術は、サーバー1台にインデックスできるドキュメントの密度を高め、その結果あらゆるツイートを含む巨大なインデックスを運用できるようになった」と彼は言った。Topsyは、最終的に兆単位規模のドキュメントを処理できるようになり、彼らが取り組んでいるインフラストラクチャーベースのビジネスを構築していないライバルたちは太刀打ちできない、とも付け加えた。

この手の大胆なことを言いたがる会社は数多いが、この主張にはそれなりの真実がある。今日のウェブは変化している。例えばTwitterは、毎日4〜6億件の新しいツイートを送り出し、Topsyはそれを150ミリ秒以内にインデックスしている。言い方を変えると、Twitterが今後一年間に生成するデータ量は、今日までに生成された全ツイートよりも多い。

TwitterとFacebookが毎日生みだしているデータは、それ以外のウェブで生まれるデータよりも多い

そしてこれにFacebookを加えると、Googleが理解できるのはウェブのごく一部にすぎないことに気づく。「現在TwitterとFacebookが毎日生みだしているデータを合わせると、それ以外のウェブで生まれるデータよりも多い」とPrakashは説明する。「ソーシャルデータは益々大きな公共資料になった」(これが「なぜGoogle+が存在するか?」への答えだ)。

そしてもし今ソーシャルウェブが巨大なウェブであるなら、Topsyの野心がTwitterに留まらないのは驚くにあたらない。すでに同社のテクノロジーは、ユーザーがツイートしたリンクはもちろん、Facebookをはじめ他のソーシャルメディアサイトの全公開ページをインデックスできる準備が整っている。Google+の公開記事すべてのアーカイブも持っている。

「我々は、将来利用可能になるインデックスをいくつかバックグラウンドで作っている」と、Topsyの将来計画についてPrakashは示唆した。しかし、Facebookのインデックスに関しては、同社が作っているものの詳細は語らず「非公開」とだけ言い、「公開ページのアクセスは公開されている」だから「もしわれわれがあるソーシャルネットワークのために価値を作り出すなら — ビジネスとして意味があるなら — さらに深くデータにアクセスするだろう」と指摘した。

Topsyのソーシャルネットワーク例えばTwitter(あるいは他にも)に求める価値は、集めた後のデータに対して何ができるかという機会の問題だ。たとえば、データにまつわる詳細な統計データを提供することで、これは現在ツイートについて彼らがやっていることと似ている。Topsyは、”Obama” といった単語が過去何回言及されたかを数えることができる。あるいは、新しいiPhoneについてユーザーが〈本音で〉どう感じているかをヘッジファンドに教えることもできる。ブランドは自社のソーシャルメディアでのプレゼンスを監視して、広告やインフルエンサーのターゲット方法を改善できる。ジャーナリストは記事の情報収集に使える、等々。

「ソーシャルネットワークの排出物を処理することは、ソーシャルネットワークが今やっているビジネスとは異なる種類のビジネスだ」とPrakashは言う。Twitterの関心事は、バブリッシング・プラットフォームの構築や、ツイートをめぐるエンゲージメントを収益化することであり、アーカイブの分析結果を提供することとは限らない。Twitterには、エコシステムパートナーが先行していたビジネスに乗り出した過去があるが、Prakashはそれを恐れていない。なぜなら彼らはTwitterを補完するのであって、置き換えるものではないからだ。

それでもTopsyは、Twitterと共生関係になることを選んだ — APIアクセス(Twitterデータの「消防ホース」とも呼ばれる)のためにTopsyは非公開の金額を支払い、一方Twitterも、大統領選挙インデックスアカデミー賞インデックスなどの特殊ツールを作るために、別契約を通じてTopsyに費用を支払っている。ちなみに、Topsyの分析サービス利用者は、月額1000ドルをTopsyに払っており、API利用者は使用データ料に応じて料金を払っている。

ある日、Twitterはこれを面白いビジネスだから自分でやりたいと思うだろうか? そしてもし、Topsyのシステム基盤が容易に真似できなければ、TwitterはTopsyを
買収するのだろうか? 「その可能性はなくはない」とPrakashは認めたが、それについて両社で話したことはないと念を押した。今のところ、Topsyは規模拡大に向けて資産を消化しているところだが、顧客数や売り上げはもちろん成長率も明らかにしなかった。

長期的には、ソーシャルメディアの歴史的アーカイブが、特定のビジネスやマーケターに価値を生むかもしれないが、一般の主流ユーザーが同じように感じるかどうかは別の問題り。しかし、時間とともに変わる可能性はある。「10年以内に、ソーシャルメディアがインターネットのように見え始めるかもしれない・・・それは巨大なデータ保存庫を持つ異なるエコシステムだが、新しい市場が形成されようとしている」とPrakashは言う。「われわれの野望は、あらゆる公開ソーシャル書き込みを自分たちのすインデックスに取り込むことだ」。

原文へ
 
(翻訳:Nob Takahashi)