多様な非定型データの分析サービスを提供するSensaiがAndreessen Horowitzらから$900Kを調達

データ分析は帳票などの定型的なデータを対象とすることが多い。しかし企業のペーパーレス化が進み、電子化されたドキュメントが増えるに伴って、非定型的なデータが多くなり、それまでの技術では分析が難しくなる。PalantirやIBM(のWatson)は、非定型的なテキストデータを容易にクェリできる方法を提供しようとしている。そしてこの分野の新人選手Sensaiが今日(米国時間3/31)、ステルスを脱して正式にローンチする。

同社は今日さらに、Andreessen HorowitzとFormation8、Chris Kelly、ValueStream Labsなどからの90万ドルのシード資金の獲得を発表した。ビッグデータ関連のインキュベータData Eliteから巣立った同社は、年内にシリーズAの資金調達を行う予定だ。

sensai_screenshot_investigations

Sensaiは、料金の安さと、データサイエンティストたちにとっての使いやすさで勝負したい、と言っている。月額料金は5000ドルからだが、顧客のニーズに応じて利用プランをカスタマイズできる。また使いやすさの面では、顧客企業の一般社員でも使えるようにする、という。Sensaiは非定型的なデータの分析を得意とするが、競合他社はどちらかというと、それぞれの企業独自の定型的データを扱うところが多い、と同社は主張している。

対象データは内部のファイルやソーシャルメディア、Web上の記事、オンラインの公開ドキュメントなどさまざまだが、それらに対するクェリをユーザがセットアップすると、結果はリアルタイムでSensaiのダッシュボードに現れる。またユーザがカスタマイズした報告書への出力や、APIからの結果取得も可能だ。Sensaiはクラウドサービスとしても、あるいはオンプレミスの展開でも、どちらでも利用できる。

同社によると、そのサービスは人工知能と深層学習(deep learning)の技術を駆使して、ユーザのクェリを非定型ドキュメントの集積に対して適用する。結果はきわめて正確で、またそのシステムは顧客の利用歴から学んでどんどん進化するという。

サービスのクォリティに関する同社の主張を、実際に確認することはできなかったが、でも顧客の中にはSiemensや金融サービスのUBS、資産管理のWorldQuantなどがいる。SiemensはこのサービスをITの監査に利用し、UBSは同社のEvidence Labの調査に利用している。

sensai_screenshot_dashboard2

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

ビッグデータ分析/視覚化で異色の技術を築いたQuidが早くもシリーズDで$39Mを調達

独自の高度な形でデータの視覚化を行うQuidが、3900万ドルの資金調達を発表した。昨年秋に創業4年を経過した若い企業だが、今回の資金調達がすでにシリーズDである。

Quidは自分のことを、“各種の調査研究とそれらの結果からインサイトを得る過程を加速する人工知能企業で、とりわけ、世界でもっとも複雑な問題を扱う”、と説明している。具体的にはそれは、何百万ものドキュメントを処理して、その結果のヴィジュアルマップを作る、というサービスだ。たとえば企業のために、プロダクトのローンチに対するオンラインの反響を視覚化したりする。

同社のことをかつて本誌TechCrunchは、世界でいちばんうぬぼれのでっかいWebサイトと評したことがあるが、しかし今ではホームページのメインタイトルも、自分たちの技術のマーケティング的な売り込みコピーになっており(上図)、またHyundaiやMicrosoft、Boston Consulting Groupなどメジャー企業の顧客からの評価を引用している

本誌が2010年に同社を取り上げたときには、もっぱら最先端技術を追っていたが、今では対象がもっと広くなっているようだ。Quidによると、現在の顧客数は80で、プラットホームは昨年の初めに一新している。

今回の投資ラウンドを仕切ったのはLiberty Interactive Corporationで、これにARTIS VenturesとBuchanan Investments、Subtraction Capital、Tiger Partners、Thomas H. Lee Limited Family Partnership II、Quidの取締役Michael Patsalos-Fox、Quidの会長Charles Lhoなどが参加した。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa


製品の設計から広告の効果まで何でも最適化するSigOptはデータサイエンスの最新分野

Y Combinatorから孵化したSigOptのヴィジョンはでっかい。協同ファウンダでCEOのScott Clarkによると、彼の目標は、“調整可能なパラメータのあるものなら何でも最適化する”ことだ。

名前の中に最適化(optimize)のある企業やサービスは多いから、こんな話を聞いても感動しない人がほとんどだと思うが、でもClarkによると、同社はA/Bテストをやって何かを最適化するサービスではない。なるべく簡単に言うと、ひとつのもののいろんなバラエティをテストするだけではなく、同社はデータを調べて“次は何を試してみるべきか”をユーザに推奨する。だから、ユーザはそれを、ずっと継続的に改良していける。

Clarkはこんな例を挙げる: 会社で広告のいろんなバージョンをテストするとき、ひとつひとつをすべてテストして、最後にもっとも効果の高かったのを選ぶのが通例だが、SigOptでは、ユーザが指定したクリエイティブの要素、たとえば製品写真の色、アングル、位置、等々に基づいてSigOptがいろんなバージョンを作ってテストし、売上やクリック数の多いものを自動的に決める。

上のようなメディア作品だけでなく、SigOptでは製品の物理的な特性も最適化できる。たとえば同社の初期の顧客の中には、SigOptを利用してシェイビングクリーム(髭剃りクリーム)の最適配合成分を決めた企業がいる。つまりSigOptでは、テストするものは何でもよい。調整できる変量さえあれば単純にデータを利用して、その値や組み合わせをテストするだけだから、きわめて汎用的なシステムだ。

Clarkはコーネル大学で応用数学の博士号を取り、その後Yelpのターゲット広告部門の技術者として仕事をした経験から、SigOptのアイデアがひらめいた。彼がYelp時代に仲間と共作したシステムはMetric Optimization Engine(MOE)と呼ばれるオープンソースの最適化ツールで、それはYelpだけでなく、Netflixでも使われている。当時Netflixのアルゴリズムエンジニアリング部長だったXavier Amatrainが、機械学習に関する彼のトークの中で(24:58あたり)MOEに言及している。

MOEはオープンソースだが、ClarkらSigOptの協同ファウンダたちはそれをベースにプロダクトとサービスを構築した。彼はSigOptの目標について、ClouderaがHadoopに対してやったように、SigOptはMOEを商用化したいのだ、と言う。

“Netflixのデータサイエンスチームは世界最高だけど、それと同じレベルの最適化技術をうちはすべての人に提供していきたい”、と彼はそのヴィジョンを語る。

Clarkが見せてくれたデモを十分理解するためには、多少の技術的知識と、また物理的なテストの場合は手作業が多くなるが、でも印象としてはかなり単純明快で、ユーザはテストのためのコードをほんの数行書くだけだ。

まあ今のSigOptはぼくの脳力をやや超えているけど、Clarkによると、今後もっと単純化して、しかも、同社ならではの“秘密の味付け”をいろいろやっていきたい、という。

個人的にちょっと気になることがあったので、Clarkに聞いてみた。SigOptでいろんなパラメータをテストして、人間(個人)の健康を最適化することは、できるだろうか? Clarkの答は、完全に個人レベルでは無理でも、大量のユーザの健康情報がデータとして集まれば、それに基づいてリコメンデーションをしていくことは可能だ、ということだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))