43億円超を調達してHadoopから大ピボットを敢行したDatameerに投資家たちが期待

Datameerは、オープンソースのHadoop(ハドゥープ)プロジェクトに乗っかってデータ準備サービスを提供するスタートアップとして誕生したが、このほど4000万ドル(約43億5200億円)の投資を発表してHadoopからの大ピボットを敢行した。ただしこれまでと同じくビッグデータの仕事をしていくことには変わりない。

この投資は、同社の従来からの投資家であるST Telemediaがリードした。ほかにも既存の投資家Redpoint VenturesやKleiner Perkins、Nextworld Capital、Citi Ventures、およびTop Tier Capital Partnersらがこのラウンドに参加した。Crunchbaseのデータによると、同社の調達総額はこれで1億4000万ドル(152億3100万円)近くになる。

CEOのChristian Rodatus(クリスチャン・ロダトゥス)氏によると、同社の最初のミッションはHadoopをデータサイエンティストやビジネスアナリスト、それにエンジニアなどの人々にとって容易に利用できるようにすることだった。しかし昨年は、最大のHadoopベンダーである3社、ClouderaとHortonworksとMapRを不運が見舞った。その結果ClouderaとHortonworksは合併し、そしてMapRはHPEに安値で売られた

2年近く前に誕生したDatameerはこの状況を見て、自分も変わるべき潮時だと悟った。そこでまず、2つの新しいプロダクトの開発を始めた。これまでの顧客を失いたくはないので、同社のHadoopプロダクトの改造に着手し、それを今ではDatameer Xと呼んでいる。それは現代的なクラウドネィティブのプロダクトで、人気の高いオープンソースのコンテナオーケストレーションツールであるKubernetesの上で動く。HadoopではなくApache Sparkを使う。このピボットの3分の2は完了しており、すでに顧客の手に渡っている。

同社は、まったく新しいSaaSツールであるNeeboも発表した。これはデータサイエンティストに、どこから得たデータであっても処理できる能力を与える。ロダトゥス氏によると、これからはますます雑多なデータを相手にしなければならない。普通のデータもあれば、データアナリストやデータサイエンティストがPythonで書いたコードもある。SaaSのベンダーのダッシュボードにもデータがある。Neeboはこれらすべてをマネージドサービスの中でまとめて、データサイエンティストがインサイトを得られるようにする。TableauやLookerのようなデータ視覚化ツールも使える。数週間以内に一般公開できる予定だ。

このピボットをやり終えるためにも、今度の資金は重要だ。技術者を増員して工程を継続し、マーケティングと営業を充実して新製品を売っていきたい。楽にできるピボットというものはないけれども、でも投資家たちは同社が既存の顧客をベースに成長できる、と期待している。それに一般的にも、データサイエンスのためのツールにはこれからますますニーズがあるはずだ。同社の今後を見守りたい。

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

DatameeerがシリーズDで$19Mを調達, Hadoopとデータ分析/BIの市場は成熟期に入る

データ分析市場のブームが始まっている。Clouderaなどのビッグデータ企業が提供するHadoopディストリビューションが成熟し、またリアルタイムのデータ処理ができるようになって有用性も増した。今では安価な日用雑貨のようなハードウェアを集めてクラスタを作り、データの分散処理を行い、その結果を分析する。そして顧客たちはHadoopとデータ分析を組み合わせたデータハブを作って、それまでのデータウェアハウス技術よりも安上がりな代替技術を備えようとしている。

Datameerは、このようなトレンドに乗じようとしているビジネスインテリジェンス(BI)企業だ。同社は今日、Next World Capital(NWC)が率いるラウンドにより、1900万ドルの資金を調達した。これには、WorkdayCiti Ventures、そしてSoftware AGが新たに参加し、既存の投資家Kleiner Perkins Caufield & ByersRedpoint Venturesも参加した。今回のシリーズDのラウンドにより、同社の獲得資金総額は3660万ドルになった。

Datameerの技術はMapReduceをその内部で利用し、データをノードのクラスタにマッピング、さらにそれを縮小してデータの統合化やデータ分析、データの視覚化などのアプリケーションへ供給する。HadoopはDatameerのデータハブとして機能し、BIのためのプラットホームを提供する。

Searsなどのモデル企業はDatameerのこのようなデータ処理構造を、クレジットカードの不正防止に利用し始めている。また、機械類の予防的メンテナンスや、広告料金の設定の最適化などにも使われている。

これらのユースケースは、Hadoopの真価を実証している。企業はますます、自社独自のデータハブの構築に巨費を投じるようになっている。NWCのパートナーBen Fuは、今週行った電話インタビューでこう語った。

“われわれは、Hadoopの利用が一つの山場にさしかかった、と感じている”、Fuはそう言った。“しかも今のトレンドは、今後数年は続くだろう”。

NWCはヨーロッパで顔を広め、このデータ分析市場に関して企業にカウンセリングを行うアドバイザー組織を構築した。オープンソース製品を幅広く利用していることもあって、同社にとっての機会は急速に開けつつある。

“企業の理解と取り組みのペースは合衆国よりも速い”、とFuは言った。

データ分析とその上のBIの市場は、今ブームになりつつある。したがってDatameerの競合他社もたいへん多い。新進のHadaptKarmasphereなどのほかに、Tableau SoftwareJaspersoft、それにMicroStrategyなども、この分野での競争相手だ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


データサイエンティストのいない企業でもHadoopを有効利用できるビッグデータ分析サービスDatameer

最近は、データサイエンティストでないふつうの人にデータ(とくにビッグデータ)分析を提供するプラットホームが増えているが、Datameeerもその一つだ。コンピュータといえば仕事でスプレッドシートを使うぐらい、という圧倒的多数のコンピュータユーザが、こうやって徐々に本格的なデータ分析に接近しつつある。

Datameer 3.0には、“Smart Analytics”(スマートアナリティクス)と呼ばれる機能があり、それによって、データサイエンティストたちがつねに自分でゼロから計算するようなワークを、あらかじめ組み込んでいる。そろそろ、こういう抽象化〜ラッパー化があってもよい頃合いだ。Hadoopの普及率は今ではとても高いから、今度はそうやってそのアクセス性が向上すべきだ。

そのための重要な課題が、雑多なデータの統合化だ。すべてのデータを集めて、それらを分析可能に整理すること。また物理面では、サーバクラスタのセットアップ、という課題もある。さらに、技術者でない者にも理解できるユーザインタフェイスも必要だ。そしてもちろん、分析結果がユーザの仕事に活をいれる、有益なものでなければならない。

Datameer 3.0のSmart Analyticsは、以下の4つの方法でデータ分析を単純化する:

  1. レコードをクラスタ化してデータ集合中に有意なグループが見られるようにする。データは、位置データ、写真、顧客のオペレーティングシステムなどさまざまだ。このクラスタ化により、ユーザはたとえば顧客リスト中の顧客データを有意義に分類できる。
  2. デシジョンツリーが目的とする結果を表示し、その中の多様な要因を分析して、デシジョン(意思決定)に導く過程を一望する。
  3. カラムディペンデンシー(column dependencies, カラム間依存関係)により異なるカラム間の関係を表示し、データ間の、それまで自明的ではなかった結びつきを明らかにする。たとえば、位置と疾病タイプの関係や、職階とクレジットスコアの関係が分かったりするだろう。
  4. ユーザの履歴データに基づいて、次はどんなものに関心を持つかを予測し、個人化されたリコメンデーションを生成するような、リコメンデーションエンジンを提供する。この機能により企業ユーザはユーザに対し、より関係性のあるより有意義なリコメンデーションができるようになる。社内にデータサイエンティストがいなくても。

CEOのStefan Groschupfが今日(米国時間6/24)のブログ記事で、市場の現状について述べている。Hadoopはそのほかの技術と同様に進化してきているので、今や何かをスクラッチで(==ゼロから)作る必要はない。Hadoopベースのサービスの中には、カスタム化ができず、長期的なメンテナンスが困難なものもある。しかし今では、Hadoopを企業がより現実的に活用できるためのサービスもあるのだ、と。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))