センサなどからのストリーミングビッグデータをリアルタイムで処理するRapidMinerのStreamsサービス

RapidMinerが今日(米国時間12/17)発表したStreamsサービスは、データのストリームをリアルタイムで捕捉して処理する。RapidMinerのMichele Chambersの説明によると、このサービスがとくに便利なのは物のインターネット(Internet of Things, IoT)の分野におけるデータの捕捉と処理や、工業分野におけるセンサデータの取得とそれに対する瞬時の対応だ。

Streamsサービスはユーザのソースからデータを取り込み、それをもとにデータのブレンディングや、ストリーミングデータの分析、データからのモデル作成、などの処理をすべて、Apache Stormのクラスタで行う。ユーザがコードを書く必要はない。ユーザはRapidMinerが開発したバックエンドに対する指示をGUIのフロントエンドから行うだけである。データの処理は、最大遅延5秒という準リアルタイムで行われる。

このプロダクトは、これまでの1年間未発表のまま温めてきたが、その理由の一部は、Apache Stormが商用製品に使えるほどの安定に達していなかったからだ。そのテスト期間にRapidMinerは、某メディア企業のセットトップボックスから得られる視聴者のビヘイビアデータの取得と分析を行った。その結果に基づいて同社は、個々の視聴者に適切なリコメンデーションを送り、また広告ネットワークに対してはターゲティング広告のための情報を提供した。

同じくこのベータ時期に、コンクリート企業がその生コン製造機械やコンクリート打ち込み機械などからのセンサデータを捕捉して分析した。そういうコンクリート関連の機械装置は酷使によってすぐに壊れるので、最大能力の75%ぐらいでしか稼働できなかった。しかしStreamsのリアルタイムデータ分析により、機械の損傷に導く二大要素が振動と湿気であることが分かった。この二つの要素を適切にコントロールすることにより、安定稼働率が95%に上がった。

RapidMinerがStreamsでねらっているのは、こういうタイプのユーザニーズだ。Chambersによると、Storm以外のもうひとつのオープンソースソフトウェアの成熟を待って、来年の第一四半期にはStreamsのアップデートを行う。

さらにChambersによると、このプロダクトは同社のこれまでの製品系列との相性も良く、顧客に提供するビッグデータ処理オプションがまた一つ増えた、という形になっている。

また、同社は近く、データ視覚化のQlikや検索のApache Solr、WebスクレイピングのMozendaなど用のコネクタもリリースする。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。