GoogleのBigQueryが分析関数を強化, UIを一新, 料金を値下げ

Google BigQueryは、いくつかの新たなアップデートにより、大量データの低料金かつ迅速な分析サービスを、より使いやすくしようとしている。BigQueryはテラバイトのオーダーのデータを処理するが、今日(米国時間6/11)発表されたアップデートで、大きなデータベースのアドホックな分析における柔軟性が増し、またより高度な分析ができるようになった。

新たな機能は6つある: 1)クェリの出力量の制限を撤廃、2)高度なウィンドウ関数、3)再計算における時間とコスト節減のためのキャッシングの改良、4)クェリのコスト情報を瞬時に提供、5)ストレージ費用の低減、6)大型ワークロードのサポート(全ユーザに対し対話的クェリのクォータを倍増)。

BigQueryの新しいウィンドウ関数によってユーザは、“結果のランキング、分布や百分位を知る、JOINをせずに結果全体を横断する”、などができる。

データ量が大きいと費用も無視できない。その点、新しいユーザインタフェイスによって、データの管理がやや容易になり、時間節約が可能になった。正しいシンタクスのクェリに対してUIは、そのクェリの実行コストを事前に教えてくれる。

ストレージの費用は1ギガバイトあたり月額12セントが8セントに値下げされた。大型ユーザのためにはクェリ単位の料金設定もできるようになる。

BigQueryは、数十億行ものデータを処理する。そのベースとして使用しているGoogle Dremelは、リアルタイムのアドホッククェリシステムとして、Hadoopの分析能力を上回る、と言われている。

Dremelをオープンソース化しよう、という動きもある。ApacheのDrillは、Dremelの技術をオープンソースで実装している。ClouderaのImpalaも、オープンソースのリアルタイムクェリエンジンだ。2月にローンチしたCitus DataCitusDB for Hadoopは、数ペタバイトのデータを数秒で処理するサービスだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


ビッグデータ市場は分析データベースへと進化中: JethroDataがHadoopの弱点克服で$4.5Mを調達

jethrodata

Hadoopをベースとする分析データベースJethroDataが今日(米国時間2/27)、Pitango Venture Capitalが率いる投資ラウンドにより450万ドルを調達した、と発表した。

JethroDataはイスラエルの企業で、Hadoopの、ストレージに対するスケーラビリティと、完全にインデクシングされた列指向型分析データベースのクェリ機能を組み合わせた、サービスを提供している。列指向データベースは、大量のデータに対して複雑なクェリを行うデータウェアハウスシステムで重宝された歴史を持つ。

ファウンダのEli Singerはメールによるインタビューで、同社の差別化要因は、Hadoopにデータを保存して、それらを分析のために取り出す、ややもすれば複雑な工程を、単純化して能力を高めた点にある、と述べた。分析データベースとHadoopが別立てである企業が多いが、それだと、データをスキャンして分析するのに時間がかかりすぎる弱点がある。そのような分析は、結果をリアルタイムで見る方式ではなく、バッチで行われることが多い。Jethroは、クェリをHadoopネイティブで行うことにより、パフォーマンスが高いと主張する。

JethroDataには競合他社も多い、とSingerは言う。いちばん直接的な競合他社はHadaptで、ここもやはり、Hadoopに保存したデータをデータベース的に組織化する手法をとっている。

またClouderaImpalaは、Google Dremelによる高速なフルスキャンシステムでMapReduceをリプレースしている。Dremelはビッグデータ分析におけるGoogleの、MapReduceに次ぐ後継技術だ。Apache Drillをサポートすると発表したMapRも、やはりGoogle Dremelがベースだ。先週はHortonworksが、同社の独自技術であるTezを発表した。Citus Dataにも、Google Dremelによる自社独自の分析データベースがある。それは、PostgreSQLのコアの並行処理でクェリを行う点に、独自のイノベーションがある。

Singerによると、HBaseを使っている企業もある。それは、今のところHadoop上で可利用な唯一のデータベースだ。Drawn to ScaleSplice MachineがHBase派だ。Salesforce.comにはオープンソースのPhoenixプロジェクトがあり、HBase上のSQLを提供している。

さらに、JethroDataと競合する分析データベースとデータウェアハウス企業としては、HP Vertica、EMC Greenplum、IBM Netezza、Teradata Aster、InfoBrightなどがある。

JethroDataではこれまで、ある顧客企業がアルファテストをやっていたが、次の四半期からベータに入り、より多くの企業が利用できるようになる。今社員数は8名だが、年内には25名になるという。

分析データベースの市場は、ビッグデータ分析の次の最先端領域だ。JethroDataらは、Hadoopのアキレス腱対策に取り組んでいる。それは、ビッグデータの集積から、必要なデータを取り出し、分析し、結果をリアルタイムで見せることだ。成功の鍵は、今たくさん雨後の筍している競合他社に対する強力な差別化を、今の、市場が若いうちに確立することだ。そして、大差で先頭を走り続けること。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))