MicrosoftがPostgreSQLデータベースを加速するCitus Dataを買収、顧客をAzure化か

Microsoftが今日(米国時間1/24)、Citus Data買収したことを発表した。Citus Dataは、PostgreSQLデータベースのスピードとスケーラビリティの向上をサービスとして提供している。同社のPostgreSQLエクステンションはオープンソースのプロダクトで、PostgreSQLデータベースを分散データベースに変換する。NoSQLやドキュメントストアが騒がれている今日でも、リレーショナルデータベース、とくにPostgreSQLは今だに成長市場であり、その理由の一部は、Citusのような企業が、その限界を克服するツールを提供しているからだ。

当然ながらMicrosoftのねらいは、Citus Dataのチームとの協働により“Azureの重要なエンタープライズ機能のPostgreSQLへのデリバリを加速し、重要なPostgreSQLワークロードが確実にAzure上で動くようにする”ことだ〔PostgreSQLユーザーのAzure化〕。Citusの協同ファウンダーたちも、彼らの声明文で同じようなことを言っている: “Microsoftの一員としてわれわれはこれからもPostgreSQLをベースとする素晴らしいデータベースの構築に力を入れ、ユーザーに画期的なスケーラビリティとパフォーマンスおよび彼らが必要とする障害時自己回復力を提供していく。われわれは、この分野におけるイノベーションの推進を継続する”。

PostgreSQLは言うまでもなくオープンソースのツールで、そしてMicrosoftも今やオープンソースの主要なコントリビューターであることは周知の事実だから当然かもしれないが、同社はPostgreSQLのコミュニティとの協働も強調している。Microsoftのスポークスパーソンの言い方では、“この買収は弊社のオープンソースへのコミットメントの証(あかし)であり、Azure PostgreSQLのパフォーマンスとスケーラビリティの向上が目的である”、となる。

Citusの現在の顧客は、リアルタイムアナリティクスのChartbeatや、メールのセキュリティサービスAgari、そしてPushOwlなどだ。名前は挙げないが、Fortune 100社企業も多いという。同社はクラウドからのDBaaS(database as a service)とオンプレミスのエンタープライズバージョンの両方を提供している。そして無料のオープンソースエディションもある。今後も当分それは変らないが、Microsoftは徐々に、CitusがホストしているサービスをAzureへ移行させていくのではないか。

買収の価額は公表されていない。2010年に創業したCitus DataはY Combinatorのインキュベータ事業を卒業し、これまでKhosla Ventures、SV Angel、Data Collectiveなどから1300万ドルを調達している。

関連記事: CitusDBがPostgreSQL用の列取り出しツールをオープンソースで提供開始, 複雑なクェリの効率をアップ

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

GoogleのBigQueryが分析関数を強化, UIを一新, 料金を値下げ

Google BigQueryは、いくつかの新たなアップデートにより、大量データの低料金かつ迅速な分析サービスを、より使いやすくしようとしている。BigQueryはテラバイトのオーダーのデータを処理するが、今日(米国時間6/11)発表されたアップデートで、大きなデータベースのアドホックな分析における柔軟性が増し、またより高度な分析ができるようになった。

新たな機能は6つある: 1)クェリの出力量の制限を撤廃、2)高度なウィンドウ関数、3)再計算における時間とコスト節減のためのキャッシングの改良、4)クェリのコスト情報を瞬時に提供、5)ストレージ費用の低減、6)大型ワークロードのサポート(全ユーザに対し対話的クェリのクォータを倍増)。

BigQueryの新しいウィンドウ関数によってユーザは、“結果のランキング、分布や百分位を知る、JOINをせずに結果全体を横断する”、などができる。

データ量が大きいと費用も無視できない。その点、新しいユーザインタフェイスによって、データの管理がやや容易になり、時間節約が可能になった。正しいシンタクスのクェリに対してUIは、そのクェリの実行コストを事前に教えてくれる。

ストレージの費用は1ギガバイトあたり月額12セントが8セントに値下げされた。大型ユーザのためにはクェリ単位の料金設定もできるようになる。

BigQueryは、数十億行ものデータを処理する。そのベースとして使用しているGoogle Dremelは、リアルタイムのアドホッククェリシステムとして、Hadoopの分析能力を上回る、と言われている。

Dremelをオープンソース化しよう、という動きもある。ApacheのDrillは、Dremelの技術をオープンソースで実装している。ClouderaのImpalaも、オープンソースのリアルタイムクェリエンジンだ。2月にローンチしたCitus DataCitusDB for Hadoopは、数ペタバイトのデータを数秒で処理するサービスだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


ビッグデータ市場は分析データベースへと進化中: JethroDataがHadoopの弱点克服で$4.5Mを調達

jethrodata

Hadoopをベースとする分析データベースJethroDataが今日(米国時間2/27)、Pitango Venture Capitalが率いる投資ラウンドにより450万ドルを調達した、と発表した。

JethroDataはイスラエルの企業で、Hadoopの、ストレージに対するスケーラビリティと、完全にインデクシングされた列指向型分析データベースのクェリ機能を組み合わせた、サービスを提供している。列指向データベースは、大量のデータに対して複雑なクェリを行うデータウェアハウスシステムで重宝された歴史を持つ。

ファウンダのEli Singerはメールによるインタビューで、同社の差別化要因は、Hadoopにデータを保存して、それらを分析のために取り出す、ややもすれば複雑な工程を、単純化して能力を高めた点にある、と述べた。分析データベースとHadoopが別立てである企業が多いが、それだと、データをスキャンして分析するのに時間がかかりすぎる弱点がある。そのような分析は、結果をリアルタイムで見る方式ではなく、バッチで行われることが多い。Jethroは、クェリをHadoopネイティブで行うことにより、パフォーマンスが高いと主張する。

JethroDataには競合他社も多い、とSingerは言う。いちばん直接的な競合他社はHadaptで、ここもやはり、Hadoopに保存したデータをデータベース的に組織化する手法をとっている。

またClouderaImpalaは、Google Dremelによる高速なフルスキャンシステムでMapReduceをリプレースしている。Dremelはビッグデータ分析におけるGoogleの、MapReduceに次ぐ後継技術だ。Apache Drillをサポートすると発表したMapRも、やはりGoogle Dremelがベースだ。先週はHortonworksが、同社の独自技術であるTezを発表した。Citus Dataにも、Google Dremelによる自社独自の分析データベースがある。それは、PostgreSQLのコアの並行処理でクェリを行う点に、独自のイノベーションがある。

Singerによると、HBaseを使っている企業もある。それは、今のところHadoop上で可利用な唯一のデータベースだ。Drawn to ScaleSplice MachineがHBase派だ。Salesforce.comにはオープンソースのPhoenixプロジェクトがあり、HBase上のSQLを提供している。

さらに、JethroDataと競合する分析データベースとデータウェアハウス企業としては、HP Vertica、EMC Greenplum、IBM Netezza、Teradata Aster、InfoBrightなどがある。

JethroDataではこれまで、ある顧客企業がアルファテストをやっていたが、次の四半期からベータに入り、より多くの企業が利用できるようになる。今社員数は8名だが、年内には25名になるという。

分析データベースの市場は、ビッグデータ分析の次の最先端領域だ。JethroDataらは、Hadoopのアキレス腱対策に取り組んでいる。それは、ビッグデータの集積から、必要なデータを取り出し、分析し、結果をリアルタイムで見せることだ。成功の鍵は、今たくさん雨後の筍している競合他社に対する強力な差別化を、今の、市場が若いうちに確立することだ。そして、大差で先頭を走り続けること。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))