CitusDBがPostgreSQL用の列取り出しツールをオープンソースで提供開始, 複雑なクェリの効率をアップ

[筆者: Ron Miller]

Oracleなどの大型旧勢力に対抗するデータベース分析サービスのCitusDBが、PostgreSQL用の初の列保存(columnar store)エクステンションCSTOREをリリースした。今日(米国時間4/3)から、無料でダウンロードできる。

“データをバッチでロードするときは、列保存が分析作業を大いに助ける”、と同社のブログ記事が言っている。つまり、このツールを使うとデータベースの利用パフォーマンスが上がる。CitusDBによると、クェリの効率は2倍アップ、データリードに要する時間は従来の1/10になる。同社のCEO Umur Cubukcuによると、分析クェリは高度な最適化によってさらに効率がアップし、また圧縮率も上がるためにストレージの費用も削減される。

“列保存は標準のPostgreSQLユーザは単一ノードで利用でき、またCitusDBの顧客はペタバイトのオーダーにスケールアウトしたPostgreSQLでも可利用である”、とCubukcuは説明する。CitusDBのプロダクトは後者が対象だが、ユーザはそれぞれ、自分の規模に合わせてこの新しいツールを利用できる。

Cubukcuによると、このツールは二つのアドバンテージを提供する。ひとつは、同じデータベースを利用目的によって、行ベースでも列ベースでも扱える。第二は、PostgreSQLの信頼性の高いエンタプライズ機能とHadoopのスケーラビリティを融合させるCitus Dataの方式を、最大限に有効利用できる。したがって全世界のビッグデータ分析を行う顧客に、シンプルで強力なデータベースを提供できる。〔社名はCitus Data、プロダクト名がCitusDB。〕

CitusDBは今年の2月の終わりに、そのコアプロダクトのバージョン3.0をリリースした。

同社はY Combinatorの2011年の卒業生で、2012年6月にそのプロダクトのバージョン1.0をリリースした。Alex Williamsは2013年2月の本誌記事で、次のように述べている: “CitusDBはGoogleのリアルタイムデータベース分析クェリシステムDremelを使用している。データベースに対するリアルタイムの対話的分析能力では、Hadoopの分析機能より優れている。その違いの主因は、並列コンピューティングの有効利用とSQL的な機能性にある。数千台のサーバ上に分散している数ペタバイトものデータに対するクェリとその結果の受領を、リアルタイムで行える”

CitusDBはこれまで、Data Collective、Bullpen Capital、SV Angel、Trinity Ventures、そして業界の指導的立場にあるエンジェルたちから165万ドルを調達している。顧客は、広告技術、eコマース、リテイル、セキュリティ、モバイルのアクセス分析など、多様な業種にわたっている。

この新しいツールは今日からGitHubで入手できるが、同社はコミュニティによる今後の改良や新機能の付加を期待している。

画像: Flickr/tec_estromberg; CC BY 2.0のライセンスによる license

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))