ストリーミングSQLデータベースPipelineはデータベースへの連続的なリアルタイム出力をサポート

16248892298_94c1d92ada_h

PipelineDBはY Combinatorの2014年冬季の出身だが、そのストリーミングSQLデータベース製品のオープンソースバージョンを今日(米国時間7/7)一般公開した。商用バージョンのリリースは今年の後期の予定だ。

このオープンソースのデータベースはSQLのクェリを連続的にストリーミングで流し、結果のテーブルを次々と保存する。協同ファウンダのDerek Nelsonはこう説明する: “連続的な処理とリレーショナルのストレージを一体化しているので、ストリーム処理をしながら、別途、外付けのストレージシステムを管理しなくてもよい”。

典型的なユースケースは、分析やモニタリングを継続的に行って結果を逐次、リアルタイムで報告するもの。たとえばeコマースのサイトが行うA/Bテストは、結果のログを翌日見るのではなく、刻々と変わっていく状態をリアルタイムで見ることができる。

Nelsonの主張によると、このプロダクトは、通常のデータベース作成過程であるETL(extract, transform and load…データを取り出す、変形する、ロードする)を不要にする。PipelineDBはこれら全体を一つの流れにすることによって、リアルタイム化する。

また、他のストリーミングプロダクトのように特別のプログラミング言語を必要とせず、誰もがおなじみのSQLのクェリを使うから、企業ユーザなどでもPipelineDBを今日からすぐに使える、というところが多いはずだ、と彼は言う。

Nelsonは、前にAdRollで仕事をしていたときに、クェリとその結果の連続的ストリーミング、というアイデアを発想し、いつかそのためのツールを作ってやろう、と思っていた。そして同社を辞めてから、念願のツール作りに取り組み、PipelineDBが生まれた。

オープンソースで出すことに決めたのは、実用上の理由からだ。まず第一に、実動プロダクトだけだと、新米のスタートアップが顧客企業の信頼を得ることが、なかなか難しいこと。ソースがオープンであれば、企業はそれを見て、彼らのプロダクト(PipelineDB)に納得することができる。

第二に、Nelsonの説では、Facebook、Google、Amazonといった巨大テクノロジ企業はすべてオープンソースがベースだから、そういうところへプロプライエタリなプロダクトを持ち込んでも、勝ち目はない。

“Y Combinatorに参加したことは、とても良かった”、とNelsonは語る。クラスの中で突出してテクニカルな企業だったため、ちょっと異端者だったが、商業的なプロダクトと競合しなかったため、楽でもあった。

彼によると、YCに参加したためコネができ、多くの企業と営業以前の会話ができたし、またYCのパートナーたちから知恵と経験談を授かった。そういうことの価値が、ものすごく大きかった、と彼は言う。

本日オープンソースのプロダクトをリリースしたことにより同社は、新たな一歩を踏み出すことができた。

PipelineDBはシード資金は獲得しているが、その額は公表していない。投資家は、SV Angel、Data Collective、Paul Buchheit、Susa Ventures、TenOneTen、および数名のエンジェルたちだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa