GoogleがNoSQLデータベースCloud Firestoreの一般供用を開始

Googleが今日、同社のモバイルとWebとIoT用のサーバーレスNoSQLドキュメントデータベースCloud Firestoreの一般供用を発表した。Googleはまた、10の新しいリージョンに、いくつかの新しい機能を導入してこのサービスを提供しようとしている。

今回のローンチでGoogleはデベロッパーに、データベースを単一のリージョンで動かすオプションを与える。ベータの間はデベロッパーはマルチリージョンのインスタンスを使っていたが、それはレジリエンスの点では有利でも、料金が高くなり、また複数のリージョンを必要としないアプリケーションも少なからずある。

GoogleのプロダクトマネージャーDan McGrathはこう語る: “マルチリージョンによって可能になる信頼性や耐久性を、必要としないユーザーもいる。そういう人たちにとっては、費用効率の良い単一リージョンのインスタンスが好ましい。またCloud Firestoreデータベースに関しては、データをユーザーのなるべく近くに置ける‘データのローカル性’が確保される”。

新しい単一リージョンのインスタンスは、料金が現在のマルチクラウドインスタンスよりも最大で50%安くなる。ただしGoogleがユーザーに与えるSLAの保証は、使用するソリューションによって異なる。単一リージョンのインスタンスもそのリージョン内で複数のゾーンへ複製されるが、データはすべて一定の地理的領域内にとどまる。したがってGoogleは、マルチリージョンのインスタンスには99.999%の可用性を約束し、リージョン限定のインスタンスには99.99%の可用性を約束している。

そしてCloud Firestoreは、全世界で10の新しいリージョンで利用できる。Firestoreはローンチ時には一箇所でローンチしたが、ベータのときはさらに二つ増えた。そして今では、Firestoreは13の場所で利用できる(そのうち、North AmericaとEuropeはマルチリージョンだ)。McGrathによると、Googleは現在、今後の配置について検討中だが、現状でも十分に全世界をカバーできる、という。

また今回のリリースで、Google CloudのモニタリングサービスStackdriverとより深く統合され、リード、ライト、デリートをリアルタイムに近い素早さでモニタできる。McGrathによると、今後の計画では複数のコレクションにまたがってドキュメントをクエリできるようになり、また、データベースの値の加増(インクリメント)をトランザクション不要でできるようになる。

なお、Cloud FirestoreはモバイルのデベロッパーにフォーカスしたGoogle Firebaseブランドに属するが、Firestore自身はCompute EngineやKubernetes Engineのアプリケーション用の、通常のクライアントサイドライブラリをすべて提供する。

McGrathは曰く、“従来のNoSQLドキュメントデータベース製品は、管理に関するデベロッパーの負担が大きい。しかしCloud Firestoreなら、データベースの管理はいっさい不要だ。しかもFirebase SDKと一緒に使えば総合的なBaaS(back-end as a service)にもなり、認証なども扱えるようになる”。

Firestoreのアドバンテージのひとつが、オフラインサポートが充実していることだ。それはモバイルのデベロッパーにとって便利だが、IoTにも向いている。Googleがこれを、Google CloudとFirebaseの両方のユーザーのツールと位置づけているのも、当然だ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

リアルタイムデータベースのMemSQLが$30Mを調達、毎秒1兆レコードののスキャンを誇る

リアルタイムデータベースのMemSQLが今日、シリーズDで3000万ドルを調達したことを発表した。これで同社の調達総額は1億1000万ドルになる。このラウンドをリードしたのはGV(元Google Ventures)とGlynn Capitalで、これまでの投資家Accell, Caffeinated Capital, Data Collective, およびIA Venturesも参加した。

MemSQLデータベースは分散リレーショナルデータベースで、標準的なSQLドライバーとクェリを実装し、それらによるトランザクションとアナリティクスをサポートしている。それは、データの取り入れ技術がとくに優れているとされ、1日に数百万のイベントをプッシュできると同時に、レコードをリアルタイムでクェリできる。同社が最近示したところによると、12のサーバーにまたがるクラスター上の1兆あまりの列を1秒でスキャンできた。

このデータベースは、大手のパブリッククラウド上やオンプレミスでデプロイできる。

MemSQLの最近の発表によると、今期第四四半期の登録ユーザー数は前年同期比で200%増加した。これは投資家を喜ばせる数字だが、しかしこの市場は競争が厳しく、多数の強力な古顔たちのほかに、スタートアップやオープンソースのプロジェクトも少なくない。現在のMemSQLのユーザーには、Uber, Akamai, Pinterest, Dell EMC, Comcastなどがいる。

GVのゼネラルパートナーAdam Ghobarahは、今日(米国時間5/15)の発表声明でこう述べている: “MemSQLは大規模かつ高速なオペレーショナルアナリシスを提供でき、動的でインテリジェントなアプリケーションを作れるため、エンタープライズ系のユーザーが増えている。同社はエンタープライズ顧客の増加とともに、数字で明確に表せるほどの成功を収めつつあり、継続的にスケールしている同社に投資できることは喜ばしい”。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

AWSのデータベースサービスAuroraにアンドゥ機能が誕生、72時間の遡及可能

AWSの‘マネージドMySQL/PostgreSQL’データベースサービスに、アンドゥ機能がつく。今日の同社の発表によると、そのAurora Backtrack機能により、ユーザーは“時間を逆行できる”。今それはMySQLのみだが、この機能を有効にするとそれ以降新たに作られるデータベースクラスターとバックアップからリストアされたクラスターに対し、アンドゥができるようになる。それまであったデータベースは、ノーだ。

この機能を有効にすると、AWSは最大72時間ぶんのトランザクションのログを取る。本番のデータベースに不正なテーブルを入れた、などの間違いに気づいたら、アプリケーションをポーズして、どこまで戻りたいか、時間(時刻)を指定する。するとAuroraはデータベースもポーズして、開いているすべての接続を閉じ、まだコミットしてないものをすべて落としてから、指定された時点までロールバックする。

もちろん、トランザクションの逆行はAWSが初めてではない。MySQLも含め、多くのデータベースシステムが、すでに何らかの形で実装している。ただしそれらの多くは、今日AWSが発表したものに比べると範囲が狭い。

AWSのチーフエヴァンジェリスト(Chief Evangelist) Jeff Barrが今日の発表で言っているが、それは災害復旧だけが目的ではない。彼はこう書いている: “あなたも、このクールな新しい機能の、クリエイティブで奇抜な使い方を、きっと思いつくだろう。たとえば、本番データベースでいろんなテストをして、そのテストの痕跡をすべて掃除することもできる。復旧の指示は、APIまたはCLI(コマンドライン)からできるから、この機能を既存のテストフレームワークに統合するのも容易だ”。

Aurora Backtrackは今、すべてのデベロッパーが使える。料金は、アメリカリージョンではレコードの書き換え100万文字につき約0.012ドルだ。ヨーロッパとアジアでは、やや高くなる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

AWSがサーバーレスのデータベースサービスAurora Serverlessをプレビューで立ち上げ

Amazonのクラウドコンピューティング部門AWSが今日(米国時間11/29)、連続的なデータ処理を必要としないようなリレーショナル・データベースを、容易に、安く、そして手早く立ち上げるサービスを発表した。そのAurora Serverlessと名付けられたサービスは、その名のとおりAWSの既存のデータベースシステムAuroraを利用しており、いわばサーバーレスでイベントドリブンなコンピュートプラットホームのデータベース版だ。

そのもっとも巧妙な仕組みは、データのストレージと処理が分離していることだ。Aurora Serverlessのユーザーは処理に対してのみ支払うが、もちろんそのときはストレージも仕事をしている。ただしその費用は比較的安い。

このサービスは、計画では来年のどこかの時点でプレビューを脱し、そのときにより詳しい情報を共有する、という。

目下Aurora Serverlessはプレビューのみだが、一般公開されたらデベロッパーはサーバーレスのリレーショナル・データベースにオンデマンドでアクセスでき、データベースのプロビジョニングを自分でやる必要がない。しかもスケールアップ/ダウンが、必要に応じて簡単にできる。ユーザーは、データベースを実際に使用した秒数に対してのみ支払う。これまでは、データベースを使おうと思ったら、データベースサーバーと称するマシンを動かす必要があった。Aurora Serverlessでは、そこらのことをすべて、AWS自身が楽屋裏でやってしまう。



[原文へ]
(翻訳:iwatani(a.k.a. hiwa

大量高速なデータストリームをリアルタイムで分析/視覚化するGPU駆動インメモリデータベースKinetica

Kineticaの企業としてのルーツは、アメリカの諜報部門のための2009年のコンサルティングプロジェクトまで遡る。テロリストをリアルタイムで追尾するという、そのときの軍やNSAの厳しい要求を満たすソリューションを市場に見つけることができなかった同社は、それを自分で作ろうと決心した。今日の同社は、インメモリのデータベースソリューションがメインのプロダクトで、それは、NVIDIAのGPUを使って処理を加速する一般市販のハードウェアを使用する。

そのアイデアがシリコンバレーの多くの投資家たちに受けて同社は、大枚5000万ドルのシリーズAを調達した。

同社は、初期の諜報機関向けのソリューションのパワーを、そこらの誰もが利用できるようにしたい、と考えている。データベースをGPUが動くチープなハードウェアの上で使うと、コストを低くでき、同時に当時のソリューションの高速性を享受できる。CEOで協同ファウンダーのAmit Vijによると、そのソリューションは従来のデータベースの100倍速く、しかもハードウェアの費用は1/10だ。

この価格性能比が投資家たちの関心を惹き、今日のラウンドはCanvas Ventures とMeritech Capital Partnersの共同リードに、新たな投資家としてCiti Ventures、そしてこれまでの投資家GreatPoint Venturesが参加した。

GreatPointの投資を決めたRay LaneはOracleの元役員で、データベースの技術には詳しい。その彼によると、このところデータの量と回転率は急速に増加しており、とくにIoTの貢献要因が大きい。そして、これまで主に顧客やサプライヤーからのトランザクションデータを扱ってきたレガシーのデータベース技術は、今日のデータ量の増大に追随できなくなっている。

“今日のチャレンジは、私が“外部的”(external)データと呼んでいるものだ。その量は膨大で、しかもほとんどが非定型、そしてリアルタイムのストリームだ。センサーやスマートデバイスから、絶え間なく大量のデータがやってくる。頭上のドローンから画像が来る。ソーシャルメディアのフィードもある。Kineticaは最初から、これら多様なデータ環境のリアルタイム分析と視覚化を目的として構築されている”、とLaneは語る。

NSAの長官だったKeith Alexanderによれば、彼の組織は2009年にKineticaのファウンダーたちに、たいへんな難題をぶつけた。しかし、“彼らはその機に乗じて、今日のKineticaデータベースプラットホームの前身を開発した。そのほかの商用やオープンソースのソリューションはすべて、そのミッションの目的を満たさなかった”、とAlexanderは声明文で述べている。

Vijの説明では、同社が提供するのはソフトウェアソリューションであり、NVIDIAのGPUが動くハードウェアは、IBM、HP、Dellなどのパートナーが提供する。またAWSやAzure、Google Cloud Platformなどの、GPUを利用するクラウドでも動く。

Kineticaの当初の顧客リストには、GlaxoSmithKline, PG&E, US Postal Serviceなどが名を連ねている。同社はOracleやSAP HANAなどの従来のデータベースベンダーと競合するが、同社によるとそれらは費用が高くてしかもGPUを使っていない。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

Googleがグローバルな分散データベースCloud Spannerをローンチ、SQLとNoSQLの‘良いとこ取り’を実装

google-cloud-spanner

Googleが今日、Cloud Spannerのベータローンチを発表した。それは、ミッションクリティカルなアプリケーションのための、グローバルな分散データベースだ。Cloud SpannerはGoogleの一連の、クラウドベースのデータベースサービスの仲間に加わる…それらは、Bigtable, Cloud SQL, そしてCloud Datastoreなどだが、しかしその重要な特徴は、従来的な関係データベースとNoSQLデータベースの両方の長所を取り入れて、トランザクションの一貫性(整合性)とスケーラビリティの容易さの両方を実現していることだ。現実的に分かりやすい言い方をすると、MySQLやPostgreSQLなどのデータベースでスケールの限界にぶつかっているデベロッパーが、クェリなどの現状を維持しつつ、その限界を乗り越えるために採用する代替的データベースだ。

Cloud Spannerという名前に見覚えのある方は、それはたぶんGoogleがこのデータベースの過去のバージョンを社内的に使っていて、2012年にはそれに関するペーパーを公開しているからだ。GoogleのDeepti Srivastavaによると、Googleは2007年に、MySQLに代わるデータベースとしてSpannerの開発に着手した。それまでは同社のさまざまなプロダクトで、MySQLが使われていた。しかし今日では、Google Photosや、Googleのそのほかの多くのミッションクリティカルなアプリケーションがSpannerを使っている。その同じデータベースを今回、外部デベロッパーにも公開したものが、Cloud Spannerなのだ。

デベロッパーは、SQLベースのアプリケーションを書くときに集積した知識をそのまま新しいデータベースに持ち込んで、SQLのシンタックスを用い、顧客にはACIDなトランザクションを提供できる(しかもそれを自分たちのセールスポイントにもできる)が、しかしそれと同時に、Google自身がそのプロダクトの運用のために必要としている、スケーラビリティとグローバルなネットワークの組み合わせなど、今日的なNoSQLデータベースの利点も提供できる。

2017-02-14_0903

“データ保存データベースではなく、日々のトランザクションのためのデータベースでスケールの限界にぶつかっていたら、共有データベースやNoSQLが次の選択肢だ”、とSrivastavaは語る。“しかし、それでもなおSQLは使い続けたい、という二股的トレードオフを抱えているなら、Spannerを選ぶべきだ。デベロッパーは、今使っているシステムを捨てたくない。だったら私たちが、そのトレードオフをできるかぎりシンプルにして差し上げたい”。

彼女によると、Cloud Spannerのデータベースには理論的には大きさの制約はないし、もちろん小さなプロジェクトでも十分に利用できるが、メインのアドバンテージは必ずしもスケーラビリティではなくて、グローバルなトランザクションの能力にある。そういう意味でCloud Spannerは、Cloud Datastoreの拡張と考えた方がよい。Cloud DatastoreはGoogleの、スケーラビリティの高いNoSQLデータベースだが、ACIDトランザクションやSQLふうのクェリもサポートしている。

cloud-spanner-4

パフォーマンスについては、まだ体験的に語れる段階ではないが、Googleの約束ではCloud Spannerの性能はそのほかのクラウドデータベースとほぼ互角である。

GoogleはCloud Spannerに関して99.9999%のアップタイムを約束しており、また提供するクライアントライブラリはJava, Go, Python, Node.jsなど複数の言語に対応している。ベータテストの間に複数の企業が、そのほかの言語のためのドライバーを作ったから、それらの言語のサポートも遠くないだろう。

料金は1ノード1時間あたり90セント(レプリケーションを含む)から始まり、ストレージは1GB1か月30セントだ。ネットワークのingressは無料、egressはGoogleの通常のクロスリージョン(複数リージョン間)とインターネットegressの料金に従う。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

Googleのクラウドデータベースサービスのすべてがベータを終了、SLA完備、関連ストレージサービスも高速化

cbf_009

Googleが今日、同社のCloud Platformに関するいくつかの発表を行った。その多くは各種のクラウドデータベースに関するものだが、同時に、コールドデータのための安価なクラウドストレージサービスNearlineのアップデートや、ディスクボリュームの高速化、Cloud Storageでユーザー自身の暗号鍵が使えること、などに関する発表も行われた。

全体としてGoogleが訴えたいのは、同社のクラウドコンピューティングサービスが、プロダクション用途に十分使えるほど成熟している、ということだ。

データベースに関するビッグニュースは、Googleのクラウドデータベースサービスのすべてが今やベータを終えたことだ。たとえばクラウド上で容易に利用でき管理もできるMySQLデータベースCloud SQL第二世代バージョンも、9か月のベータを終了して一般公開される。

NoSQLデータベースのCloud Bigtableは、非常に大規模なデータ分析と実動負荷を誇っているが、これもやはり、今日から一般供用される。

datacenter_google

またWebアプリケーションやモバイルアプリから便利に使えるNoSQLデータベースGoogle Cloud DatastoreのAPIも、ベータを終えた。データベース本体はかなり前から一般供用されていたが、デベロッパーはそれを、Google App Engineの一部としてしか使えなかった。でもAPIが使えるようになると、App Engineの外のアプリケーションでもこのデータベースを使える。同社によると、今ではSnapchatなども使っているCloud Datastoreは、毎月1兆リクエストを処理している。

Googleによれば、これらのデータベースサービスにはベータの期間中にいろんな機能を加えてきたが、今現在でユーザーにとって一番重要なのはSLAが提供されたことだろう。たとえばCloud Datastoreは、SLAにより99.95%の月間アップタイムを保証している。

Microsoftの旗艦的データベースサーバーをGoogle Cloudで使いたい人のために、同社はライセンス込みのSQL Serverイメージを提供している(今ベータ中)。既存のライセンスを、そのまま使うこともできる。ただしSQL Serverのイメージを動かすとGoogleの通常のインスタンス使用以上の費用が発生する。それはSQL Server Standardでは1コア1時間あたり$0.1645、SQL Server Webでは$0.011だが、SQL Server Expressは無料だ。

SQL Serverをクラウドで使うならMicrosoftのクラウドを使うのがベスト、という話になりそうだが、しかしGoogleとしては、エンタープライズユーザーを既存のアプリケーションとワークロード込みで同陣営に鞍替えさせるために、このオプションが欠かせないのだ。しかも今や、エンタープライズ顧客のあいだでは、GoogleのクラウドよりもMicrosoftのクラウドサービスの方が人気がある。

なお、ストレージに関する今日の発表では、コールドデータ用の安価なストレージサービスNearlineが速くなった。NearlineはAmazonのGlacier〔氷河!〕ストレージなどと競合するが、低価格と引き換えに可利用性の保証が低い。これまでのNearlineユーザーは、データアクセスにおいて3〜5秒のレイテンシー(遅れ)を我慢しなければならなかったが、これからは、(Googleのスポークスパーソンによると)“ほとんどリアルタイムだ”そうだ。

GoogleのPersistent Diskボリュームも速くなり、最大リード/ライト(IOPS
)が15000から25000にアップした。データベースアプリケーションだけでなく、そのほかのデータの保存にも便利である。

Googleの今日の発表声明文によると、“Google Cloud Platformをみなさまのエンタープライズデータベースワークロードのための最良のパブリッククラウドにしていくための、従来からの弊社の一貫して多大なる献身の継続において、本日は特別に大きな里程標が刻まれたことになります”、だそうだ。Googleが同社のCloud Platformに関してきわめて真剣であることの、証拠はすでに出揃っていると思うが、それでもまだ不満な人は、今日の発表の内容を見るべきかもしれない。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

Bashoが時系列データ専用NoSQLデータベースRiak TSをオープンソース化してIoTへの浸透をねらう

internetofthings

世界中のありとあらゆるデバイスメーカーが、自分たちの製品をインターネットに接続しようとしているように、思える。ベッド用のマットレスも、洗濯機も、トースターも、そしてジューサーも〔冷蔵庫も〕。大量のデータが空中や線上にあふれ出て、分析されるのを待つ列に並ぶだろう。

そのようなデータは今後増加の一方で、それを送信する能力は、最近1億5000万ドルを調達したSigFoxなどの企業によって徐々に整備されていくが、しかしながら今の分散データベースのアーキテクチャの多くは、市場が求めるそんな帯域にマッチできるほどの、高速なデータ処理と出力の能力を持っていない。

シアトルのBashoは、同社のNoSQLデータベースRiak TSの最新リリースで、そんな問題の一部を解決しようとしている。TSはtime-series(時系列)の頭字語で、データのユニークなキーヴァリューがタイムスタンプであり、それはそのデータが作られた日時を指している。TSシステムはこれまでもBashoのエンタープライズクライアント(Uber, AT&Tなど)にしばらく使われてきたが、今回のオープンソースリリースによって、そんなデータタイプを初めて扱うデベロッパーでも、気軽に利用できるようになった。

MongoDBやDataStaxなどの同業企業と違ってBashoはこれまで、わずか2500万ドルの資金しか調達していない。明らかに同社は、時系列データを扱うという独自性が、NoSQLデータベースの業界で強力な差別化要因になる、と信じている。

今回のニューリリースは、ApacheのクラスターフレームワークSparkを統合し、SparkとRiak TSにおけるインメモリ処理のためのデータの、自動的分散化と対話をサポートしている。

多くの人にとってこれは些細なことと思えるかもしれないが、センサーからの大量の時系列データを扱う者にとっては、大規模な分散化データが、コンピューターの実動時にすら、長いリード/ライト時間の原因となり、分散化による冗長性が効率を殺してしまう。

ソリューションとしては、ハッシュランクを使ってデータのキーをデータクラスター全体にわたって均一に分散するやり方が多い。それによって、大規模なノード集合全域にわたる同じタイムレンジからのデータを効率的に入力するが、一方でレンジへのアクセスが高負荷な操作になる。

BashoのCEO Adam Wrayによると、Riak TSが使っているユニークな分散化システムはユーザーに、タイムスタンプのある、あるいはそのほかの連続的な、データの処理における有利性を与える。

“われわれはデータの配置を最適化し、特定のノードが特定のレンジのデータを得るようにしている”、と彼は語る。つまりこのような配置によって、一定のタイムレンジからのデータのフェッチが、より少ない操作ですむようにしている。

新しいリリースのREST APIによって個々のデベロッパーが利益を得るだけでなく、Bashoがエンタープライズの世界で歓迎される要因は、Riak TSの、既存のSQLデータベースコマンドとの互換性だ、と彼は考えている。

“それは正規のSQLコマンドであり、一部のCQLや、SQLのわれわれ独自の変種ではない”、とBashoのCTO Dave McCroryは述べる。“われわれは、人びとがいちばん多く使いたがる従来的な操作をサポートする”。

たしかに、いちばん多く使われているSQL操作をサポートすればレガシーユーザーやエンタープライズの多くにとって魅力的だが、多くのエンタープライズユーザーはSQLプラットホームの上に内製のカスタムソリューションを乗っけており、それがエンタープライズ世界におけるRiak TSの広範な採用を妨げるかもしれない。

Riakのノードは仮想と物理的、両方のマシンにまたがって分散化でき、またMicrosoftのAzureやAmazon Web Servicesなどのプラットホーム上の、クラウドインスタンスの上でもそれは可能だ。

Bashoの主張によると、時系列データの処理では、Riak TSの方がApacheのNoSQLデータベースCassandraなどよりも50%は速い。本誌TechCrunchはこの主張を検証していないが、今回オープンソース化されたことにより、Rial TSシステムのパフォーマンスゲインは多くのユーザーにとって明らかになるだろう。

このシステムが内包している強力な事故回復力が、エンタープライズユーザーたちのデータベース乗り換えの十分な動機になるか、それはまだ分からない。Riak TSでは各クラスターが同一データのコピーを三つ抱えるので、マルチクラスターのリプリケーションが天文学的な数の操作になることもありえる。しかし十分なスケーラビリティがあれば、これによって高いアップタイムと低い誤り率が保証される。ただしそれに要する費用は、小さな企業が尻込みするほどの額だろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

MongoDBの管理サービスMongoLabが名前をmLabに変えて新分野への進出を目指す

shutterstock_141093727

MongoLabは長らく、MongoDBデータベースをデプロイし管理するためのデファクトのサービスだったが、今では同社がこの市場をほぼ支配してしまったので、事業を新たな分野へ拡張することになった。まだ新しいプロダクトはローンチしていないが、そのために同社は社名を、MongoLabからmLabに変えることになった。

mLab - Logo

MongoLab/mLabのCEOで協同ファウンダーのWill Shulmanによると、彼のかねてからの計画でもMongoLabはあくまでも、二段階プランの最初の部分だったそうだ。

その計画では、最初に構築するサービスはNoSQLのムーブメントに乗って主にJSONサービスを提供すること。それは、明らかにうまくいった。MongoLab/mLabはこのほど、4回めの黒字四半期を迎えた。今では同社は約25万のデータベースのデプロイをAWS, Azure およびGoogle上で管理している(圧倒的に多いのはAWSだ)。

“MongoDBのホスティングでは、ほかのプロバイダに比べ、有料ユーザーはうちがいちばん多い”、とShulmanは語る。“MongoDBそのものの有料ユーザーよりも多いぐらいだ”。

これらのユーザーのサービスの多くがMongoLabmLabを、彼らのJSONベースのアプリケーションのバックエンドとして利用している。“当時は、何もかもサーバーサイドだった”、とShulmanは語る。“今はポリクライアント(poly-client, 複数クライアント)の時代で、サーバーサイドの開発といえばAPIやデータサービスぐらいだ”。

今ではMongoLabmLabのユーザーの約70%がMongoを使って、自分たちが必要とするデータサービスを手作りしている。

同社の今後の計画をShulmanは詳しく述べなかったが、明らかにmLabのプランは、デベロッパーが自分のデータベースをベースとするAPIを作ることを助ける、サービスだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

CitusDBがPostgreSQL用の列取り出しツールをオープンソースで提供開始, 複雑なクェリの効率をアップ

[筆者: Ron Miller]

Oracleなどの大型旧勢力に対抗するデータベース分析サービスのCitusDBが、PostgreSQL用の初の列保存(columnar store)エクステンションCSTOREをリリースした。今日(米国時間4/3)から、無料でダウンロードできる。

“データをバッチでロードするときは、列保存が分析作業を大いに助ける”、と同社のブログ記事が言っている。つまり、このツールを使うとデータベースの利用パフォーマンスが上がる。CitusDBによると、クェリの効率は2倍アップ、データリードに要する時間は従来の1/10になる。同社のCEO Umur Cubukcuによると、分析クェリは高度な最適化によってさらに効率がアップし、また圧縮率も上がるためにストレージの費用も削減される。

“列保存は標準のPostgreSQLユーザは単一ノードで利用でき、またCitusDBの顧客はペタバイトのオーダーにスケールアウトしたPostgreSQLでも可利用である”、とCubukcuは説明する。CitusDBのプロダクトは後者が対象だが、ユーザはそれぞれ、自分の規模に合わせてこの新しいツールを利用できる。

Cubukcuによると、このツールは二つのアドバンテージを提供する。ひとつは、同じデータベースを利用目的によって、行ベースでも列ベースでも扱える。第二は、PostgreSQLの信頼性の高いエンタプライズ機能とHadoopのスケーラビリティを融合させるCitus Dataの方式を、最大限に有効利用できる。したがって全世界のビッグデータ分析を行う顧客に、シンプルで強力なデータベースを提供できる。〔社名はCitus Data、プロダクト名がCitusDB。〕

CitusDBは今年の2月の終わりに、そのコアプロダクトのバージョン3.0をリリースした。

同社はY Combinatorの2011年の卒業生で、2012年6月にそのプロダクトのバージョン1.0をリリースした。Alex Williamsは2013年2月の本誌記事で、次のように述べている: “CitusDBはGoogleのリアルタイムデータベース分析クェリシステムDremelを使用している。データベースに対するリアルタイムの対話的分析能力では、Hadoopの分析機能より優れている。その違いの主因は、並列コンピューティングの有効利用とSQL的な機能性にある。数千台のサーバ上に分散している数ペタバイトものデータに対するクェリとその結果の受領を、リアルタイムで行える”

CitusDBはこれまで、Data Collective、Bullpen Capital、SV Angel、Trinity Ventures、そして業界の指導的立場にあるエンジェルたちから165万ドルを調達している。顧客は、広告技術、eコマース、リテイル、セキュリティ、モバイルのアクセス分析など、多様な業種にわたっている。

この新しいツールは今日からGitHubで入手できるが、同社はコミュニティによる今後の改良や新機能の付加を期待している。

画像: Flickr/tec_estromberg; CC BY 2.0のライセンスによる license

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


分散データベース管理のNuoDBが拡張シリーズBで$14.2Mを調達

マサチュセッツ州ケンブリッジの、分散データベースの管理を専門とするNuoDBが、ヨーロッパで二番目に大きいソフトウェア企業Dassault Systèmesが率いるラウンドにより、1420万ドルを調達した。それまでの投資家Morgenthaler VenturesHummer Winblad Venture Partners、そしてLongworth Venture Partnersらもこのラウンドに参加した。

この新たなラウンドは実は同社の2012年のシリーズB1000万ドルの拡張で、トータルでは2620万ドルの資金調達になる。NuoDBによると、2013年には同社はサービスの一般公開と最初の顧客獲得に注力した。それに続く今年は、営業とマーケティングチームの構築に力を入れたいため、新たな資金調達をすることを決めた。

データベースアーキテクトJim StarkeyとCEOのBarry Morrisが創業したNuoDB は2010年にローンチし、同社のデータベース関連プロダクトは2013年1月に一般公開された。すでにそのときで顧客企業は25社あり、今ではAutoZone、DropShip Commerce、ゲームデベロッパZombie Studiosなどの有料顧客のほか、全世界で約11000のデベロッパが無料のNuoDB Developer Editionを利用している。今年は売上を少なくとも300%伸ばしたい、と同社は言っている。

従来のデータベースと違ってNuoDBは分散システムの上で仕事をし、それらに”耐久性のある分散キャッシュ“を使わせることによって自在なスケールアウトと~~インを可能にし、安価なコモディティハードウェア(x86機)と仮想マシンが使えるようにしている。同社の主張によると、そのシステムには単一障害点が存在しないそうだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))