AmazonのDynamoDBにマシン効率で勝るScyllaDBとは?

オープンソースのデータベースはたくさんあるが、NoSQLのScyllaDBは、ほかならぬAmazonのユーザーを惹きつけることによって自らを差別化しようとする。米国時間9月11日に同社は、Amazonの顧客の同社製品への移行を促進するためにAmazonのDynamoDB用のマイグレーションツール(移行ツール)を発表した。

大胆な策だが、でもScyllaはフリーでオープンソースのプロダクトとその有料バージョンを軸としながら、常に大物プレーヤーのあとを追う性癖がある。この前は、分散NoSQLデータベースCassandraのユーザーをScyllaDBに移行させるためのツールを作った。

CEOのDor Laor(ドオール・ラオール)氏によると、DynamoDBの顧客は今やコードをほとんど書き換えずにScyllaDBに移行できる。「今日DynamoDBを使ってる人でも、その同じドライバーと同じクライアントコードを使える。というより、クライアントコードは1ビットたりとも変える必要がない。アクセスを、Scyllaが動いている別のIPアドレスにリダイレクトするだけだ」とラオール氏は言っている。

AmazonのDynamoDBのユーザーがわざわざScyllaDBに移行する理由な何だろう。同氏によると、ハードウェアをもっと効率的に使っているので高速かつ安価な体験を提供するからだ。ゆえに、同じワークロードを少ないマシンでしかも高速に動かせる。もちろんコスト低減に寄与する。

同社はシリーズCのエクステンション(追加)としてEight Roads Venturesがリードするラウンドにより2500万ドルを調達した。これまでの投資家Bessemer Venture PartnersとMagma Venture Partners、Qualcomm Ventures、そしてTLV Partnersも参加した。これでScyllaの調達総額は6000万ドルになる。

同社は創業から6年めで、今の顧客にはComcastやGE、IBM、Samsungなどがいる。ラオール氏によるとComcastはCassandraを400台のマシンで動かしていたが、Scyllaでは同じワークロードをわずか60台で動かせたそうだ。

ラオール氏のデータベース歴は長いが、それはCassandraやDynamoDBなど個別の製品を使うというレベルではない。彼によると「主な目標はデフォルトのNoSQLデータベースになることだ。ビッグデータやリアルタイムのワークロードを抱える人たちが、真っ先にScyllaDBを考えるようにしたい。そうやって、デフォルトになれるだろう」とのこと。

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

GoogleがNoSQLデータベースCloud Firestoreの一般供用を開始

Googleが今日、同社のモバイルとWebとIoT用のサーバーレスNoSQLドキュメントデータベースCloud Firestoreの一般供用を発表した。Googleはまた、10の新しいリージョンに、いくつかの新しい機能を導入してこのサービスを提供しようとしている。

今回のローンチでGoogleはデベロッパーに、データベースを単一のリージョンで動かすオプションを与える。ベータの間はデベロッパーはマルチリージョンのインスタンスを使っていたが、それはレジリエンスの点では有利でも、料金が高くなり、また複数のリージョンを必要としないアプリケーションも少なからずある。

GoogleのプロダクトマネージャーDan McGrathはこう語る: “マルチリージョンによって可能になる信頼性や耐久性を、必要としないユーザーもいる。そういう人たちにとっては、費用効率の良い単一リージョンのインスタンスが好ましい。またCloud Firestoreデータベースに関しては、データをユーザーのなるべく近くに置ける‘データのローカル性’が確保される”。

新しい単一リージョンのインスタンスは、料金が現在のマルチクラウドインスタンスよりも最大で50%安くなる。ただしGoogleがユーザーに与えるSLAの保証は、使用するソリューションによって異なる。単一リージョンのインスタンスもそのリージョン内で複数のゾーンへ複製されるが、データはすべて一定の地理的領域内にとどまる。したがってGoogleは、マルチリージョンのインスタンスには99.999%の可用性を約束し、リージョン限定のインスタンスには99.99%の可用性を約束している。

そしてCloud Firestoreは、全世界で10の新しいリージョンで利用できる。Firestoreはローンチ時には一箇所でローンチしたが、ベータのときはさらに二つ増えた。そして今では、Firestoreは13の場所で利用できる(そのうち、North AmericaとEuropeはマルチリージョンだ)。McGrathによると、Googleは現在、今後の配置について検討中だが、現状でも十分に全世界をカバーできる、という。

また今回のリリースで、Google CloudのモニタリングサービスStackdriverとより深く統合され、リード、ライト、デリートをリアルタイムに近い素早さでモニタできる。McGrathによると、今後の計画では複数のコレクションにまたがってドキュメントをクエリできるようになり、また、データベースの値の加増(インクリメント)をトランザクション不要でできるようになる。

なお、Cloud FirestoreはモバイルのデベロッパーにフォーカスしたGoogle Firebaseブランドに属するが、Firestore自身はCompute EngineやKubernetes Engineのアプリケーション用の、通常のクライアントサイドライブラリをすべて提供する。

McGrathは曰く、“従来のNoSQLドキュメントデータベース製品は、管理に関するデベロッパーの負担が大きい。しかしCloud Firestoreなら、データベースの管理はいっさい不要だ。しかもFirebase SDKと一緒に使えば総合的なBaaS(back-end as a service)にもなり、認証なども扱えるようになる”。

Firestoreのアドバンテージのひとつが、オフラインサポートが充実していることだ。それはモバイルのデベロッパーにとって便利だが、IoTにも向いている。Googleがこれを、Google CloudとFirebaseの両方のユーザーのツールと位置づけているのも、当然だ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

MongoDBのクラウド上のデータベースサービスAtlasに無料プランが登場してフリーミアムに

MongoDBは今でも主力製品のNoSQLデータベースで有名だが、しかし昨年同社は、Atlasという、管理サービスつきのデータベースサービスを立ち上げた。そのクラウドサーバーは、AWS上で動いている。立ち上げ時点では有料サービスのみだったが…AWSの使用料も払わなければならないから当然か…、今日からはMongoDBを勉強したいデベロッパーや、これから新しいアプリケーションのプロトタイプを作る、といった人たちのために、無料サービスの提供を開始する。

無料プランには当然ながら制約もあり、たとえばストレージは512MBしか使えない。でも、可用性の高いAtlasのクラスターにアクセスできる点では有料プランと同じで、しかも、保存されている、あるいは転送時の、データは暗号化される。だからストレージが小さい点をのぞけば、サービスの内容は有料プランと変わらない。MongoDBをこれから勉強しよう、というユーザーにとっては、ストレージのサイズもこれぐらいで十分だろう。

無料プランがなぜこんなに遅れたのか、という問いに対してMongoDBのクラウドプロダクト担当VP Sahir Azamはこう答える: “無料プラン(Free Tier)のユーザー体験を、最初から本格的なものにしたかった。最初に立ち上げた有料プランも、販促のための無料利用の部分がかなりあり、デベロッパーはかなり気軽に完全なプロダクトを体験できた。そして彼らからのフィードバックが、無料プランでも高可用性とモニタリングと主要なセキュリティ機能をを提供すべき、という確信をわれわれに与えた。そのほかの機能やツールについても、それらをすべて提供すべき、という確信が得られた。つまりこれまでの有料ユーザーからのフィードバックを見るかぎり、ユーザー体験のクォリティーという点から、有料バージョンと完全に同じものを提供すべき、という結論にならざるを得なかった”。

また、今日同時にローンチしたデータマイグレーションツールmongomirrorにより、既存のMongoDBのデプロイメントをAtlasへ移せる。このツールは、将来的にはクラウド上のツールとしてAtlasから提供される予定だ。

Atlasの利用状況についてMongoDBは詳しい数字を明かさないが、“全世界の数千の企業で使われている”、とだけ言った。その中には、オンラインデートサービスeHarmonyや、バイオテックのThermo Fisherなどが含まれる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

Bashoが時系列データ専用NoSQLデータベースRiak TSをオープンソース化してIoTへの浸透をねらう

internetofthings

世界中のありとあらゆるデバイスメーカーが、自分たちの製品をインターネットに接続しようとしているように、思える。ベッド用のマットレスも、洗濯機も、トースターも、そしてジューサーも〔冷蔵庫も〕。大量のデータが空中や線上にあふれ出て、分析されるのを待つ列に並ぶだろう。

そのようなデータは今後増加の一方で、それを送信する能力は、最近1億5000万ドルを調達したSigFoxなどの企業によって徐々に整備されていくが、しかしながら今の分散データベースのアーキテクチャの多くは、市場が求めるそんな帯域にマッチできるほどの、高速なデータ処理と出力の能力を持っていない。

シアトルのBashoは、同社のNoSQLデータベースRiak TSの最新リリースで、そんな問題の一部を解決しようとしている。TSはtime-series(時系列)の頭字語で、データのユニークなキーヴァリューがタイムスタンプであり、それはそのデータが作られた日時を指している。TSシステムはこれまでもBashoのエンタープライズクライアント(Uber, AT&Tなど)にしばらく使われてきたが、今回のオープンソースリリースによって、そんなデータタイプを初めて扱うデベロッパーでも、気軽に利用できるようになった。

MongoDBやDataStaxなどの同業企業と違ってBashoはこれまで、わずか2500万ドルの資金しか調達していない。明らかに同社は、時系列データを扱うという独自性が、NoSQLデータベースの業界で強力な差別化要因になる、と信じている。

今回のニューリリースは、ApacheのクラスターフレームワークSparkを統合し、SparkとRiak TSにおけるインメモリ処理のためのデータの、自動的分散化と対話をサポートしている。

多くの人にとってこれは些細なことと思えるかもしれないが、センサーからの大量の時系列データを扱う者にとっては、大規模な分散化データが、コンピューターの実動時にすら、長いリード/ライト時間の原因となり、分散化による冗長性が効率を殺してしまう。

ソリューションとしては、ハッシュランクを使ってデータのキーをデータクラスター全体にわたって均一に分散するやり方が多い。それによって、大規模なノード集合全域にわたる同じタイムレンジからのデータを効率的に入力するが、一方でレンジへのアクセスが高負荷な操作になる。

BashoのCEO Adam Wrayによると、Riak TSが使っているユニークな分散化システムはユーザーに、タイムスタンプのある、あるいはそのほかの連続的な、データの処理における有利性を与える。

“われわれはデータの配置を最適化し、特定のノードが特定のレンジのデータを得るようにしている”、と彼は語る。つまりこのような配置によって、一定のタイムレンジからのデータのフェッチが、より少ない操作ですむようにしている。

新しいリリースのREST APIによって個々のデベロッパーが利益を得るだけでなく、Bashoがエンタープライズの世界で歓迎される要因は、Riak TSの、既存のSQLデータベースコマンドとの互換性だ、と彼は考えている。

“それは正規のSQLコマンドであり、一部のCQLや、SQLのわれわれ独自の変種ではない”、とBashoのCTO Dave McCroryは述べる。“われわれは、人びとがいちばん多く使いたがる従来的な操作をサポートする”。

たしかに、いちばん多く使われているSQL操作をサポートすればレガシーユーザーやエンタープライズの多くにとって魅力的だが、多くのエンタープライズユーザーはSQLプラットホームの上に内製のカスタムソリューションを乗っけており、それがエンタープライズ世界におけるRiak TSの広範な採用を妨げるかもしれない。

Riakのノードは仮想と物理的、両方のマシンにまたがって分散化でき、またMicrosoftのAzureやAmazon Web Servicesなどのプラットホーム上の、クラウドインスタンスの上でもそれは可能だ。

Bashoの主張によると、時系列データの処理では、Riak TSの方がApacheのNoSQLデータベースCassandraなどよりも50%は速い。本誌TechCrunchはこの主張を検証していないが、今回オープンソース化されたことにより、Rial TSシステムのパフォーマンスゲインは多くのユーザーにとって明らかになるだろう。

このシステムが内包している強力な事故回復力が、エンタープライズユーザーたちのデータベース乗り換えの十分な動機になるか、それはまだ分からない。Riak TSでは各クラスターが同一データのコピーを三つ抱えるので、マルチクラスターのリプリケーションが天文学的な数の操作になることもありえる。しかし十分なスケーラビリティがあれば、これによって高いアップタイムと低い誤り率が保証される。ただしそれに要する費用は、小さな企業が尻込みするほどの額だろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

MongoDBの管理サービスMongoLabが名前をmLabに変えて新分野への進出を目指す

shutterstock_141093727

MongoLabは長らく、MongoDBデータベースをデプロイし管理するためのデファクトのサービスだったが、今では同社がこの市場をほぼ支配してしまったので、事業を新たな分野へ拡張することになった。まだ新しいプロダクトはローンチしていないが、そのために同社は社名を、MongoLabからmLabに変えることになった。

mLab - Logo

MongoLab/mLabのCEOで協同ファウンダーのWill Shulmanによると、彼のかねてからの計画でもMongoLabはあくまでも、二段階プランの最初の部分だったそうだ。

その計画では、最初に構築するサービスはNoSQLのムーブメントに乗って主にJSONサービスを提供すること。それは、明らかにうまくいった。MongoLab/mLabはこのほど、4回めの黒字四半期を迎えた。今では同社は約25万のデータベースのデプロイをAWS, Azure およびGoogle上で管理している(圧倒的に多いのはAWSだ)。

“MongoDBのホスティングでは、ほかのプロバイダに比べ、有料ユーザーはうちがいちばん多い”、とShulmanは語る。“MongoDBそのものの有料ユーザーよりも多いぐらいだ”。

これらのユーザーのサービスの多くがMongoLabmLabを、彼らのJSONベースのアプリケーションのバックエンドとして利用している。“当時は、何もかもサーバーサイドだった”、とShulmanは語る。“今はポリクライアント(poly-client, 複数クライアント)の時代で、サーバーサイドの開発といえばAPIやデータサービスぐらいだ”。

今ではMongoLabmLabのユーザーの約70%がMongoを使って、自分たちが必要とするデータサービスを手作りしている。

同社の今後の計画をShulmanは詳しく述べなかったが、明らかにmLabのプランは、デベロッパーが自分のデータベースをベースとするAPIを作ることを助ける、サービスだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Googleがスケーラビリティとパフォーマンスの高いNoSQLデータベースCloud Bigtableをベータで提供開始

google-cloud-bigtable

Googleが今日(米国時間5/6)、新しいNoSQLデータベースCloud Bigtableをローンチする。名前が示しているように、それは同社のデータストレージシステムBigtableを利用しているが、APIはApache HBaseのそれと互換性があり、というかHBaseもGoogleのBigtableプロジェクトを利用しているのだ。BigtableはGmail(メール)やGoogle Search(検索)、Google Analytics(アクセス分析)も利用しており、いわば実戦で鍛えられたサービスだ。

GoogleはCloud Bigtableのレイテンシがひと桁のミリ秒で、コストパフォーマンスはHBaseやCassandraの二倍、と約束している。HBaseのAPIをサポートしているから、Cloud BigtableをHadoopのエコシステム内の既存のアプリケーションと統合することも可能だが、また同時に、GoogleのCloud Dataflowもサポートしている。

Cloud Bigtableのクラスタはわずか数秒でセットアップでき、ストレージはユーザのニーズに応じて自動的にスケールする。

png;base64f1e982d227e3a1a8

なお、GoogleがクラウドベースのNoSQLデータベースを提供するのはこれが初めてではない。同社のApp Engineプラットホーム上ではかねてからデベロッパが、高可用性のNoSQLデータストアCloud Datastoreを利用できている。そのサービスもやはり、Bigtableがベースだ。Google Cloud PlatformのプロダクトマネージャCory O’Connerによると、Cloud DatastoreはWebアプリケーションやモバイルアプリに多い、リード主体のワークロードに向いているそうだ。

“Cloud Bigtableはその逆で、大規模なデータ処理を必要とする大企業など向けに設計されており、複雑なワークロードに対応する”、とO’Connerは言っている。“たとえば、企業がデータをストリームでぶち込んだり、データの分析をしたり、一つのデータベースから大量のデータをサーブする、といった用途にCloud Bigtableは向いている。弊社の顧客は今後、Cloud Datastoreでプロトタイプを作り、大規模で複雑なデータ処理を伴う本番の展開ではCloud Bigtableへ移行する、というパターンになるだろう”。

この新しいサービスは当面ベータで提供されるので、誰でも利用できるけどSLAや技術的サポートは提供されない。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

毎秒1400万回のライト(write)を行うNoSQLデータベースFoundationDB、ACIDの条件も満たす

データベースはテクノロジ産業の背骨だ。地味で目立たない存在だが、とても重要で、壊れたり改ざんされたりすると、たいへんなことになる。だから、データベースに関わる者は用心深い。これまで長年、企業目的で安心して使えるのはビッグスリー(Oracle、IBMのDB2、そしてたぶんSQL Server)だけ、とされていた。その後MySQLやPostgreSQLなどのオープンソース製品が、十分使えると認められた。そして最近の5年間で、データベースの界隈はおもしろくなってきた。

まず、歴史を回顧しよう。世紀のかわり目ごろにかけて、フォーマルに構造化・正規化され、SQLのさまざまな変種によってクェリされる関係データベースは、開発を助けるよりもむしろ妨害する、と見なす人びとがますます多くなった。その後の10年間で、さまざまな新しいデータベースが咲き乱れ、とりわけ、Webサイズの大きなデータ保存能力を必要とするGoogleは、BigTableMegastore、Spannerなどの分散データベース・ソリューションを次々と作り出した。

さらにその間Apacheは、CassandraHBase、そしてCouchDBを作り、ClustrixはMySQLをリプレースするプラグアンドプレイでスケーラブルなソリューション(NewSQL)を生み出し、Redisは多くのRails(などの)アプリケーションが必ず使う成分になった。そしてとりわけMongoDBは、批判の声も大きい中で、スタートアップたちのあいだでたいへんな人気者になった。とくに批判されたのは、ライトロック(write lock)をかけるためにデータベース全体にまたがる複数のライトの並行処理ができないことだったが、ありがたいことにその制約は近くかなり解消されるらしい。なお、ぼく自身はデベロッパとしてMongoDBを扱ったことがあるが、MongoDBのファンではない。

しかしこれらの、いわゆる“NoSQLデータベース”と呼ばれるデータベースの新しい波は、興味をそそることは確かだけれど、本当に真剣に取り上げているのは、一部の最先端のスタートアップや、ほんのひとにぎりの夢想家だけだ。データベースはきわめてミッションクリティカルな計算機資源だから、その安定性と安全性にすこしでも懸念があってはならない。データベースがデータとトランザクションの完全性を保証せず、いわゆるACIDなトランザクション“をサポートしないのなら、そのようなデータベースには、企業などで毎日実用システムを扱っているデータベース技術者は関心を持たない:

[ツイート訳: ACIDの保証は要らなくても、AとDを提供できないストレージエンジンは、最初から検討に値しないわね。]
[ツイート訳: ベンチマークしているときに糞して自分のデータを壊すストレージエンジンもあるわ。なんでベンチマークで壊れるのよ。]

MongoDBはACIDに対応していない。Cassandraもだ。Riakも、Redisも、等々々々。NoSQLデータベースは本質的にACID準拠でありえない、という説もあった。でもそれ嘘だ。GoogleのMegastoreは基本的にACIDであり、同社のSpannerはさらに良い。しかしMegastoreはGoogleの上でしか使えないから、あの独特のクセのあるApp Engineプラットホームで自分の全アプリケーションを構築する気でもないかぎり、採用は難しいだろう。

というわけで、2年前のTechCrunch Disruptのブースで”NoSQL, YesACID”(NoSQLだけどACID対応)というスローガンを掲げたFoundationDBという企業を見つけたときは、とても気になった。同社はACID完全対応1のキー-ヴァリュー(key-value)データベースを作って、その上に標準SQLのレイヤ(層)をかぶせる、という離れ業をやっていた。その同社が今週初め(米国時間12/10)に、FoundationDB 3.0のリリースを発表した。それはなんと、前のバージョンの25倍速いそうで、それは同社の協同ファウンダでCOOのNick Lavezzoの言葉では、データベースエンジンの“心臓と肺の移植手術を行った”からだそうだ。この新しいエンジンにより、毎秒1440万回のライト(write)が可能になった。

それは技術的にもすごいもので、同社のブログ記事によると、単純に毎秒1400万のライトではなく、“パブリッククラウドにある完全に順序化され完全なトランザクションをサポートしているデータベースで、100%マルチキーのクロスノードトランザクション(複数のノードにまたがるトランザクション)を行う場合の、毎秒1400万回のライトだ。別の言い方をすると、FoundationDBは利用料金1ペニーあたり、データベースのライトを360万回行う”、という。

企業のデータベースを何らかの形で担当している技術者は、この話を聞いて、関心を持たずにはいられないだろう。しかもこの速さなら、来たるべき物のインターネット(Internet of Things, IoT)の時代のレスポンス要請を無難にこなすだろう。その時代には、インターネットに接続された何十億ものデバイスが、大量のデータを24時間365日休みなく捉え続けるのだ。

しかもこれは、多くの競合他社たちの改良努力を刺激する。またそれによって非常に多くのユーザ企業が、OracleやDB2を使っている青銅器時代からそろそろ卒業すべきか、と思い始める。そして、ゆっくりと、すこしずつ、そして大胆に、新しい時代へと移行していく。その新しい時代には、デベロッパはシンプルなキー-ヴァリューのセマンティクスで楽(らく)ができ、ITは高速化された古典的なSQLでクェリでき、完全にACID化された分散トランザクションを同時一斉に行える。長期的には企業も人間も、今より良い生き方ができるはずだ。それまでの過渡期には、データベースの能力拡大、限界の克服に挑み続ける多くの無名のデータベース技術者たちの、努力の積み重ねがある。われわれには見えないところで彼らは日々、世界と社会に大きな貢献を提供している。


1ACIDの中のC、すなわち”consistency”(一貫性、整合性、無矛盾性) の説明がここにはない。たしかに無矛盾性は、それに比べると中世のピンの頭の上に乗れる天使の数に関する議論すらノックノック・ジョークの一種と思えてしまうぐらいの難解な話題だ。でも技術用語としてのそれは、結果的にそうであるという無矛盾性ではなくて、システムの動的構造が最初から明示的に、矛盾を許容しない、生成しない、という意味だ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


ビッグデータ処理のモバイル化を志向するCouchbaseが新たに$60Mを調達

分散コンピューティングの需要やモバイルデバイスの増殖に伴い、コンピューティングのインフラとなるツールの革新の歩みが加速している。そして新しいタイプのデータ管理やデータ処理技術を専門とするスタートアップたちが大きな資金を調達して、次世代のコンピューティングを推進しようとしている。

最近、新たな投資家WestSummitやAccel Growth Fundから6000万ドルを調達した新進のデータベース企業Couchbaseも、その巨額な資金により、国際展開と継続的な研究開発を、さらに加速するつもりだ。

カリフォルニア州Mountain Viewの同社は、MongoDBなどとともに、企業や組織の業務データ(operational data, オペレーショナルデータ)の管理を扱う、資金状態の良好なスタートアップの一つだ。

これまで累積で10億ドルあまりを調達しているClouderaなど、Hadoopベースのベンダと違ってCouchbaseとMongoDBは、データベースのデータ処理よりもむしろ、データの管理とリカバリに力点を置く。同社のCEO Bob Wiederholdは、そう語っている。

Wiederholdは曰く、“ユーザのところでは大量のアプリケーションが同時に動いていて、大量のデータベース操作をたえず行っている。今日のデータベースは、そのような苛酷な状況を堅牢にサポートしなければならない”。古いデータベース技術ではデータが中央一点型で存在し、Couchbaseのような分散データベースと違って、需要増に応じて機敏なスケールアップができない、と彼は語る。

WestSummitとAccel Growthから得た新たな資金は、ビッグデータ市場のなお一層の開拓に充てられる。その市場のグローバルな現在の規模は、アナリストグループIDCによれば、160億ドルあまりと推計されている。

さらに同社は、5月のローンチしたモバイル技術の展開にも力を入れていく。

Couchbaseが今市場に売り込もうとしているモバイルデータベースは、モバイルデバイス上のアプリケーションが、インターネットに接続していないときでも稼働できる状態を作り出す。

Wiederholdはさらに言う: “今モバイルアプリを使おうとすると、インターネット接続がなかったり、接続状態が悪かったりしてフラストレーションにおちいることがある。ある程度キャッシュが使われてはいるが、アプリ本体の機能は利用できない。しかし、必要なデータをモバイルデバイス上に保存できたら、非常に速いレスポンスタイムを享受できるし、インターネット接続が得られる状態になったらデータをクラウドにシンクできる”。

Couchbaseのモバイルプロダクトはまさに、そのような機能性を提供する。“モバイルへの移行は巨大なトレンドであり、そのためにまず最初に作られるのがモバイルのアプリケーションだ。しかし、今よりももっとグレートなモバイルアプリケーションを作れて、利用できるためには、モバイル対応のデータベースこそが、その鍵となる技術なのだ”、とWiederholdは自負を語る。

モバイルと並んでCouchbaseのCEOの目に映じている大きな機会が、国際展開の拡大だ。中国と合衆国を股にかけたファンドWestSummitを加えたのも、そのねらいからだ。WestSummitの協同ファウンダでマネージングパートナーのRaymond Yangが、Couchbaseの取締役会に加わる。

Couchbaseには、二つの別々のデータベース企業CouchOneとMembaseというルーツがあり、両社が2011年に合併してCouchbaseになった。

同社はこれまでに、Accel Partners、Mayfield Fund、North Bridge Venture Partners、Ignition Partners、Adams Street Partnersなどから合計1億ドルあまりを調達している。

写真はFlickrユーザElif Ayiterより

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


複数のNoSQLデータベースの使い分けを単一のREST APIでできる中間サービスOrchestrate

今は、アプリケーションのデータベースは一つあれば十分という時代ではない。今日では多くのサービスがさまざまなデータベース…とりわけNoSQLデータベース…を駆使して彼らのアプリケーションのいろんな側面を構成している。そうなると、複雑性とエラー箇所と費用が増える。またそれと同時にデベロッパはAmazon Web Services(AWS)的なやり方に慣れ、毎秒1000クェリから10000へスケールしても、かつてのローカルでオンプレミスのデータベースのように簡単に処理能力の限界にぶつかることもない。

昨年300万ドルのシード資金を獲得して今日(米国時間2/4)ベータを脱したOrchestrateは、一つのアプリケーションが複数のデータベースを使う場合の複雑性を、過去のものにしようとする。このサービスを利用するとデベロッパは、どんなデータ処理でも単一のREST APIの呼び出しで済ませられるようになる。そのAPI呼び出しでデータを受け取ったOrchetrateは、MongoDBやCouchDBなどもっとも適切なNoSQLデータベースを使用するが、デベロッパはそれらにOrchestrateの単一のAPIを介してアクセスすることになる。

同社の協同ファウンダでCEOのAntony Falcoによると、今はOrchestrateのインフラストラクチャの多くがAWSの上にあるが、今後は複数のクラウドを使うとともに、ヨーロッパやアジアのデータセンターもサポートしていきたい、という。そうなればたとえば、合衆国東部ではデータをAmazon上でホストし、ヨーロッパではSoftlayerを利用、しかし必要に応じて異なるクラウド間でデータをリプリケートすることも可能、という形になる。セキュリティ要件の厳しいユーザに、同社のサービスをオンプレミスで使わせることも、目下検討中だ。

今日正式ローンチしたものの、まだまだ付け加えるべき機能はたくさんある、とFalcoは言う。たとえば、古典的なSQLデータベースや、地理的空間的データのサポートだ。ただし地理的空間的データ(geo-spatial data)という言葉の意味がユーザによっていろいろ違うので、顧客が求めているものを正確に知ることが第一歩となる。

Falcoは、成功を収めたRiak NoSQLデータベースを抱えるBashoの協同ファウンダで、COOだった。Orchestrateは、今社員が12名だ。その多くはオレゴン州ポートランドの本社にいるが、リモートの社員も少なくない。

Orchestrateは、料金体系もシンプルを指向している。月間のクェリ操作が100万未満なら無料、1000万までが39ドル、そこから100万増えるたびに2ドルが追加請求される。ストレージに関しては課金しない。無料も含めてどの利用形態でも、モニタリングとサポートと利用状況報告と毎日のバックアップがサービスされる(バックアップ先はユーザが指定する…たとえばS3とか)。バックアップがこのようにユーザサイドにあり、データはすべてJSONオブジェクトとして保存されるから、いわゆるベンダロックインという問題はOrchestrateに関しては生じない。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


SkySQLがオープンソースの関係データベースMariaDBのサポート強化で$20Mを調達, AWSユーザにもサービスを提供

SkySQLが、同社のMariaDBのサポートを強化するために2000万ドルを調達した。この、急成長しているオープンソースの関係データベースを、最近はWikipediaも採用した。今回の投資ラウンドはIntel Capitalが仕切り、California Technology VenturesやFinnish Industry Investment、Open Ocean Capital、Spintop Private Partnersなども参加した。

これまでMariaDBは主に技術者コミュニティのプロジェクトだったが、今年はWikipediaがその基盤的SQL技術として採用し、またFedoraやOpenSuseのようなメジャーなLinuxディストリビューションも基本パッケージの一環として採用した、とSkySQLのCEO Patrik Sallnerは述べる。今回の投資ラウンドはSkySQLのMariaDB開発努力が認められた証でもあり、また、主要なMySQL代替製品の位置を獲得したことをも、示している。

新たな資金はオープンソースプロジェクトMariaDBの開発継続と、サポートの充実、そしてMariaDBデータベースサーバをスケールするための商用製品の開発に充てられる。たとえばSkySQLはそのサポート業務の一環として企業によるMySQLからMariaDBへの移行を支援し、バグフィックスなどのサポートサービスを提供している。また今後は、NoSQLデータベースとの統合も強化していく。MySQLは、そのパフォーマンスの良さとトランザクション機能により、スタンダードにのし上がった。NoSQLはそのスケールアウト機能(分散化展開)により、ユーザを増やしている。この二つのデータベース技術の組み合わせは”NewSQL”と呼ばれるトレンドになっており、SkySQLはそれを自己の商機としてねらっている。

MySQLは、スケーラビリティが弱点とされ、Amazon Web Servicesのようなクラウドサービスには向かないと言われていた。最近のデータベースは、複数のサーバに共有される形での開発と展開が必要とされる。FacebookやGoogleなどはそのためのスキルを持っているが、多くの中小企業は持ち合わせていない。しかしそのようなスケーリングの能力がMariaDBには最初からあり、またそのサポートをSkySQLが提供する。

そこで昨年の9月にSkySQLは、Amazon Web Services上のデータベースをスケールするサービスを立ち上げた。対象はデータベース管理者だが、企業のデータベース環境をクラウド環境へ展開するための技術的スキルのない、エンドユーザを主にねらっている。このサービスはIT管理者に管理コンソールを提供して、インスタンスの管理、ネットワーク上の個々のノードの隔離と再構成、バックアップ、リストアなどを行わせる。このような高度な管理業務は、よほど強力なデータベース管理技術のある企業でないと、自前でやるのは無理である。

同社のデータベース技術はマスマーケットで受け入れられるにふさわしい、歴史的背景を担っている(MySQLスピンオフ)。4月に同社はMySQL ABチームのオリジナルメンバーを抱えるMonty Programと合併し、MariaDBを今後強力に支えていくためのスタッフを得た。

しかし今、データベース業界は多様化と競争が激化している。そしてデベロッパたちは、NoSQLのシンプルさと展開の容易さを好むようになっている。しかしデベロッパが欲するものは、アプリケーション開発のできるかぎりの短期化だ。アプリケーション開発がますます手工芸でなくなりつつある今は、開発の迅速性がより一層求められるようになっているのだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


NoSQL DBのトップMongoDBが$150Mを調達…今やIBM御用達, Salesforceも投資に加わる

MongoDBがT. Rowe Price Associatesから1億5000万ドルを調達し、この投資ラウンドには新たにAltimeter CapitalとSalesforce.comが参加した。既存の投資家であるIntel Capital、NEA、Red Hat、そしてSequoia Capitalも、参加している。MongoDBは2007年の創業以来今日までで、累計2億3100万ドルを調達した。

競争がますます激しくなっているNoSQLのベンダたちの中で、知名度がトップの企業がMongoDBだ。そのほか、データベース業界全体としては、SQLの伝統的大手や、新技術であるインメモリデータベース、新方式のDaaS(database-as-a-service)サービスなどとも、同社は競合関係にある。MongoDBなどのNoSQLデータベースは、安価な日用品的なサーバから成る分散インフラを使用し、モバイルやWebのアプリケーションを作っているデベロッパたちに人気がある。MongoDBは(表などでなく)ドキュメント(文書)を使用するデータベースだ。データはさまざまなデータ構造として定義され、そのコード形式はXMLやJSON(JavaScript Object Notation)などと互換性がある。MongoDBがデベロッパに人気がある大きな理由の一つが、JSONなどとの互換性だ。彼らは自分の既存のスキルで、MongoDBを使うアプリケーションやサービスを開発できる。

MongoDBの人気は、そのグローバルなコミュニティが証明している。これまでの累計ダウンロード数は500万に達する。またその需要は、下図のように、求人数の推移にも現れている。MongoDB技術者の求人は、Cassandra、Redis、CoucDBなどを抜いてトップであり、検索数はHTML5に次いで二番目に多い。

新たな資金はMongoDB本体のサポートと、新たな管理サービスの展開に充てられる。後者には、データベースをスケールし管理していくための一連のツールやサービスが含まれる。これまでMongoDBは、そのスケーラビリティが批判されていた。またMongoDBのサービスは、オーケストレーション方面が弱い、とも言われていた。

管理サービスへの注力は、IBMとのパートナーシップを反映している。今月の初めにこの巨大テクノロジ企業は、同社が使うNoSQLデータベースとしてMongoDBを選んだのだ。

MongoDBの顧客の中には、Craigslist、MetLife、Salesforceなどがいる。本社はパロアルトにあり、支社はニューヨークとダブリンとシンガポールにある。そのほか、アトランタ、バルセロナ、ロンドン、シドニー、ワシントンDCにもオフィスがある。

新たな投資者の中にSalesforceがいることは、注目に値する。最近のSalesforceはマーケティングクラウドとモバイルアプリに力を入れようとしている。そこがMongoDBに投資したということは、同社がNoSQLを、これからのポストPC~モバイル時代の主要技術の一つと認めていることを表している。

MongoDBの現在の社員数は、世界全体で320名あまりだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


NoSQLデータベースのCouchbaseが$25Mを調達してグローバル展開へ, 一番人気MongoDBとの差別化を強調

NoSQLデータベースのCouchbaseが2500万ドルを調達して、新しいエンタプライズ機能を構築するとともに、インド、中国、南アメリカなどに事業を拡張していく。このシリーズDのラウンドを仕切ったのはAdams Street Partners、これに既存の投資化Accel Partners、Mayfield Fund、North Bridge Venture Partners、およびIgnition Partnersが参加した。これで同社の資金総額は5600万ドルになる。

Couchbaseは独立のオープンソースプロジェクトだが、ApacheのApache CouchDBと、同じくオープンソースプロジェクトのmemcachedがその背景にある。

そのほかのNoSQL企業と同様にCouchbaseも、企業の評価がより戦略的になるに伴い、採用事例が増えている。最近ではますます、Couchbaseをミッションクリティカルなアプリケーション用、と考えるところが多い。

データベースを複数のデータセンターに分散している企業も珍しくないが、Couchbaseの最新リリースには、それら複数のデータセンターを横断してレプリケーション(複製)行う機能が加わった。また、新たなセキュリティ機能も加えた。

CouchbaseのCEO Bob Wiederholdによると、同社を他社と差別化するものは最小のレイテンシと最大のスループットだという。彼によるとキャッシングの層とデータベースの層が別々になっているところが多い中でCouchbaseは、この二つの層を一つにまとめた。そのためにCouchbaseにはMemcachedが組み込まれており、またストレージのためのディスクも高効率なものを使用している。

同社のこのような技術では、競合相手のMongoDBによくあるロッキングが起きない。もちろんデータベースがロックしたらパフォーマンスは大きく落ちる。…Wiederholdはそう主張する。

Wiederholdによると、CassandraやMongoDBのような競合製品との大きな違いは、そのピアツーピアネットワークのスケーラビリティが優れており、セットアップが自動化されていることだ。

Webアプリケーションやモバイルアプリの要求が、今変わりつつある。今では数百万ものユーザが同時にスリータイヤアプリケーションを使用する。アプリケーションはそういう、Web的スケールで稼働しなければならない。しかもそれらはデータが主役で、高速なスケールアップが必要とされる。

Couchbaseの技術は堅固なワールドクラスのテクノロジだが、最近IBMの認定製品にもなったMongoDBに比べると、まだ知名度が低い。しかしWiederholdは、人気競争には関心がない、ユーザのスケーラビリティをしっかり確保することが何よりも重要、と言う。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


長年の混乱に終止符, MongoDBのオーナー企業10genが社名をMongoDBに変更

NoSQLデータベースMongoDBの開発とサポートを行っている10genが、社名を製品名と同じMongoDBに変えた。同社によると、その目的は、オープンソースのデータベースプロジェクトと、それを支える会社とを、一体とするためである。新社名は、ただちに有効となる。

MongoDBは知名度の高いドキュメントベースのデータベースで、2007年に10genの傘下でローンチした。10genそのものは、オープンソースのクラウドのためのプラットホーム、という構想でスタートした企業だ。しかしその後同社はMongoDBをメインのプロダクトにすることに決め、実質的にデータベース企業になった。今回の社名変更に関して会長で協同ファウンダのDwight Merrimanは、社名と主製品名の統一がその目的、と語った。

MongoDBプロジェクトとそのコミュニティWebサイトmongodb.orgは、社名の変更の影響を受けない。10genのWebサイトは10gen.comからmongodb.comに変わった。

それは、もちろん良いことだ。10genという名前は、これまでひたすら、混乱を招いていた。改名は、MongoDBにとってというより、会社にもたらす今後のブランド効果が大きいだろう。

なおこのところ、企業経営がますますデータドリブン(data driven, データ駆動型)になるに伴い、NoSQL運動が飛躍的に成長している。関係データベースの支配は今も続いているが、それはクライアント/サーバの時代に設計されたものであり、数テラバイトものデータを処理するには適していない。膨大な量のデータ処理は、いまや例外ではなく企業ITの定番になりつつある。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


企業がNoSQLデータベースを導入するためのプラットホームDataStaxが$45Mを調達, 狙いはApache Cassandraの育成

ハイパフォーマンスでスケーラブルなNoSQLデータベースのプラットホームを提供しているDataStax が、Scale Venture Partnersが率いるシリーズDのラウンドにより4500万ドルを調達した。Draper Fisher JurvetsonとNext World Capitalのほか、以前からの投資家たちもこのラウンドに参加した。

DataStaxはこの資金を、同社のデータベースディストリビューション(配布系)の基盤でもあるオープンソースのNoSQLデータベース実装Apache Cassandraの、さらなるグローバルな構築と、それへの投資に充てていく。今回の投資は同社のIPOを示唆するものでもあるが、CEOのBilly Bosworthによれば、どうなるかは市場の方向性次第だ、という。“IPOは弊社の既定路線だが、それは外部要因に依存するところも大きい。しかし内部的には、すでにその準備を開始している”。

今回の資金調達を機にDataStaxは、同社のデータベースソフトウェアのエンタプライズ向けとコミュニティエディションをバージョン3.1へアップデートし、データロード能力の強化と検索の高速化、およびユーザザビリティの改善を約束する。

2010年に創業されたDataStaxは、今ではApache Cassandraの主席コミッターで、その製品はパフォーマンスの高さとスケーラビリティで定評がある。しかしCassandraは比較的新しいため、それを独力で使えるところは少ない。しかし需要は増えているので、DataStaxはCassandraに大きな投資をしてコミュニティをより大きくし、プラットホームの用途も拡大したいと考えている。今回の投資ラウンドでもDataStaxはCassandraへの投資を続けて、ミートアップの開催数を増やすなどの取り組みを行う。とくに重視するのが、今後の拡張先と考えているアジアとラテンアメリカだ。

この投資のタイミングは、多くの企業が、関係データベースから今のデベロッパたちに人気のあるデータ集約的なNoSQL環境への移行を始めている時期と合致する。NoSQLデータベースは、関係データベースが一台の専用サーバの上で動いたのに対し、コンピューティングの多くがマルチテナントのクラウド上で行われる新しい時代に向いている。その市場はオープン性が高くて、IBMも、もっとも人気の高いNoSQLデータベース技術と思われる10GenMongoDBへと標準化している。〔関連記事。〕

一方、データベース市場の新しいアイデンティティの模索は続いている。NoSQLはスタートアップたちの寵児だが、まだ多くの企業は長年使い慣れた関係データベース上のトランザクションシステムを簡単には捨てきれない。でも、そういう従来的な企業も近頃はデータの生成量が多くなっているため、今後はDataStaxのお客さんが増える一方だ。またこの市場変動は、ハイブリッド型のデータベースにも機会を与えつつある。たとえばNoSQLのプロバイダであるFoundationDBは先週、NewSQL系のAkibanを買収して、NoSQLのスケーラブルなパフォーマンスに関係データベースのトランザクション指向の強みを妻合(めあ)わせようとしている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))