Google CloudでBigtableの小さなワークロードでも動かせる

Cloud Bigtableは長年、Google Cloud上の大きなペタバイト級の分析やオペレーショナルのワークロードを支える、完全なマネージドNoSQLサービスだった。しかし1ノード1時間あたり0.65ドルという料金と、1クラスターあたり3ノード以上というGoogle Cloudの要求により、それは決してお安いサービスとは言えなかった。しかしながら、今日(米国時間4/7)からそれが変わる。これからはBigtableのプロダクションワークロードを、わずか1ノードでも動かすことができる。

Google Cloud BigtableのプロダクトマネージャーSandy Ghai氏が、今日の発表声明で次のように述べている。「Bigtableを、大小を問わず、さまざまなキー-ヴァリューおよびワイドカラムのユースケースの優れたホームにしたい。それは新人デベロッパーでも、古参のエンタープライズでも同じであり、みなさまが自己管理しておられたHBaseやCassandraなどのクラスターの、ランディングページでありたい」。

これによりGoogle Cloudでは、小さなクラスターのレプリケーションによる高可用性と、ワンノードの開発インスタンスとワンノードのプロダクションインスタンスを必要に応じて切り替えることが可能になる。さらにまた、今ではサービスのSLAが、サイズを問わずすべてのBigtableのインスタンスを対象にしている。

このところGoogle Cloudは大企業エンタープライズ顧客の獲得と問題対応に熱心だったから、今回のようにBigtableに小さなワークロードを歓迎する動きは興味深い。でも、初めに一つのノードだけを必要とした企業が、やがて大量のクラスターを必要とするようになったりするから、Bigtableのこれまでの最小要件は小さな企業にとって障壁だった。しかもデータベースは、企業が小さい時期と大きくなってからとで、安易に切り換えるようなサービスではない。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

DataStaxがCassandraデータベースのためのKubernetesオペレーターをローンチ

米国時間3月31日、オープンソースのApache Cassandraプロジェクトを支える商用企業DataStaxが、データベースのクラウドネイティブバージョンを動かすために同社が開発したKubernetesオペレーターをオープンソースで発表した。

DataStaxの最高戦略責任者である Sam Ramji(サム・ラムジ)氏が2019年にGoogleから来て最初に取り組んだのが、KubernetesとCassandraに関して顧客、パートナー、コミュニティメンバーの動向をつかむことだったが、そこでわかったのはサポートが驚くほど限定的だったことだった。

一部の企業はKubernetesのサポートを自分たちで構築していたが、DataStaxには自社サポートと呼べるものがなかった。KubernetesはGoogleで生まれ、そして現在、DataStaxはコンテナ化を熱心に推進している。そこでラムジ氏は、顧客がKubernetesの利用を始めやすくするためのオペレーターがDataStaxにあるべきだと考えた。

「オプションとしてコミュニティに提供しているKubeオペレーターの特別な点は、オペレーターをCassandra向けに一般化して、どこでそれを実装しても使えるようにしたことだ」とラムジ氏はいう。

ラムジ氏によると、多くの企業が独自にKubernetesを運用している企業の多くは、それらは各社の固有の要求に向けて独自化されている。それはそれで結構だが、同社がCassandra上に構築しているため、幅広いユースケースにアピールできる一般的なバージョンを開発したいと考えていたという。

Kubernetesでは、オペレーターはDevOpsチームによるパッケージングの仕方、アプリケーションの管理とデプロイの仕方、それを正しく動かすために必要なインストラクションなどの指示を与える。DataStaxが今回作ったオペレーターは、Cassandraを幅広い前提条件で実行するために特別に作成ししたものだ。

Cassandraは強力なデータベースで、他のデータベースがダウンしても動き続ける。そこでAppleやeBay、Netflixなども主要なサービスを実行するために使っている。この新しいKubernetesの実装により、コンテナ化したアプリケーションとしてCassandraを動かしたいという人は誰でも利用できるようになり、Cassandraをモダンな開発領域へと押し上げられるようになる。

同社はまた、新型コロナウイルス(COVID-19)のためデータベースの利用が増えて苦労している技術者を助ける無料のヘルプサービスを発表した。彼らはそのプログラムを「Keep calm and Cassandra on(落ち着いて、Cassandraを動かそう)」と呼んでいる。Cassandraのようなシステムの稼働の維持を任されている技術者をサイトリライアビリティエンジニア(SREs、サイトの信頼性を維持するエンジニア)と呼ぶ。

ラムジ氏の説明によると「この新しいサービスは完全無料のSRE間のサポート通話だ。我々のSREたちは世界中どこからのApache Cassandraユーザーからの電話に対応する。需要増に対応しようとしているCassandraのバージョンは何でもよい」という。

DataStaxは2010に創業され、PitchBookのデータによるとこれまで1億9000万ドル(約206億円)を調達している。

関連記事:DataStax Lands $106M In Series E Funding(未訳)

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

AWSがスループット保証付きマネージドCassandraサービスをローンチ

米国時間12月3日に開催されたAWS re:InventでAmazonは、AWS上でCassandra(カサンドラ)データベースを管理できる機能を発表した。

このAmazon Managed Apache Cassandra Service(Amazon MCS)と呼ばれるマネージドサービスは、サードパーティのベンダーからではなくCassandraを直接デベロッパーに提供しようとするAWSの意図の現れであり、すでにGrubhub.com、Netflix、Ooyala、Openwave、Reddit、Uberなどさまざまな企業が使っている。

同社によると、Amazon MCSはサーバーレスなので、ユーザーは自分が実際に使うリソースにだけ料金を払い、アプリケーションのトラフィックに応じてスケールアップとダウンは自動的に行われる。アプリケーションは毎秒数千のリクエストに応じられ、そのスループットとストレージに上限はない。IoTにとっては、とびきり魅力的な特性だ。

デベロッパーは、Cassandraの既存のアプリケーションをそのままAWS上で動かせるし、これまで使っていたデベロッパーツールを使える。アプリケーションのアップデートはAmazon MCSのサービステーブル中のエンドポイントを変えるだけだ

データはデフォルトで暗号化されて保存される。暗号化にはAWS Key Management Service(KMS)に保存されている暗号鍵が使われる。同社によると、Amazon MCSAWS Identity and Access Management(IAM)と統合されているので、デベロッパーはテーブルデータの管理やアクセスが容易とのこと。

Amazonによると、同社はCassandraのAPIライブラリにも協力しており、またオープンソースのApache Cassandraプロジェクトにバグフィックスで貢献している。プレビュー期間中はオンデマンドのキャパシティに課金され、一般公開時にはある程度予測できるワークロードに対して一定のスループットを確保・提供する。

今このプロダクトはAmazonの無料ティアに含まれている。企業は、最初の3か月はライトリクエスト3000万、リードリクエスト3000万、ストレージ1GBの無料ティアを使用できる。

画像クレジット: Ron Miller

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

Bashoが時系列データ専用NoSQLデータベースRiak TSをオープンソース化してIoTへの浸透をねらう

internetofthings

世界中のありとあらゆるデバイスメーカーが、自分たちの製品をインターネットに接続しようとしているように、思える。ベッド用のマットレスも、洗濯機も、トースターも、そしてジューサーも〔冷蔵庫も〕。大量のデータが空中や線上にあふれ出て、分析されるのを待つ列に並ぶだろう。

そのようなデータは今後増加の一方で、それを送信する能力は、最近1億5000万ドルを調達したSigFoxなどの企業によって徐々に整備されていくが、しかしながら今の分散データベースのアーキテクチャの多くは、市場が求めるそんな帯域にマッチできるほどの、高速なデータ処理と出力の能力を持っていない。

シアトルのBashoは、同社のNoSQLデータベースRiak TSの最新リリースで、そんな問題の一部を解決しようとしている。TSはtime-series(時系列)の頭字語で、データのユニークなキーヴァリューがタイムスタンプであり、それはそのデータが作られた日時を指している。TSシステムはこれまでもBashoのエンタープライズクライアント(Uber, AT&Tなど)にしばらく使われてきたが、今回のオープンソースリリースによって、そんなデータタイプを初めて扱うデベロッパーでも、気軽に利用できるようになった。

MongoDBやDataStaxなどの同業企業と違ってBashoはこれまで、わずか2500万ドルの資金しか調達していない。明らかに同社は、時系列データを扱うという独自性が、NoSQLデータベースの業界で強力な差別化要因になる、と信じている。

今回のニューリリースは、ApacheのクラスターフレームワークSparkを統合し、SparkとRiak TSにおけるインメモリ処理のためのデータの、自動的分散化と対話をサポートしている。

多くの人にとってこれは些細なことと思えるかもしれないが、センサーからの大量の時系列データを扱う者にとっては、大規模な分散化データが、コンピューターの実動時にすら、長いリード/ライト時間の原因となり、分散化による冗長性が効率を殺してしまう。

ソリューションとしては、ハッシュランクを使ってデータのキーをデータクラスター全体にわたって均一に分散するやり方が多い。それによって、大規模なノード集合全域にわたる同じタイムレンジからのデータを効率的に入力するが、一方でレンジへのアクセスが高負荷な操作になる。

BashoのCEO Adam Wrayによると、Riak TSが使っているユニークな分散化システムはユーザーに、タイムスタンプのある、あるいはそのほかの連続的な、データの処理における有利性を与える。

“われわれはデータの配置を最適化し、特定のノードが特定のレンジのデータを得るようにしている”、と彼は語る。つまりこのような配置によって、一定のタイムレンジからのデータのフェッチが、より少ない操作ですむようにしている。

新しいリリースのREST APIによって個々のデベロッパーが利益を得るだけでなく、Bashoがエンタープライズの世界で歓迎される要因は、Riak TSの、既存のSQLデータベースコマンドとの互換性だ、と彼は考えている。

“それは正規のSQLコマンドであり、一部のCQLや、SQLのわれわれ独自の変種ではない”、とBashoのCTO Dave McCroryは述べる。“われわれは、人びとがいちばん多く使いたがる従来的な操作をサポートする”。

たしかに、いちばん多く使われているSQL操作をサポートすればレガシーユーザーやエンタープライズの多くにとって魅力的だが、多くのエンタープライズユーザーはSQLプラットホームの上に内製のカスタムソリューションを乗っけており、それがエンタープライズ世界におけるRiak TSの広範な採用を妨げるかもしれない。

Riakのノードは仮想と物理的、両方のマシンにまたがって分散化でき、またMicrosoftのAzureやAmazon Web Servicesなどのプラットホーム上の、クラウドインスタンスの上でもそれは可能だ。

Bashoの主張によると、時系列データの処理では、Riak TSの方がApacheのNoSQLデータベースCassandraなどよりも50%は速い。本誌TechCrunchはこの主張を検証していないが、今回オープンソース化されたことにより、Rial TSシステムのパフォーマンスゲインは多くのユーザーにとって明らかになるだろう。

このシステムが内包している強力な事故回復力が、エンタープライズユーザーたちのデータベース乗り換えの十分な動機になるか、それはまだ分からない。Riak TSでは各クラスターが同一データのコピーを三つ抱えるので、マルチクラスターのリプリケーションが天文学的な数の操作になることもありえる。しかし十分なスケーラビリティがあれば、これによって高いアップタイムと低い誤り率が保証される。ただしそれに要する費用は、小さな企業が尻込みするほどの額だろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

企業がNoSQLデータベースを導入するためのプラットホームDataStaxが$45Mを調達, 狙いはApache Cassandraの育成

ハイパフォーマンスでスケーラブルなNoSQLデータベースのプラットホームを提供しているDataStax が、Scale Venture Partnersが率いるシリーズDのラウンドにより4500万ドルを調達した。Draper Fisher JurvetsonとNext World Capitalのほか、以前からの投資家たちもこのラウンドに参加した。

DataStaxはこの資金を、同社のデータベースディストリビューション(配布系)の基盤でもあるオープンソースのNoSQLデータベース実装Apache Cassandraの、さらなるグローバルな構築と、それへの投資に充てていく。今回の投資は同社のIPOを示唆するものでもあるが、CEOのBilly Bosworthによれば、どうなるかは市場の方向性次第だ、という。“IPOは弊社の既定路線だが、それは外部要因に依存するところも大きい。しかし内部的には、すでにその準備を開始している”。

今回の資金調達を機にDataStaxは、同社のデータベースソフトウェアのエンタプライズ向けとコミュニティエディションをバージョン3.1へアップデートし、データロード能力の強化と検索の高速化、およびユーザザビリティの改善を約束する。

2010年に創業されたDataStaxは、今ではApache Cassandraの主席コミッターで、その製品はパフォーマンスの高さとスケーラビリティで定評がある。しかしCassandraは比較的新しいため、それを独力で使えるところは少ない。しかし需要は増えているので、DataStaxはCassandraに大きな投資をしてコミュニティをより大きくし、プラットホームの用途も拡大したいと考えている。今回の投資ラウンドでもDataStaxはCassandraへの投資を続けて、ミートアップの開催数を増やすなどの取り組みを行う。とくに重視するのが、今後の拡張先と考えているアジアとラテンアメリカだ。

この投資のタイミングは、多くの企業が、関係データベースから今のデベロッパたちに人気のあるデータ集約的なNoSQL環境への移行を始めている時期と合致する。NoSQLデータベースは、関係データベースが一台の専用サーバの上で動いたのに対し、コンピューティングの多くがマルチテナントのクラウド上で行われる新しい時代に向いている。その市場はオープン性が高くて、IBMも、もっとも人気の高いNoSQLデータベース技術と思われる10GenMongoDBへと標準化している。〔関連記事。〕

一方、データベース市場の新しいアイデンティティの模索は続いている。NoSQLはスタートアップたちの寵児だが、まだ多くの企業は長年使い慣れた関係データベース上のトランザクションシステムを簡単には捨てきれない。でも、そういう従来的な企業も近頃はデータの生成量が多くなっているため、今後はDataStaxのお客さんが増える一方だ。またこの市場変動は、ハイブリッド型のデータベースにも機会を与えつつある。たとえばNoSQLのプロバイダであるFoundationDBは先週、NewSQL系のAkibanを買収して、NoSQLのスケーラブルなパフォーマンスに関係データベースのトランザクション指向の強みを妻合(めあ)わせようとしている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))