グラフデータベースNeo4jのバージョン4.0はサイズ制限のないスケーリングが可能に

グラフデータベースのメジャーであるつNeo4jが今日(米国時間2/4)、バージョン4.0のリリースを発表した。最大の目玉は、スケーリングのサイズに制限がなくなったことだ。

グラフデータベースは複数のデータ間の結びつきを表現し調べることができるので、近年ますます人気がある。たとえばeコマースのサイトなら互いに関連するアイテムを表現したいし、ソーシャルサイトでは自分の友だちと、友だちのそのまた友だちなど、複雑な友だち関係を知りたいだろう。主に企業で人気が増していて、特にデータサイエンティストたちが好んでいる。大量のデータの中の関係を表現し見つけられるからだ。

Neo4jの創業者でCEOのEmil Eifrem(エミル・アイフレム)氏によると、グラフデータベースというコンセプトを開発したのは同社だが、その後大きく成長し、多様な展開を見せてきた。「2019年は一般的にも良い年だったが、グラフデータベースにとってはさらに良かった。我々がグラフという言葉とデータベースという言葉をくっつけたときには、そういう新しいカテゴリーを作ることと、その市場開拓に力を入れてきた。そしてそれを、新しいコンセプトとして布教してきた」と語る。

「今度のニューバージョンはかなりのメジャーリリースであり、彼がフォーカスしたいこともいろいろある。まず最初は、大きさ制限のないスケーリングだ。バージョン4.0では高度な水平スケーリングを導入したので、それが可能になった。これまでのバージョンではデータベース全体にわたってデータを複製してきた。それはデータ処理でよく使われる方法だが、データ量がスケールすると遅くなる。ニューバージョンでは、それを変えたかった」と同氏。

同氏によると「4.0ではパーティショニングを導入した。それは、データベースの世界では『シャーディング』と呼ばれている技法だ。リードライトとサイズの両方をスケールできるから超強力な機能だ。限界があるとすれば予算、つまりどれだけ多くのマシンを加えられるかだ」とのこと。

ニューバージョンには、ロール(役割)ベースのアクセスが加わった。グラフデータベースが個々の部門やチームから全社に広がると、各人のロールに基づいて特定のデータへのアクセスを制限することが極めて重要になる。

これについても同氏は「今日では、Neo4jのグラフデータベースは全社的に広くデプロイされている。すると、セキュリティやプライバシーの問題も生じる。そこで、ロールベースのアクセスによりデータを保護するのだ」と説明する。

ニューバージョンにはほかにも多くの機能がある。例えば、単一のNeo4jクラスターで複数のデータベースを動かしたり、また「リアクティブシステム」のサポートもある。後者によりデベロッパーはデータベースとアプリケーションのやり取りを完全にコントロールでき、頑強性のあるデータパイプラインの確保と、データのストリーミング、機械学習などにもそれが応用できる。

Neo4jは2007年の創業。Crunchbaseによると、これまで1億6000万ドル(約176億円)あまりの資金を調達している。

関連記事:Neo4j nabs $80M Series E as graph database tech flourishes(グラフデータベースが大人気でNeo4jはシリーズEで8000万ドルを調達、未訳)

画像クレジット:Neo4j

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

Apache Cassandraデータベースを商用提供してきたDataStaxが昨年のAurelius買収の成果によりグラフデータベースをメニューに加える

shutterstock_222839971

DataStaxが昨年、グラフデータベースのAureliusを買収したときは、それは同社のDataStax Enterpriseプロダクトにグラフデータベースの機能を加えたいからだと思われたが、今日(米国時間4/12)同社はその目標を実現し、DataStax Enterprise Graphのリリースを発表した。

このエンタープライズグラフプロダクトはDataStax Enterpriseプロダクトセットに完全に統合され、これまでのキー・バリュー(key-value)、表形式、およびJSONドキュメントモデルに加え、初めてグラフオプションが顧客に提供される。

Kaiser PermanenteやCambridge Intelligence、Linkuriousなど10社による2か月の綿密なベータを経て同社は、このプロダクトをついに一般公開できることになった。この新しいグラフデータベースは、Aureliusが開発したオープンソースのグラフデータベースTitanがそのベースだ。

DataStax Enterprise Graphは複数のプロダクトで構成され、それらにはグラフデータベースを動かすDataStax Enterprise Server、管理部位DataStax OpsCenter、グラフを視覚化するDataStax Studio、多様な言語をサポートするDataStax Driver(s)などがある。

Graph visualization in DataStax studio.

グラフを視覚化するDataStax Studio(写真クレジット: DataStax

 

グラフデータベースはいくつかの点で、関係データベース(リレーショナルデータベース)と異なる。関係データベースでは複数の表のあいだの関係を定義し操作できるが、あまりにも複雑なデータや大量のデータになると、それらを十分な実用レベルで扱うことはできない。データ集合が大きくなり、さまざまなデータ間の関係が複雑になると、企業はそれらを無理なく表現し操作できる方法を求めるようになり、そこにグラフデータベースの出番がある。

いちばんよく知られているグラフデータベースは、FacebookのSocial Graphだろう。それは、あなた自身とあなたの友だちとの結びつきを表現する。このほか、たとえばAmazonのようなeコマースのサイトでは、ある製品とその関連製品の結びつきを表すために、この技術を利用している。Amazonで買い物をした人は、誰もがその機能を気に入るだろう。また医学の分野では、たとえば患者の症状とさまざまな疾病との結びつきを調べたり、クレジットカード会社は異常事と多様な犯罪的行為との関連を調べたりする。グラフ構造で表現するのがふさわしいデータ間の複雑な関係は、まだまだ、いろいろありえる。

DataStaxは社員が400名あまりいて、その実態はオープンソースのApache Cassandraデータベースのいわば商用部門だ。Cassandraへのコントリビューションも強力に行っており、また多様なサポートとより高度な機能を求める企業顧客向けには、そのエンタープライズバージョンをサポートしている。〔Cassandraのドキュメンテーションの多くがDataStax上にある。〕

同社は2010年にローンチし、これまでにおよそ1億9000万ドルを調達している。最近の資金調達は、2014年の1億600万ドルのラウンドだった。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

人気のグラフデータベースにいよいよ大企業が進出の兆し、トップ企業Neo Technologyの外堀城壁強化策を見る

shutterstock_315316133

グラフデータベースNeo4jを作っているNeo Technologyは、まだある意味無名に近い企業かもしれないが、一般的にグラフデータベースそのものは、私たちの日常の中にすでに広く浸透していて、誰もがそれとは知らずにアクセスしているはずだ。その市場は今急速に伸びていて、大企業も注目し始めている。

グラフデータベースは、物事と物事のあいだの、論理的な関係を表現する。それはたとえば、あなたが過去に買ったものや、Facebook上のあなたのソーシャルグラフから、あなたが好きなものを見つけ出す。

データベースの人気を調べているWebサイトDB-Enginesのデータによると、2014年に成長率がいちばん高かったデータベースがグラフデータベースだ。

DB-EnginesによるとNeo TechnologyのNeo4jはグラフデータベースのトップシェア製品だが、同社はその地位に満足していない。それどころか、今ではOracleMicrosoftのような大企業がグラフデータベースに進出しようとしているし、AmazonやHPなどもその後を追おうとしている。

それは、グラフデータベースがこのところいよいよ、エンタプライズの世界で離陸しようとしているからだ。企業のデータ集合においても最近では、事項間の論理的な関係を見出そうとするニーズが、高まっているのだ。

GartnerのリポートMaking Big Data Normal With Graph Analysis for the Massesによると、“2018年には、大企業の70%がグラフデータベースを利用するパイロット事業や概念実証努力に取り組んでいるであろう”、という。

市場の成長とともに、選手の数も増えてくるが、Neo TechnologyのCEO Emil Eifrem は、大企業が特定の垂直市場に食い込むことはあっても、一般的には技術の蓄積量と経験量の多いリーダー企業の製品、すなわちNeo4jを求める顧客が多いだろう、と展望している。

彼によると、今日までのNeo4jのデプロイ数は数百の顧客に対して約10000、その中にはWalmartやeBay、Adidasなどもいる。だから資金量の豊富な競合他社といえども、簡単に追いつけるものではない。

今後もトップの座を維持し続けるための切り札のひとつがオープンソースで、Neo4jもまさにそれだが、さらに同社は今週、他社製のグラフデータベースとの互換性を実現するツールopenCypherをリリースした。

“Cypherはうち固有の製品だが、他社が利用されてもかまわない”、とEifremは語る。彼のその姿勢は、必ずしも愛他精神からではない。さまざまなベンダのグラフデータベース製品間のコミュニケーション能力は、顧客にとってきわめて重要だから、既存システムとの互換性を心配していた顧客も今後徐々にNeoのユーザになる、と彼は見ている。

Cypherの開発にはOracleやDataStaxも関与した。後者はCassandraデータベースを作っているが、今ではグラフデータベースにも手を染めている。

さらに同社は最近、IBMとのパートナーシップにより、Neo4jをプレインストールしたPower 8サーバを売れることになった。顧客が求める大規模なジョブに対しては、高性能なハードウェアプラットホーム込みでシステムを売り込めるのだ。

また、最近バージョン2.3にアップグレードしたNeo4jは、かなり抜本的なアップデートにより、余裕をもってビッグデータを扱えるようになった。

以上、いくつかの新しい基本的な取り組みにより同社は、これからいよいよ押し寄せてくるであろう大企業からの攻勢に耐え、グラフデータベースにおけるトップの座を守りぬき、彼らとの差をさらに大きく開けようとしている。

Neo Technologyはこれまで、4410万ドルを調達している。最近の調達は、1月の、シリーズCの2000万ドルだった。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa)。

グラフデータベースNeo4jのNeo TechnologyがシリーズCで$20Mを獲得、売上は各年倍々ゲームの急成長

グラフデータベースNeo4jを作っているNeo Technologyが、投資家たちからもその着実な成長を認められ、このほどシリーズCで2000万ドルを調達した。

このラウンドはCreandumがリードし、Dawn Capitalとこれまでの投資家Fidelity Growth Partners Europe、Sunstone Capital、およびConor Venture Partnersも参加した。

同社のこの前の資金調達は2012年11月の1100万ドル、今回を合わせて総調達額は4410万ドルになった。

複数のデータ間の複雑な関係は、グラフでしか表せないこともある。たとえばよく知られているFacebookのソーシャルグラフは、ユーザとその複数の友だちとのあいだの、さまざまな結びつきを表す。Amazonなどのeコマースのサイトでは、たとえば、[この人はAを買ったがBも好きかもしれない]といった、複数の実体間の関係をグラフで表現する。

実際にWalmartはNeo Technologiesの顧客だし、本誌TechCrunchの姉妹企業Crunchbaseは、Neo4jのグラフデータベースを使って企業間の複雑な関係を表現している。

同社の協同ファウンダでCEOのEmil Eifremによると、Neo4jの主なユースケースは二つある。ひとつは、Walmartのような企業がそのアプリケーションの基盤の一つとしてグラフデータベースを使って、買い手との関係を表す場合だ。

もうひとつのユースケースはMaster Data Management日本語Wikipedia〕のインフラとしてグラフデータベースを利用するもの。大企業などでは、多様なデータソースから拾ってきたさまざまなデータを関係付けてひとつのレコード(単位的データ構造…たとえば一つの顧客データ)を作らなければならない。それはきわめて不定形なデータ構造になるため、やはりグラフを使うのがいちばん便利だ。

“これはたいへん困難で骨の折れる問題だ”、とEifremは語る。“そういうデータ構造は、作るのも操作するのも極めて難しい。しかもデータは頻繁に変化している”。そういう厄介なデータ問題の、最適のソリューションがグラフモデルだ、と彼は主張する。

Eifremによると、同社は2007年にオープンソースのプロダクトとしてスウェーデンに誕生し、最初の2年はプロダクトの構築とコミュニティの育成に注力していた。今ではそのコミュニティが同社の生命線であり、そして2011年ごろから一般の顧客も増えてきて本格的な商用化が必要になってきた。

そこで同社は本社をカリフォルニアに移し、技術者だけをスウェーデンに残した。Eifrem自身はそのとき、居住する国を変え、また自分の会社を純粋なオープンソース企業から、オープンソースをベースとする商用企業に変える、という二重の変化を経験した。

彼は90年代の半ばに学生として合衆国にいたので、友だちも少なくない。だから本社の移転は、想像したほど難しくはなかった。商用企業への移行に関しては、それは最初から彼のビジョンにあったことなので、とくに問題はなかった。

“うちはオープンソースだけど、いずれは大きな会社になる、と考えていた。オープンソース企業が力を持つためには、ある程度大きな企業でないとだめだ、と思っていた”、とEifremは語る。

データベース市場全体の中でグラフデータベースが占めるパイはとても小さいが、今急速に成長しており、彼の会社も伸びている、だから投資家たちを惹きつけるのだろう、とEifremは言う。

同社の社員は今7〜80名、今回の資金で年内に120名への増員を考えている。2011年に本社を移転してから売上は各年前年比2倍〜3倍増加している。それを、投資家たちが見逃すはずがない。

彼も言う、“毎年倍々ゲームを繰り返していれば、会社も当然でかくなる。投資家たちも当然目をつけるよね”。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))