Clouderaのオープンなクラウドサーバーから機密情報が見つかる、一時的にオフラインに

企業向けクラウド大手のCloudera(クラウデラ)は、セキュリティ調査員が内部の機密ファイルを発見したことを受けて、当初は「設計上オープンである」と主張していたにもかかわらず、いくつかのクラウドストレージサーバーをオフラインにした。

セキュリティ会社のUpGuardのリスクリサーチ担当ディレクターであるChris Vickery(クリス・ビッカリー)氏は、7月下旬にAmazon Web Services上でホストされているBuckets(バケット)として知られるクラウドストレージサーバーを発見。そこには、2019年1月に52億ドル(約5513億円)で完全株式合併を行う前のHortonworks(ホートンワークス)のデータが含まれていた。

連絡を受けたClouderaの広報担当者であるMadge Miller(マッジ・ミラー)氏はTechCrunchに対し、バケットはオープンなものとされており、同社の顧客やユーザー、より広いコミュニティに公開されているファイルやコードが含まれていたと語った。しかし同社によると、機密情報を含む3つのファイルを特定し、バケットから削除したという。しかし、その後すぐに同社は方針を180度転換し、バケットを完全にオフラインに戻した。

調査結果をTechCrunchと独占的に共有したビッカリー氏によると、クラウドバケット内のファイルの大部分は公開およびコミュニティでの利用を目的としたものだったが、Clouderaがソフトウェアプロジェクトの構築およびテストに使用している社内Jenkinsシステム(ソフトウェア開発のビルド 、 テスト 、およびデプロイに関連する部分を自動化するサーバー)の認証情報、アカウントアクセストークン、パスワード、その他の機密情報を含むファイルも発見されたとのこと。同氏によると、バケットには社内のビルドデータベース用のSQLデータベース全体も含まれていたという。


Clouderaの内部システムのパスワードと認証情報を含む「secrets」ファイル(画像提供:UpGuard)

Clouderaは、後日TechCrunchに送ってきたメールで、セキュリティ上の過失を認めた。「セキュリティ調査員からの質問のおかげで、我々は深く掘り下げてみたところ、公開バケットに置かれるべきではなかったいくつかの資格情報とSQLダンプを発見しました。クレデンシャル(ユーザー認証ナドに用いられる情報の総称)は内部のJenkinsビルドプロセスのもので、SQLダンプはビルドデータベースのものでした」と広報担当者は説明した。

「その後、この情報をパブリックバケットから削除し、クレデンシャルを変更したりキーを回転させたりすることで、さらなる改善策を講じました。また、いくつかの未使用のパブリックアクセス可能なバケットへのアクセスを閉鎖できると判断しました」と担当者は続けた。同社によると、削除された機密データには、顧客データやその他の個人を特定できる情報は含まれていなかったという。

全体的に見ると、今回のセキュリティ上の過ちはもっとひどいものだったかもしれない。しかしビッカリー氏は「圧倒的に大きなクラウドストレージコンテナを使用することに内在するリスクを明らかにするため、この事件は開示することが重要である」と語る。「言い換えればバケットは非常に大きくファイル数も多いため、何か機密性の高いものが誤って追加されたときに気づくことがほとんど不可能になってしまうのです」とのこと。

「これだけ多くのディレクトリやさまざまな形式のファイルが一緒に保管されていると、それらの中に誤って何かを入れてしまい、気づかれないままになってしまうことは、よくあるミスでしょう」とビッカリー氏は締めくくった。

画像クレジット: Michael Nagle /Bloomberg / Getty Images

原文へ

(翻訳:TechCrunch Japan)

インメモリデータベースのRedis Labsが$44Mを調達、データベースもスタートアップによる革新の波が

インメモリーデータベースを専業とするRedis Labsが今日(米国時間8/21)、Goldman Sachsが率いるラウンドにより4400万ドルを調達したことを発表した。

Redis Labsはそのほかのオープンソースのデータベース企業と同じく、技術そのものは無料、企業のお世話は有料、というビジネスモデルだ。つまり誰でもその技術を利用して何かを作れるが、企業のデータベースの管理は十分な能力を持つわれわれにお任せください、というタイプだ。

同社が提供するデータベースは、サーバーのメモリ上で操作されるので速い。しかし企業ユーザーがその速さを享受できるためには、NoSQLデータベースをはじめとして、それなりの知識技能が必要だ。Redis Labsの今回の資金調達や、この前のMongoDBの非公開IPOなどを見ると、データベースのスタートアップはこのところ追い風と言えそうだ。

Redis Labsのオープンソースバージョンは誰もがローカルにホストできるが、有料の企業ユーザーにはそれをクラウドに置くオプションがある。つまり企業は、自分のリソース(計算機資源)を使わずにその技術を利用できるのだ。

このモデルで成功している例としてDockerやClouderaが挙げられる。後者は好調なIPOを達成ししたが、最近は平凡だ。前者は、Bloombergによると、13億ドルの評価額で資金調達中と言われる。

Redis Labsのこれまでの調達総額は8600万ドルになる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

Clouderaは株式市場へのデビュー初日を20%アップで終える、前途は明るいというが損失は続く

ビッグデータ分析のトップ企業Clouderaは、IPOで15ドルをつけ、その日の終値はそれから20%強増の18ドル9セントになった。これもClouderaの予測12〜14ドルを上回っている。

株価の上昇は新たな投資家にとって良くても、その結果は一部の社員にとっては大きな幻滅だ。彼らが同社の最後のプライベートラウンドの後でチームに参加した場合は、報酬株式の価額が下がったことになるからだ。Clouderaの時価総額は今約23億ドルだが、Intelが2014年に与えた41億ドルの評価額より相当少ない。この、最近ますます一般的になってきた現象は、“ダウンラウンドIPO”とあだ名されている〔IPOで評価額が下がること〕。

しかしCEOのTom Rileyは本誌TechCrunchのインタビューで、“今後の確実な成長が見込めるからそれは問題ではない”、と力説した。株式市場におけるパフォーマンスは良いから、いずれ40億ドル+には達するだろう。2015年に上場したSquareは、上場前の市場評価額の半分でスタートし、その後株価は倍増した。

同社は2008年以来10億ドルあまりを調達している。Intelが最大の株主で、IPOの前には同社の22%を所有していた。Accelが16.3%、そしてGreylock Partnersが12.5%を握っていた。

Clouderaは、銀行や通信企業など、幅広い業種部門に顧客を抱えている。同社は、テロ対策のためのインテリジェンスサービスも提供している。

“弊社の顧客は、それまでアクセスできなかった新しいデータを活用して、彼らの顧客に関するより良いインサイトを得ている”、とRileyは語る。

Clouderaの売上は伸びていて、1月に終わった会計年度の売上2億6100万ドルは、前年度の1億6600万ドルを大きく上回った。

損失は1億8632万ドルで、前年度の2億300万ドルから減少した。しかしIPO申請書のリスク要素の節には、“今後もしばらくは継続的に純損失を負うことが予測される”、とある。

今後は競合がClouderaにとって大きな障害物になると思われるが、Releyは“うちは大企業専門だから大丈夫”、と言う。しかし同社のS-1申請書には、競合他社の長いリストがあり、そこにはHP, IBM, Oracle, Amazon Web Services, Hortonworksなどの名が挙げられている。

IntelとClouderaは協働して、データ処理のスピードとセキュリティの改善に努めている。両社が共同で“パフォーマンス向上のためのソフトウェアとハードウェアを設計している”、とRileyは語る。IntelはClouderaの上場に際してその株式を買い増しした。

Morgan StanleyとJP Morgan、そしてAllen & CompanyがIPOの引受銀行だった。同社は“CLDR”の チッカーでニューヨーク証券取引所に上場した。

先月はSnapが2017年のテクノロジー企業のIPOの口火を切り、市場を覚醒させた。そしてその後は、MuleSoft, Alteryx, Yext, Okta, Netshoes, Carvanaと公開市場へのデビューが続いた。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

筆頭株主Intelとの共同開発も進めるClouderaが上場申請

大方の予想通り、過去にIntelからの巨額出資を獲得したビックデータ企業のClouderaがIPOの申請を行ったことが明らかとなった。

S-1フォームで同社の財政状態を確認することができる。収益は伸びていて、2017年1月に終了した会計年度では2億6100万ドルを記録している。昨年同期における収益は1億6600万ドルだった。

最終損益は1億8632万ドルの損失。昨年の2億300万ドルと比べると損失額は減っている。フォームの「リスクファクター」の項には「近い将来に関して言えば、今後も損失が発生することが予測されます」と記載してある。

Clouderaの事業領域には多くの競合が存在することを同社は認識している。彼らは、HP、IBM、Oracle、Amazon Web Services、Hortonworksなどの企業を競合として挙げている。

2014年、IntelはClouderaに7億4000万ドルを出資した。当時のバリュエーションは41億ドルだ。しかし、IntelとClouderaのパートナーシップは財務的なものだけではない。S-1フォームによれば、この2社は大量のデータセットを処理するスピードとセキュリティ性を向上させるためのプロダクトの共同開発に取り組んでいるようだ。フォームには、「私たちが想定している共同開発の例として、Intelのアーキテクチャーに演算加速機構を組み入れることでデータを暗号化するスピードを向上させるという試みがあります。また、IntelとClouderaはSpot(インキュベーティング・プロジェクト)の開発にも取り組んでいます。これはオープンソースのサイバーセキュリティ分析プラットフォームで、ビックデータ分析と機械学習の技術によって想定される脅威を事前に警告するオープン・データモデル上に構築されたものです」と書かれている。

2008年まで遡った同社の累計調達金額は10億ドルだ。S-1フォームによればClouderaの筆頭株主はIntelで、発行済株式の22%を同社が保有している。以下、Accelが16.3%、Greylock Partnersが12.5%を保有している。

Clouderaが最後に資金調達を行ったのは3年前だ。IPOを目指し、かつベンチャー資金が投下された企業としてはその空白の期間は長かったと言える。ただ、この数年間Clouderaによる買収やIPOの噂は絶えなかった。

今回のIPOで主幹事を務めるのはMorgan Stanley、JP Morgan、Allen & Coの3社だ。Clouderaが上場するのはニューヨーク証券取引所(NYSE)で、ティッカーコードは「CLDR」。昨年は大半のテック系企業がNasdaqを目指していた一方、今年上場したSnap、Mulesoft、AlteryxなどはClouderaと同じくNYSEに上場した。

JOBS Actにより、企業は通常、ロードショーの約15日前に申請書類を公開する。つまり、企業と株式市場が安定していれば、実際の上場が行なわれるのは4月下旬から5月上旬になる可能性が高い。

株式の発行価格の合計は2億ドルだ。しかし、これはあくまで推定でしかない。実際の発行価格が最終的に決定するのは上場日の前日夜となる。

今回の上場により、Clouderaも最近のテック系企業によるIPOラッシュに加わることになる。閑散とした昨年の後に起こったIPOラッシュの先駆けとなったのは、今月はじめに上場したSnapだ。その後、Mulesoft、Alteryxがその流れに加わることとなる。YextとOktaもすでに申請を済ませており、彼らのデビュー戦は今後数週間のうちに行なわれると見られている。

直近に上場を果たした企業の成功、そしてポジティブな株式市場の動向によりIPOの「窓」は開いている。投資銀行と企業も株式公開に乗り気だ。

[原文]

(翻訳:木村拓哉 /Website /Facebook /Twitter

ソフトウェアエンジニアにもっとも高い給与を払っているユニコーン企業上位20社を一覧

software-engineer-unicorns

【抄訳】
先週は全社員の年俸のメジアンがもっとも高いユニコーン20社をご紹介したが、今回はプログラマの報酬がもっとも多いユニコーン20社を調べよう。

CrunchBaseのUnicorn Leaderboardには153社*が載っていて、それらを求職サイトGlassdoorのデータで調べると、ソフトウェアエンジニアにもっとも高い給与を払っている20社が分かる。〔*: 最新(11/24現在)データでは156社。〕

この前の記事では、クラウドベースのビッグデータ企業Clouderaが、(全社員の年俸のメジアンが)もっとも高かった。今回、対象をソフトウェアエンジニア社員に限定すると、年俸のメジアンの最高額はDropboxの14万4573ドル、次位がJawboneの14万1224ドル、三位がClouderaの13万9217ドルだった。

*この記事はCrunchBaseのリストに載っているユニコーン企業のうち、Glassdoorの11月13日現在のデータで15名以上のソフトウェアエンジニアの給与情報のあるものを取り上げた。基本給年額は、正社員の年俸をUSドルで表した額である。

【以下抄訳(社名と金額のみ)】

  1. Dropbox基本給年額のメジアン$144,573
  2. Jawbone基本給年額のメジアン$141,224
  3. Cloudera給与のメジアン$139,217
  4. Medallia 基本給年額のメジアン$138,680
  5. ZScaler基本給年額のメジアン$133,071
  6. Airbnb基本給年額のメジアン$131,612
  7. Uber基本給年額のメジアン$130,000
  8. DocuSign基本給年額のメジアン$129,453
  9. AppDynamics基本給年額のメジアン$128,905
  10. Okta基本給年額のメジアン$127,931
  11. Spotify基本給年額のメジアン$127,695
  12. Tango基本給年額のメジアン$126,348
  13. Gilt Groupe基本給年額のメジアン$124,500
  14. Twilio基本給年額のメジアン$123,749
  15. Pinterest基本給年額のメジアン$121,920
  16. AppNexus基本給年額のメジアン$119,762
  17. Kabam基本給年額のメジアン$115,829
  18. Glassdoor基本給年額のメジアン$115,000 –
  19. Credit Karma基本給年額のメジアン$115,00
  20. ZocDoc基本給年額のメジアン$114,134

SquareとAtlassianもCrunchBaseのユニコーンリストに載っていたが、Squareはその後上場し、Atlassianも上場の計画を発表しているので除外した。どちらも、この記事のリスト(上表)で20位以内に入りうる高給企業だ。

[原文へ]。
(翻訳:iwatani(a.k.a. hiwa)。

IntelがClouderaに$740Mを投じて18%の大株主に

今月(3月)の初めにClouderaは、Google Venturesなどを含む中核的投資家グループから1億6000万ドルを調達した。そのとき本誌は、同社の調達資金総額が3億ドルになった、と報じた。今日はそのすべてを忘れよう。Clouderaは今日(米国時間3/31)、Intelからさらに7億4000万ドルを投資された、と発表した。Intelも、これを確認している。

Clouderaのプレスリリースによると、これでIntelは同社の18%を持つことになる。ということは、同社の評価額はおよそ41億ドルだ。Clouderaさん、10桁クラブ入り、おめでとう。

ClouderaはHadoopを使って大きなデータ集合の分析や合成をやっている。本誌TechCrunchのオーナーAOLも、Clouderaの顧客だ。

CrunchBaseはこれを、二つの部分から成るシリーズF、と呼んでいる。前回のラウンドから間がないことと、Clouderaがこれを一つのトランシュ(区分)と呼んでいるから、それは妥当だ。しかし同社の評価額はこの短い期間に大きく変わったようだ。ForbesのDan Primackはこう言っている:

Clouderaが驚異的なのは、Intelのときの評価額がT RoweやVCたちのときより相当大きかったことだ。

これでClouderaのこれまでの調達総額は計10億ドルを超えることになる。

画像: FLICKR/huangjiahui; CC BY 2.0のライセンスによる(画像はトリミングした)。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


AWSがHadoopビッグデータのクェリツールImpalaをサポート

Amazon Web ServicesにImpalaのサポートが加わった。これはClouderaがGoogleに倣って開発したクェリツールで、大量のデータを並列処理によりリアルタイムで処理する。Impalaでは、デベロッパがAWSのElastic MapReduceの上で、SQLふうの言語を使ってクェリを行える。それは高速でアクセス性も良く、オープンソースの分散コンピューティングシステムHadoopでSQLの利用が増えていることを示す一つの例でもある。またImpalaは、より広い視野で見ると、この市場ではGoogleの影響がとても大きいことを示す例の一つでもあり、新しいデータプラットホームや従来よりもリッチなアプリケーションエコシステムを作ろうとする人たちの多くが、Googleの先行製品を参考にしている。

昨年世に出たImpalaの場合は、GoogleのDremelがベースだ。これはビッグデータ分析におけるGoogleの先駆的製品、広大なクラウド宇宙の全域にわたって保存されているデータをクェリするMapReduceの後継製品で、GoogleのPM William Vambenepeによれば、DremelはGoogleのデータ分析プラットホームBig Queryのベースでもある。Hortonworksが発表したTezは、同社のStingerプロジェクトの一環で、HadoopをクェリするデータベースHiveを使用する。Hortonworksによると、Stingerは通常のSQL文によるクェリをペタバイトクラスの大規模データに対し、従来の100倍のスピードで実行する。

Citus Dataの分析データベースも、やはりGoogle Dremelがベースだ。これはPostgreSQLデータベースに対する並列処理で高速なクェリを行う。またMapRはApache Drillを使って大量データに対する高速クェリを提供する。そしてHadoopをベースとする分析データベースJethroDataも、Google Dremelのやり方に倣っている。

“Adaptive Analytical Platform”でこれらすべての企業/製品に先行するHadaptは、オープンソースのApache HadoopにSQLのネイティブ実装を持ち込んでいる。

Dremelの大きな影響力の理由

Hadoopは、ペタバイトのオーダーでデータを処理するTwitterのようなインターネット企業にとって重要な技術だ。また既存の企業にとっても、昨今はデータの量がこれまでになく増加しているので、Hadoopのありがたみが増している。Impalaは、こういった新世代のデータユーザに、利便を提供する。Impalaを使えば、高度な専門技術がなくても、データをクェリできるのだ。

これまでのHadoopは、高度な知識能力を持つ専門技術者でないと扱えないしろものだった。そういう人たちは初期のデータサイエンティストと呼ばれ、プログラミングの能力とクラスタの管理能力、そしてデータ分析の技術を持っていた。そういうビッグデータ技術者たちは、大量のデータをそれぞれ独自のやり方で処理し分析していたインターネット企業から巣立ってきた。たとえばJeff Hammerbacherは、Facebookを辞めてClouderaの協同ファウンダになった。Yahoo!でApache Luceneを使ってオープンソースの検索エンジンを作っていたDoug Cuttingは、そのプロジェクトのためにHadoopを作って利用した。Luceneも、その初期の作者がCuttingだ。そのCuttingも、今ではClouderaで仕事をしている。

Googleは、MapReduceで先陣を切った。それは、ノードの集合を、データを並列処理するためのクラスタとして扱った。複数のクラスタに亙ってデータをマップし、それを縮小(reduce)して答えを得た。

そしてそのMapReduceを超える技術であるGoogle Dremelは、次世代のHadoop技術の柱となる製品だ。それは、そのほかの、HivePigといったオープンソースのプロジェクトとともに、成長し続けるエコシステムを形成し、それらが一体となって、より高級な言語でMapReduceの複雑さ~難解さを抽象化する。

Dremelの強みは、データ分析がバッチでなくリアルタイムの瞬時であることだ。しかしそれは最初、Googleの…主にオンライン広告のための…大規模な関係データベースGoogle F1をクェリすることを、目的として開発された。

ImpalaもDremel同様、その分析能力が売りだ。したがってそれは、ビジネスインテリジェンス(BI)のための視覚化技術Tableauなどの、補完製品とみなされることが多い。Impalaでデータを迅速にクェリし、その結果をBIツールが利用するのだ。

Hadoopそのものは、アプリケーション開発のためのプラットホームではない。しかしImpalaのようなアプリケーションに奉仕するツールの普及および多様化に伴って、Hadoopがアプリケーションのベースとなる機会が今後ますます増えるだろう。たとえば今年の初めに発表されたHadoopの最新バージョンでは、MapReduceを抽象化してスケジューラやリソースマネージャとして使うYarnの新バージョンが同梱された。これによって、それまでのHadoopでは難しかったスケーリングが可能になる。

Hadoopから生まれるアプリケーションのエコシステムは、すでにImpalaやYarnにその兆しがある。どちらのツールもHadoopの外見を単純化し、エンドユーザ(アプリケーションデベロッパ~BIユーザ)の能力を深化する。またConcurrentが商用化したHadoopのためのアプリケーションフレームワークCascadingがある。TwitterEtsyAirbnbなどが、その顧客として名を連ねている。

この市場(ビッグデータアプリケーション市場)は、長年Googleが先頭を走ってきた。しかしHadoopとプラットホームレイヤのイノベーションにより、Googleと後発グループとの差は縮まりつつある。

画像提供: Electric Sheep, Creative Commonsによる)

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


GoogleのBigQueryが分析関数を強化, UIを一新, 料金を値下げ

Google BigQueryは、いくつかの新たなアップデートにより、大量データの低料金かつ迅速な分析サービスを、より使いやすくしようとしている。BigQueryはテラバイトのオーダーのデータを処理するが、今日(米国時間6/11)発表されたアップデートで、大きなデータベースのアドホックな分析における柔軟性が増し、またより高度な分析ができるようになった。

新たな機能は6つある: 1)クェリの出力量の制限を撤廃、2)高度なウィンドウ関数、3)再計算における時間とコスト節減のためのキャッシングの改良、4)クェリのコスト情報を瞬時に提供、5)ストレージ費用の低減、6)大型ワークロードのサポート(全ユーザに対し対話的クェリのクォータを倍増)。

BigQueryの新しいウィンドウ関数によってユーザは、“結果のランキング、分布や百分位を知る、JOINをせずに結果全体を横断する”、などができる。

データ量が大きいと費用も無視できない。その点、新しいユーザインタフェイスによって、データの管理がやや容易になり、時間節約が可能になった。正しいシンタクスのクェリに対してUIは、そのクェリの実行コストを事前に教えてくれる。

ストレージの費用は1ギガバイトあたり月額12セントが8セントに値下げされた。大型ユーザのためにはクェリ単位の料金設定もできるようになる。

BigQueryは、数十億行ものデータを処理する。そのベースとして使用しているGoogle Dremelは、リアルタイムのアドホッククェリシステムとして、Hadoopの分析能力を上回る、と言われている。

Dremelをオープンソース化しよう、という動きもある。ApacheのDrillは、Dremelの技術をオープンソースで実装している。ClouderaのImpalaも、オープンソースのリアルタイムクェリエンジンだ。2月にローンチしたCitus DataCitusDB for Hadoopは、数ペタバイトのデータを数秒で処理するサービスだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


ビッグデータ市場は分析データベースへと進化中: JethroDataがHadoopの弱点克服で$4.5Mを調達

jethrodata

Hadoopをベースとする分析データベースJethroDataが今日(米国時間2/27)、Pitango Venture Capitalが率いる投資ラウンドにより450万ドルを調達した、と発表した。

JethroDataはイスラエルの企業で、Hadoopの、ストレージに対するスケーラビリティと、完全にインデクシングされた列指向型分析データベースのクェリ機能を組み合わせた、サービスを提供している。列指向データベースは、大量のデータに対して複雑なクェリを行うデータウェアハウスシステムで重宝された歴史を持つ。

ファウンダのEli Singerはメールによるインタビューで、同社の差別化要因は、Hadoopにデータを保存して、それらを分析のために取り出す、ややもすれば複雑な工程を、単純化して能力を高めた点にある、と述べた。分析データベースとHadoopが別立てである企業が多いが、それだと、データをスキャンして分析するのに時間がかかりすぎる弱点がある。そのような分析は、結果をリアルタイムで見る方式ではなく、バッチで行われることが多い。Jethroは、クェリをHadoopネイティブで行うことにより、パフォーマンスが高いと主張する。

JethroDataには競合他社も多い、とSingerは言う。いちばん直接的な競合他社はHadaptで、ここもやはり、Hadoopに保存したデータをデータベース的に組織化する手法をとっている。

またClouderaImpalaは、Google Dremelによる高速なフルスキャンシステムでMapReduceをリプレースしている。Dremelはビッグデータ分析におけるGoogleの、MapReduceに次ぐ後継技術だ。Apache Drillをサポートすると発表したMapRも、やはりGoogle Dremelがベースだ。先週はHortonworksが、同社の独自技術であるTezを発表した。Citus Dataにも、Google Dremelによる自社独自の分析データベースがある。それは、PostgreSQLのコアの並行処理でクェリを行う点に、独自のイノベーションがある。

Singerによると、HBaseを使っている企業もある。それは、今のところHadoop上で可利用な唯一のデータベースだ。Drawn to ScaleSplice MachineがHBase派だ。Salesforce.comにはオープンソースのPhoenixプロジェクトがあり、HBase上のSQLを提供している。

さらに、JethroDataと競合する分析データベースとデータウェアハウス企業としては、HP Vertica、EMC Greenplum、IBM Netezza、Teradata Aster、InfoBrightなどがある。

JethroDataではこれまで、ある顧客企業がアルファテストをやっていたが、次の四半期からベータに入り、より多くの企業が利用できるようになる。今社員数は8名だが、年内には25名になるという。

分析データベースの市場は、ビッグデータ分析の次の最先端領域だ。JethroDataらは、Hadoopのアキレス腱対策に取り組んでいる。それは、ビッグデータの集積から、必要なデータを取り出し、分析し、結果をリアルタイムで見せることだ。成功の鍵は、今たくさん雨後の筍している競合他社に対する強力な差別化を、今の、市場が若いうちに確立することだ。そして、大差で先頭を走り続けること。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))