Apache Arrowを商用化するデータ多用化企業Voltron Dataが約127億円調達

Voltron Dataは2021年、NVIDIAとUrsa ComputingおよびBlazingSQLの元社員たちと、Apache Arrowの共同創業者がローンチした。このグループが集まったのは、Arrowをサービスとする企業を作って、オープンソースのプロジェクトを自分で管理するのが難しい企業を助けるためだ。

Voltron Dataの共同創業者でCEOのJosh Patterson(ジョシュ・パターソン)氏によると、同社はスタンダードを広めるための企業であり、Apache Arrowで、データとアナリティクスを標準化することの威力とその認識を広めていきたい、という。

「私たちの目標は、データアナリティクスのこれまでのエコシステムに取り付いて、それをスタンダードに基づいて改善することです。これまで私たちが他の業界で何度も見てきたのは、彼ら自身がアクセラレータになってより効率的な方法を普及し、共通のビルディングブロックで業界全体を改善していく動きです。私たちが特に普及したいのも、データアナリティクスのエコシステムにおけるモジュール化と組み立て構成方式の技術です」とパターソン氏はいう。

このスタンダードの部分が、Apache Arrowの重要な役割だ。このプロジェクトのウェブサイトのFAQには、「Apache Arrowは、大きなデータセットを処理したり転送するハイパフォーマンスアプリケーションを作るためのソフトウェア開発プラットフォームで、分析アルゴリズムの性能と、異なるシステム間やプログラミング言語間でデータを移送するときの効率の両方の改善を目指している」とある。

パターソン氏によると、データとアナリティクスが進化すると開発者は、日に日に増えていく、さまざまな言語を用いた多数のシステムを互いに接続しなければならない。その巨大な難題をArrowは解決する。「このシステムとあのシステムを接続したいとき、一体何をするのか。そのためのグルーコードのリライトなんて、誰もやりたくない。そしてそんなときが、Arrowの出番だ。Arrowは今、複数のシステムを接続するためのデファクトスタンダードになっている」とパターソン氏はいう。

このオープンソースツールの人気はとても大きくて、同社によるとこれまで、毎月4200万回ダウンロードされている。SnowflakeやDatabricks、Google、Microsoftなども採用している。オープンソースのプロジェクトにしてはすごい人気であるため、Voltronのようにこれの商用化を目指す企業が現れても不思議ではない。

それに、VCたちがこのプロジェクトにお金を投じているのも当然だ。同社はシードとAラウンドで1億1000万ドル(約126億7000万円)を獲得したが、いくら投資インフレと言われる時代であっても、それはすごい額だ。

パターソン氏によると、それは明確な実用目的のあるお金だ。同社が解決を目指す問題は相当な難題であり、どれも複数の顔を持っている。そこで同社としては、それをできるだけ速くやるために投資が必要だ。

「このオープンソースプロジェクトは、パワーユーザーやエキスパートしか使わない沈滞状態になってほしくない。次の世代のユーザーやシステムビルダーやライブラリビルダーにも、その魅力が伝わって欲しい。私たちは問題点を解明して、もっと多くのツールとライブラリを作り、誰でもすぐ使えるという状態をもっと完成させたい」とパターソン氏は語る。

同社は現在、最初の商用製品を作っている。現時点で詳細はあまり語られないが、それはApache Arrowのマネージドバージョンで、オープンソース本体には触りたくないユーザーが対象だ。

同社のワークフォースは世界中に分散していて、現在100名近くの被雇用者がおり、求人も積極的に行っている。パターソン氏自身も黒人で、ダイバーシティとインクルージョンの完備した企業にしたいという。「インクルーシブは我が社にとってとても重要で、これまでのように、人種やジェンダーや性的指向がさまざまな人が入ってきて欲しい。私たちでは、誰もが認めてもらえるし誰もが力を発揮できるんだ」と。

現状は、同社従業員の20%がアフリカ系米国人、15%がヒスパニック、15%がアジア系、そしておよそ20%が女性だ。今後の成長とともに、さらにダイバーシティを充実していきたいという。

調達した資金は、2200万ドル(約25億3000万円)がシードラウンド、8800万ドル(約101億3000万円)がシリーズAだ。AラウンドをリードしたのはWalden Catalyst、これにBlackRockやAnthos Capital、Battery Ventures、Coatue、GV、Lightspeed Venture Partners、Nepenthe Capital、Redline、The Factoryが参加した。シードはBlack RockとWaldenがリードし、LightspeedとGVとThe Factoryが参加している。

画像クレジット:myshkovsky/Getty Images

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)

データ分析企業Databricksが同社初の業界特化型レイクハウスを発表

クラウドインフラストラクチャのプロジェクトがどんどん複雑になっている中で、特定の業界に向けてあらかじめパッケージ化したソリューションを提供することが業界のトレンドとなっている。米国時間1月13日、潤沢な資金を持つデータ分析企業のDatabricksが、同社初の業界特化ソリューション「Lakehouse for Retail」を発表してこのトレンドに参戦した。同社は小売業者に対し、これまでの分析ツールやDatabricksのAIツールによって生成される膨大な量のデータから価値を抽出するのに役立つ、完全に統合されたプラットフォームを提供するとしている。

Databricksの共同創業者でCEOのAli Ghodsi(アリ・ゴディシ)氏は「これは我々のジャーニーにおける重要なマイルストーンで、企業がリアルタイムで事業を運営し、より正確に分析し、顧客のすべてのデータを活用して有意義なインサイトを明らかにするものです。Lakehouse for Retailは小売業における企業やパートナー間でのデータドリブンのコラボレーションと共有を推進します」と述べている。

このプラットフォームを早期に利用している企業には、Walgreens、Columbia、H&Mグループなどがある。これらのユーザー企業はDatabricksのプラットフォーム全般を利用できるが、特に重要なものとしてLakehouse for RetailのSolution Acceleratorsがある。Solution Acceleratorsは、Databricksが「データ分析と機械学習のユースケースとベストプラクティスに関するブループリント」と呼んでいるもので、うまくいけば新規ユーザーが開発にかかる時間を何カ月も節約できる。これには、リアルタイムストリーミングのデータインジェストのテンプレート、需要予測、レコメンデーションのエンジン、顧客のライフタイムバリューを測定するツールが含まれる。なおDatabricksには以前にも同様のブループリントがあったが、Databricksが統合ソリューションとして提供していたわけではなく、利用者が自分たちで構成しなくてはならなかった。

Walgreensの医薬・ヘルスケアプラットフォームテクノロジー担当バイスプレジデントであるLuigi Guadagno(ルイージ・グアダーニョ)氏は次のように述べている。「Walgreensでは毎年、膨大な数の処方箋を処理しています。DatabricksのLakehouse for Retailを利用することで、このすべてのデータを一元化し、1カ所で保管して分析や機械学習のワークロードをフル活用できます。複雑さやコストのかかる旧式のデータサイロを廃することにより、インテリジェントで一元化されたデータプラットフォームでクロスドメインのコラボレーションが可能となり、柔軟に適応し、スケールし、お客様や患者様により良いサービスを提供できるようになりました」。

ここ数年、Databricksは「レイクハウス」の概念を普及させようとしてきた。その概念とは、分析のためのデータウェアハウスと、まだ活用されていない膨大な生データを保管するデータレイクの利点を組み合わせるということだ。

画像クレジット:Boy_Anupong / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Kaori Koyama)

データ+AI企業Databricksがローコード・ノーコード機能拡張のため8080 Labsを買収

Databricks(データブリックス)は米国時間10月6日、ドイツのスタートアップである8080 Labsを買収したと発表した。8080 Labsは、Pythonベースのデータ分析・操作ツールPandasの人気GUIである「bamboolib」を開発している。bamboolibは、データサイエンティストがコードを書くことなく、迅速かつ容易にデータを探索し、変換することを可能にする。8080 Labsは、bamboolibの無料コミュニティ版と、企業向けの機能を追加した有料プロ版を提供していた。Databricksは、これらのUIにフォーカスした機能を自社のLakehouse Platformに統合し、ローコード・ノーコード機能を拡張していく予定だ。

今回の買収は、8月に16億ドル(約1783億円)のシリーズH資金調達ラウンドを終了して以来、Databricksにとって初めての買収となる。当時、DatabricksのAli Ghodsi(アリ・ゴディシ)CEOは、この分野で資本力のある競合他社に対抗するために資金調達を行ったと話していた。競争の激しい分野で急成長している企業にありがちなことだが、そのためには、エンジニアリング人材とソフトウェア機能の両方を手に入れるための買収が必要になる。

ゴディシ氏は本日の発表でこう述べている。「2020年のRedashの買収と合わせて、ローコード・ノーコードのソリューションを好むより多くのユーザーに当社のユーザーベースを拡大していきます。Databricksにシンプルな機能を導入することは、専門知識の有無にかかわらず、より多くの人が大規模なデータセットを簡単に分析・探索できるようにするための重要なステップです」。

Databricksにとって今回の買収は、専門知識を持たないシチズンデータサイエンティストに同社のプラットフォームを提供することに新たな重点を置くことを意味する。「データとAIがあらゆる規模の企業にとって戦略的な優先事項になるにつれ、組織内の誰もがデータに基づいて質問したり行動を起こしたりする権限を持つことが重要になっています」と同社は声明の中で述べている。Databricksは、同社の自動機械学習ツールと組み合わせることで、より幅広いユーザーがデータから価値を引き出すことができるようになると主張している。また、プロの開発者にとっても、同社のUIツールでデータ変換を構築し、よりカスタムな実装が必要になったときにPythonコードをエクスポートすることで、負担が軽減されるとしている。

8080 Labsの共同設立者であるTobias Krabel(トビアス・クラベル)氏はこう述べた。「我々は、複雑なデータタスクをシンプルにし、データサイエンスと機械学習のパワーをあらゆるスキルセットのデータチームが利用できるようにするために8080 Labsを設立しました。オープンソースをルーツとし、レイクハウスというカテゴリーでデータ環境を再構築するという素晴らしいビジョンを持つDatabricksには無限の可能性があると考えており、チームの一員としてその旅に加われることをこの上なく嬉しく思っています」。

8080 Labsは4人のビジネスエンジェルからエンジェル資金を調達していたが、詳細は公表していない。

画像クレジット:Artur Debat / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Aya Nakazato)