Airbyteは、資金状態の良いオープンソースのデータ統合化プラットフォームで、企業のデータチームが自分のELT(Extract, Load and Transform)パイプラインのセットアップを容易にできるようにしてきた。しかし、それまではあくまでもセルフホスティングの自己管理型サービスで、付随する面倒くさい作業もすべてユーザーが行わなければならない。
米国時間10月12日、同社は、Airbyte Cloudの公式ローンチを発表し、Airbyteのホステッドサービスがオープンソースバージョンのすべての機能を持ち、さらにホスティングと管理があり、そしてサポートの各種オプションと、チームに代わってアクセス管理もするようなエンタープライズ機能もあるというサービス体系の提供を開始した。現状で未実装なのはシングルサインオンだが、提供は「もうじき」という。
現状では、6000社ほどの企業が何らかのかたちでAirbyteを使っている。2021年1月にはわずか250社だった。2021年の1年で同社はシードとシリーズAの両方をこなし、合わせて3100万ドル(約35億円)超の資金を獲得した。シードとシリーズAがわずか2カ月間であることから、この分野は投資家にとっても熱いことがわかる。
お金の話といえば、Airbyteは料金体系を今度のクラウドバージョンとそれまでのオンプレミスバージョンで同一にしようとしている。一般的にこの種のサービスは、処理量が課金のベースとなるが、同社は一連のジョブにかかる計算時間に応じて課金する。
これなら、ワークロードをめぐってよく起きるトラブルが少なくなるだろう。Airbyteのチームによると、従来、エンタープライズはFivetranのような複数のシステムを使って、共通のAPIソースと、データエンジニアリングのチームが彼らの1回限りのユースケースのために作ったスクリプトに接続していた。そしてその上にデータベースのレプリケーションのためのシステムがある、という構成だ。
料金体系について、AirbyteのCOOで共同創業者のJohn Lafleur(ジョン・ラフルール)氏によると「データの統合という問題はありふれた日常的な処理、つまりコモディティにしてしまって解決したい。そうするための唯一の方法は、インフラストラクチャのベンダーがやてるような料金体系にすることです。たとえばSnowflakeのように、クレジットを買い、計算時間に基づいてそのクレジットを消費する。すると、データベースのレプリケーションのスループットはとても高いからそれが可能になりますい。だから、計算時間をベースにしてきたんだ」。
さらにAirbyteのCEOで共同創業者のMichel Tricot(ミシェル・トリコット)氏は、それにより企業は、実質的に彼らのデータサービス料金のすべてを同じ1つの計算時間として捉えるようになるという。
現在、Airbyteは、Instagramのような消費者向け製品から、GoogleのLookerのようなBIシステム、そしてほぼすべての主要なデータベースシステムに至るまで、約130のサービスとのコネクターを備えている。また、チームが指摘するように、多くの顧客がAirbyteのオープンソースコードを利用して独自のカスタムコネクタを構築している。さらに、自社の顧客のためにコネクタを構築するベンダーも登場しており、チームは、何らかのかたちでレベニューシェアを行うことで、コミュニティが長期間にわたってコネクタを維持するインセンティブを与える方法を検討している。
関連記事:必要な場所にデータを移動させるオープンソースのデータコネクタープラットフォームAirbyteが28.3億円調達
画像クレジット:koto_feja/Getty Image
[原文へ]
(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)