AWS S3の膨大な公開データを検索できるQuilt Dataが脱ステルス,無料利用も可

Quilt Dataを創ったKevin Moore(ケヴィン・ムーア)氏とAneesh Karve(アニッシュ・カーヴ)氏はこれまでの4年間、AWS S3のストレージ上にある大量のデータを素早く検索するプラットホームの構築に努めてきた。それはデータサイエンティストたちにS3のバケット内にデータを見つける方法を提供し、さらにそのデータを企業が利用できる形にパッケージすることが目的だ。米国時間9月19日、同社は無料のデータ検索ポータルとしてステルスを脱し、その企業向けサービスを提供するだけでなく、S3の23のリポジトリに存在する3.7PB(ペタバイト)の公開データへの貴重なアクセスを提供する。

それらの公開データに含まれるのは、一般的に利用できるAmazonのレビューのデータや衛星画像、およびそのほかの価値ある一般公開情報だ。使い方はそのほかの検索エンジンと同じくクエリを入力するだけだが、それはウェブや企業のデータリポジトリを検索するのではなく、AWSのS3ストレージに結果を見つける。

検索結果には、探していたデータだけでなく、データサイエンティストたちが機械学習のモデルの構築のために使う標準的なワークスペースであるJupyterノートブックなど、そのデータに関する情報も含まれる。データサイエンティストたちはこれを、自分の機械学習モデルを作るためのベースとして利用できる。

公開データには100億あまりのオブジェクトも含まれ、データサイエンティストにとってはありがたいリソースだが、Quilt Dataがこのデータのアクセスを提供するのは純粋な愛他主義からではない。それはQuilt Dataのプラットホームにできることを広くいろんな人に見せたいからであり、それによって企業に同社プロダクトの商用バージョンを使ってもらいたいからだ。

Screen Shot 2019 09 16 at 2.31.53 PM

Quilt Dataの検索結果と見つかったデータに関するデータ(画像提供:Quilt Data)

Quilt Dataは無料で利用できるが、Amazon Marketplaceで継続購入してもいい。その場合の料金はS3の1つのバケットにつき月額550ドルだ。優先的なサポートやカスタマイズ、教育・研修などのサービスが付随するエンタープライズバージョンもある。こちらは、S3の1つのバケットにつき月額999ドルだ。

同社は2015年に創業され、Y Combinatorの2017年夏季を受講した。これまでY CombinatorやVertex Ventures、Fuel Capital、Streamlined Ventures、そしてそのほかの匿名の投資家から420万ドルのシード資金を調達している。

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。