Cortexならデータ科学者でも機械学習モデルをクラウドで簡単にデプロイできる

実用的な機械学習モデルを作ることも大切だが、それを現実に利用できるようにすることも重要だ。Cortex Labs(コーテックス・ラボズ)は、その最後の段階を、データ科学者たちに提供するためのオープンソース・ツールを提供するアーリーステージのスタートアップだ。

同社の創設者は、バークレーの学生だったころ、機械学習モデルを開発する際に問題となるのは、それをデプロイする手段がないことだと気がついた。当時からオープンソースのツールは山ほどあったが、データ科学者はインフラストラクチャーの専門家ではない。

CEOのOmer Spillinger(オマー・スプリンガー)氏によれば、彼自身、CTOのDavid Eliahu(デイビッド・エリアフー)氏、エンジニアリング責任者のVishal Bollu(ビシャル・ボルー)氏、そして事業成長責任者のCaleb Kaiser(ケイレブ・カイザー)氏からなる創設チーム全員が、インフラストラクチャーをよく理解しているという。

この4人の創設者が行ったのは、オープンソースのツール一式を揃え、AWSサービスでそれらを結合させ、簡単にモデルをデプロイできる手段を提供することだった。「私たちはTensorFlow、Kubernetes、Dockerといったオープンソースツールを、CloudWatch、EKS(Amazon仕様のKubernetes)、S3などのAWSサービスで結合して、モデルをデプロイしたい開発者に、基本的にひとつのAPIを提供します」とスプリンガー氏は説明していた。

データ科学者たちが、書き出したモデルのファイルをS3のクラウドストレージにアップロードするようになったと彼は話す。「それを私たちは引き出し、コンテナ化して、裏でKubernetesにデプロイします。ワークロードのスケールは自動的に調整され、大量の演算が必要なときはGPUに切り替えが可能です。私たちはロゴをストリーミングして、(モデルを)ウェブで公開します。それに関連するセキュリティー管理を我々がお手伝いします。そんな感じです」と彼は言う。

 Amazon SageMakerに似ていることを彼も認めているが、同社は、すべての主要なクラウドに対応させることを長期目標にしている。SageMakerは、当然のことながらAmazonのクラウドでしか使えない。それに対してCortexは、事実上すべてのクラウドで使える。実際、この点において、最も多い機能上の要求が、Google Cloudへの対応だとスプリンガー氏は言う。またロードマップには、Microsoft Azureへの対応もあると彼は話していた。

Cortexの創設者たちは、2018年にEngineering Capitalから調達したシードラウンドの88万8888ドル(約9700万円)のおかげで、製品化までの間、なんとか生き延びてきた。この半端な数字が気になる方のために説明しておくと、ひとつには、スプリンガー氏の誕生日が8月8日であるという内輪のジョークから、もうひとつは、評価額が有効になるのがこの数字だったという理由からだ。

現在、同社はオープンソースのツールを提供し、開発者とデータ科学者のコミュニティづくりを進めている。ゆくゆくは、クラスターの管理をしたくない企業のためにクラウドサービスを構築して収益化を計る考えだが、それはずっと先のことだとスプリンガー氏は話していた。

画像クレジット:Usis / Getty Images

[原文へ]
(翻訳:金井哲夫)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。