UCバークレー発祥のDetermined AIが機械学習インフラをオープンソースに

機械学習は、ニッチな分野から無数にあるソフトウェアスタックの重要なコンポーネントへと急速に移行したが、だからといって簡単に手がつけられるわけではない。機械学習の開発と管理管理に必要なツールは企業グレードで、多くの場合企業だけを相手にしている。だがDetermined AIは、同社のAIインフラストラクチャ製品全体をオープンソース化することで、これまで以上に使いやすくすることを狙っている。

同社は、組織化された信頼性の高い方法でAIを開発するための「Determined Training Platform」を開発した。これは大企業が自分たちのために作って(秘匿している)ものと似たようなものだと、同社は昨年1100万ドル(約12億円)のシリーズA調達を行った際に説明した。

「機械学習は、今後のソフトウェア開発方法の中の大きな部分を占めることになります。しかし、GoogleやAmazonのような企業が生産性を確保するためには、こうしたソフトウェアインフラをすべて自前で構築しなければなりませんでした」とCEOのEvan Sparks(エバン・スパークス)氏は述べている。「私たちが働いていたある会社では、70人がAIのための内部ツールを構築していました。このような取り組みを続けられる企業は、地球上にそれほど多くありません」。

小規模な企業では、学術的な仕事や個人研究を目的としたツールを使って、小規模なチームによる機械学習(ML)の実験が行われている。実際の製品を開発している何十人ものエンジニアに向けてそれを拡大するには…多くのオプションは残されていない。

「そうした人たちはTensorFlowやPyTorchのようなものを利用しています」と語るのは、チーフサイエンティストのAmeet Talwalkar(アミート・タルウォーカー)氏だ。「仕事のやり方の多くは決まったやり方です。例えば、モデルはどのように訓練されるのか?どこにデータを書き留めればベストなのか?データを適切な形式に変換するにはどうすれば良いのか?これらはすべて、極めて基本的な作業なのです。それを行う技術はありますが、まだまだ開拓途上なのです。そして、それを準備するためにしなければならない仕事の量たるや。大規模なハイテク企業がこれらの内部インフラを構築するのには相応の理由があるのです」。

カリフォルニア大学バークレー校のAmpLab(Apache Sparkの本拠地)からスタートしたDetermined AIは、数年前からそのプラットフォームを開発し、有料の顧客からのフィードバックと検証を受けてきた。そして今彼らは、オープンソースデビューの準備が整ったと言う。もちろん、Apache 2.0ライセンスを使ってだ。

「私たちは、それを選んだ人たちが、あまり多くの助けがなくても、自分自身でそれを使うことができると確信しています」とスパークス氏は言う。

ローカルまたはクラウドのハードウェアを使用して、プラットフォームを自分でホストして、インストールすることもできるが、最も簡単な方法は、AWSやお好みの場所から自動的にリソースを供給して、不要になったら破棄できる、クラウドマネージドバージョンを使うことだろう。

Determined AIプラットフォームが、多くの小規模企業が同意できる基礎レイヤーのようなものになり、結果や標準への移植性が提供されることで、すべての企業やプロジェクトをゼロから始める必要がなくなることが期待される。

今後数年間で機械学習による開発が桁違いに拡大すると予想される中、パイのほんの一部に対してでも取り分を主張する価値はあるが、もし運が良ければ、Determined AIは中小企業にとってAI開発の新たなデファクトスタンダードになるかもしれない。

このプラットフォームは、GitHubまたはDetermined AIの開発者サイトで確認できる。

画像クレジット:Getty Images

原文へ

(翻訳:sako)

Apache Sparkの技術を応用するDetermined AIがAI開発を民主化

深層学習では、データサイエンティストは、かなり反復的なプロセスによってモデルを設計し、GPUを利用したシステム上でテストすることになる。そうすることで、はじめて機能するものを手にすることができる。それには、多大な費用と時間がかかる。適切なモデルを仕上げるのに数週間かかることもざらだ。新しいスタートアップDetermined AIは、そこにメスを入れ、そのプロセスをより速く、安く、そして効率的なものにしたいと考えている。そして今日、1100万ドルのシリーズAの資金を得て忽然と表舞台に姿を現した。

今回のラウンドは、GV(かつてのGoogle Ventures)が主導したもので、Amplify Partners、Haystack、さらにSV Angelの協力も取り付けている。同社はすでに2017年、260万ドルのシードラウンドがあったことも発表した。現在までにトータルで1360万ドルを調達したことになる。

Determined AIの共同創立者兼CEOであるEvan Sparks氏によれば、これまでは、Facebook、Google、Apple、Microsoftのような巨大企業だけが、自動運転や音声認識技術など、高度なAIを生み出すためのインフラとシステムを構築することができたのだという。「私たちの考えでは、そうしたことが可能な大きな理由は、それらの大企業はみな社内にソフトウェアのインフラを持っていることにあります。それによって、機械学習のエンジニアとデータサイエンティストのチームは効率的に仕事ができ、素早くアプリケーションを生み出すことができるのです」と、Sparks氏はTechCrunchに語った。

Determined AIのアイデアは、クラスタ計算機のリソース管理からワークフローの自動化まで、すべてを扱えるソフトウェアを作成すること。それにより、大企業と同様の技術を、あらゆる組織の手の届くところに引き寄せることができる。「私たちの使命は、そのソフトウェアを他のみんなのために開発することです」と彼は述べた。ターゲットとする市場は、Fortune 500や、Global 2000に含まれているような企業となる。

同社のソリューションは、カリフォルニア大学バークレー校のAmpLabでの、ここ数年間の研究成果に基づいている。同研究室は、ビッグデータを扱うクラスタ計算機のフレームワーク、Apache Sparkを開発したことでもよく知られている。その研究室で培った知識を使って、顧客のGPUリソースをより有効に活用できるようにするための高度なソリューションを開発したのだ。

「私たちが提供するは、スケジューリングとリソース共有のための一種の基礎レイヤーです。それによって、そうした非常に高価なリソースを扱います。その上に、ワークフローを自動化するための、いろいろなサービスのレイヤーを重ねるのです」と、Sparks氏は説明する。これまでにチームが達成した最先端の成果によれば、現在ほとんどの会社が使っているツールに比べて、5倍から50倍も高速化を実現できるという。

今のところ、このスタートアップは、顧客が現在利用可能な一般的な種類のソリューションから、よりカスタマイズされたアプローチに移行するのを支援しようとしている。そこでは、Determined AIのツールを使って、AIの生産プロセスをスピードアップすることができる。今日のラウンドから得た資金は、成長を促進させ、エンジニアを増強し、ソリューションを開発し続けることを可能にするはずだ。

画像クレジット:Getty Images

原文へ

(翻訳:Fumihiko Shibata)