UCバークレー発祥のDetermined AIが機械学習インフラをオープンソースに

機械学習は、ニッチな分野から無数にあるソフトウェアスタックの重要なコンポーネントへと急速に移行したが、だからといって簡単に手がつけられるわけではない。機械学習の開発と管理管理に必要なツールは企業グレードで、多くの場合企業だけを相手にしている。だがDetermined AIは、同社のAIインフラストラクチャ製品全体をオープンソース化することで、これまで以上に使いやすくすることを狙っている。

同社は、組織化された信頼性の高い方法でAIを開発するための「Determined Training Platform」を開発した。これは大企業が自分たちのために作って(秘匿している)ものと似たようなものだと、同社は昨年1100万ドル(約12億円)のシリーズA調達を行った際に説明した。

「機械学習は、今後のソフトウェア開発方法の中の大きな部分を占めることになります。しかし、GoogleやAmazonのような企業が生産性を確保するためには、こうしたソフトウェアインフラをすべて自前で構築しなければなりませんでした」とCEOのEvan Sparks(エバン・スパークス)氏は述べている。「私たちが働いていたある会社では、70人がAIのための内部ツールを構築していました。このような取り組みを続けられる企業は、地球上にそれほど多くありません」。

小規模な企業では、学術的な仕事や個人研究を目的としたツールを使って、小規模なチームによる機械学習(ML)の実験が行われている。実際の製品を開発している何十人ものエンジニアに向けてそれを拡大するには…多くのオプションは残されていない。

「そうした人たちはTensorFlowやPyTorchのようなものを利用しています」と語るのは、チーフサイエンティストのAmeet Talwalkar(アミート・タルウォーカー)氏だ。「仕事のやり方の多くは決まったやり方です。例えば、モデルはどのように訓練されるのか?どこにデータを書き留めればベストなのか?データを適切な形式に変換するにはどうすれば良いのか?これらはすべて、極めて基本的な作業なのです。それを行う技術はありますが、まだまだ開拓途上なのです。そして、それを準備するためにしなければならない仕事の量たるや。大規模なハイテク企業がこれらの内部インフラを構築するのには相応の理由があるのです」。

カリフォルニア大学バークレー校のAmpLab(Apache Sparkの本拠地)からスタートしたDetermined AIは、数年前からそのプラットフォームを開発し、有料の顧客からのフィードバックと検証を受けてきた。そして今彼らは、オープンソースデビューの準備が整ったと言う。もちろん、Apache 2.0ライセンスを使ってだ。

「私たちは、それを選んだ人たちが、あまり多くの助けがなくても、自分自身でそれを使うことができると確信しています」とスパークス氏は言う。

ローカルまたはクラウドのハードウェアを使用して、プラットフォームを自分でホストして、インストールすることもできるが、最も簡単な方法は、AWSやお好みの場所から自動的にリソースを供給して、不要になったら破棄できる、クラウドマネージドバージョンを使うことだろう。

Determined AIプラットフォームが、多くの小規模企業が同意できる基礎レイヤーのようなものになり、結果や標準への移植性が提供されることで、すべての企業やプロジェクトをゼロから始める必要がなくなることが期待される。

今後数年間で機械学習による開発が桁違いに拡大すると予想される中、パイのほんの一部に対してでも取り分を主張する価値はあるが、もし運が良ければ、Determined AIは中小企業にとってAI開発の新たなデファクトスタンダードになるかもしれない。

このプラットフォームは、GitHubまたはDetermined AIの開発者サイトで確認できる。

画像クレジット:Getty Images

原文へ

(翻訳:sako)