Streamlitがオープンソースの機械学習アプリ開発フレームワークを公開

画像クレジット:Dong Wenjie/Getty Images

Streamlitは、GoogleXとZooxで働いていた経験を持つ業界のベテランエンジニアが立ち上げた、新しい機械学習のスタートアップ。これまでに、600万ドル(約6億4700万円)のシード投資を受けている。米国時間の10月1日、機械学習エンジニアが、カスタムなアプリケーションを簡単に開発できるようにする、フレキシブルなツールをオープンソースで公開した。機械学習に関するデータを、それぞれのモデルに従って調査するためのもの。

シードラウンドは、Bloomberg Betaも参加して、Gradient Venturesが主導した。また、有力な個人投資家も参加している。たとえば、Color Genomicsの共同創立者、Elad Gil氏、Angelsの創立者、Jana Messerschmidt氏、Y Combinatorのパートナー、Daniel Gross氏、Dockerの共同創立者、Solomon Hykes氏、Insight Data ScienceのCEO、Jake Klamka氏などだ。

Streamlitの共同創立者のエイドリアン・トロイユ(Adrien Treuille)氏によれば、彼ら自身が機械学習エンジニアなので、エンジニアのニーズがよく理解でき、その要求に合致したツールが開発できたのだという。1種類のツールで何にでも対応するというのではなく、さまざまな要求に応えられるフレキシブルなものを開発することが、特に重要だった。データの性格は、エンジニアが取り組んでいるものによって異なるからだ。

「Streamlitは、実際にこの市場でユニークな地位を確保していると考えています。他のほとんどの会社は、基本的に機械学習のワークフローの一部をシステム化しようとしています。私たちは、いわばレゴブロックのようなものをエンジニアに提供して、作りたいものを自由に開発できるようにしているのです」と、トロイユ氏は説明した。

Streamlitを使って開発されたカスタムな自動運転車のデータアプリ。機械学習エンジニアがデータを研究できるようにする

トロイユ氏によると、熟達した独自のスキルを持つ機械学習エンジニアでも、膨大な量のデータを理解するためのツールを開発するのに、結局のところ膨大な時間を費やすことになってしまっているという。Streamlitは、エンジニアが使い慣れているプログラミングツールを使って、そうしたニーズに合わせたツールを素早く開発できるよう、支援することを目指している。

機械学習エンジニアは、わずか数行のコードで、データを理解するためのツールを手早く開発し始めることが可能となる。それにより、データの種類に応じて、適切な方法でデータを扱えるようになる。たとえば、一連のスライダーを用意して、それぞれ異なる変数を調整することで、データの表示を操作したり、シンプルにデータのサブセットを表示する表を作成して、エンジニアに分かりやすく表示したりする、といったもの。

トロイユ氏によれば、このツールセットは、機械学習エンジニアが、自分のモデルのデータを扱う方法を劇的に変える可能性を秘めている。「機械学習エンジニアとして、これまでにこうした問題に遭遇し、その課題を解決するためにどうすればよいかを知っている人間として、もっといい方法があること、それもちょっとやそっとではないことを発表できることにワクワクしています。これまでは、4週間もの期間と、1万5000行のコードを必要としていたプロジェクトが、たった半日で片付いてしまうこともあるでしょう」。

このツールキットは、すでにGitHubからダウンロード可能となっている。

原文へ

(翻訳:Fumihiko Shibata)