MITで始まった研究にルーツを持つスタートアップのFeature Labsは、データサイエンティストたちが機械学習アルゴリズムをより迅速に構築することを支援する一連のツールを、本日(米国時間2月22日)正式にリリースした。
共同創業者兼CEOのMax Kanterによれば、同社はデータサイエンティストたちにしばしば手作業を強いて時間のかかる「特徴量設計(feature engineering)」を自動化する方法を開発したのだと言う。「Feature Labsは、企業がインパクトのある機械学習プロダクトを企画し、実装し、そして何よりも大切なことですが、デプロイすることを支援します」とKanterはTechCrunchに語った。
「Feature Labsは、機械学習アルゴリズムの実行に使う生データから、ドメイン知識を使って新しい変数を抽出するプロセスである特徴量設計を自動化した点が独創的なのです」と彼は付け加えた。
同社は、”Deep Feature Synthesis”と呼ばれるプロセスを使用して、これを実現している。これは例えばウェブサイトの訪問回数や放棄されたショッピングカートアイテムといった生の関連するトランザクションデータ・セットから特徴量を生成し、自動的にそれを予測シグナルに変換するのだ、とKanterは説明した。
これは、現在の時間がかかりエラーが発生しやすい、人間主体のプロセスとは大きく異なると彼は述べている。自動化された特徴量設計は、データサイエンティストたちが手作業で作成したものと同様の変数を提供するが、準備作業に沢山の時間を割く必要がなくなるため、遥かに作業が効率化される。「データサイエンティストたちにこの自動化されたプロセスを提供することで、彼らは予測する必要があるものを見つけ出すことに、より多くの時間を費やすことができるようになります」と彼は言う。
同社はこれを、幾つかの方法を通して実現している。まず最初に、同社はFeaturetoolsというオープンソースのフレームワークを開発した。これは、開発者たちがFeature Labsのツールセットを使い始めるための手段を提供するものだ。Kanterによれば、開発者たちはこれらのツールを使用して、小さなプロジェクトを構築して、アルゴリズムを使うことに慣れることができると語る。彼は「この提供の目的は、開発者たちに、新しい機械学習問題に対して自動特徴量設計を適用する実験を行う機会を提供して、私たちのビジョンを共有することです」と会社の発足を発表したブログ記事に書いている。
とはいえ、ある企業が実験段階を超えて、プロジェクトを拡大しようとしたときには、彼らはFeature Labsの商用製品を購入する必要がある。製品は顧客の必要に応じてクラウドもしくはオンプレミスの形態で提供される。初期の顧客には、BBVA Bank、Kohl’s、NASA、そしてDARPAが含まれている。
同社はまた、実際には昨年の3月にクローズした150万ドルのシードラウンドも発表した。このラウンドは、First Star Venturesと122 West Venturesから参加し、Flybridge Capital Partnersが主導したものである。
Feature Labsの製品は、Kanterと彼の共同創業者Kalyan VeeramachaneniとBen Schreck(MITのComputer Science and AI Lab(CASL)所属)による研究に基いているものだ。同社のアイデアは2015年に形を取り始め、ここ数年は初期顧客を相手にどの製品を洗練させていた。このことによって本日の発表にたどり着いたのだ。
[原文へ]
(翻訳:sako)