アマゾンのエンジニアが創業した機械学習運用の透明性を高めるWhyLabs

Allen Institute(アレン・インスティテュート)からスピンアウトした、新しい機械学習(ML)スタートアップのWhyLabs(ホワイラブス)が、米国時間9月23日ステルス状態から抜け出した。元Amazon(アマゾン)機械学習エンジニアのグループであるAlessya Visnjic(アレッシャ・ヴィスニッチ)氏、Sam Gracie(サム・グレイシー)氏、Andy Dang(アンディ・ダン)氏、およびMadrona Venture GroupのプリンシパルMaria Karaivanova(マリア・カライバノワ)氏によって設立されたWhyLabsは、機械学習モデルの作成ではなく、そうしたモデルがトレーニングを受けた後の、ML運用に焦点を当てている。

またチームは同時に、Madrona Venture GroupBezos Expeditions、Defy Partners、Ascend VCからシードラウンドとして、400万ドル(約4億2000万円)を調達したことも発表した。

同社のCEOであるヴィスニッチ氏は、かつてアマゾンの需要予測モデルに取り組んでいた。

「チームメンバーは皆リサーチサイエンティストで、私は第一線の運用経験を持つ唯一のエンジニアでした」と彼女は語った。「そのとき私は『どれくらいまずいことが起きるのだろう?』と考えたのです。私は以前、小売ウェブサイト用のポケットベルを持ち歩いていました。それはアマゾンで大規模に行われた、初のAI展開事例の1つでした。それまで実用的なツールがなかったので、ポケットベルの仕事は非常に楽しいものでした。しかし、変なことが起きたとき、例えば青色に比べてものすごく大量の黒色ソックスを注文したとか、なぜそんな問題が発生したのかを解明するために、多くの手作業が必要になりました」。

アマゾンのような大企業は、データサイエンティストやAIアナリストが、AIシステムを運用するのに役立つ独自の内部ツールを構築しているものの、ほとんどの企業はそれに苦労し続けている。そして多くのAIプロジェクトはただ失敗し、実運用されることはない。「そうした問題が発生する大きな理由の1つは、運用プロセスが、極めて手作業に頼ったものだからだと思っています」とヴィスニッチ氏は語る。「そこでWhyLabsでは、その問題に対処するためのツールを開発しています。具体的には、データ品質を監視および追跡してアラートを発します。AIアプリケーション用のDatadog(データドッグ)と考えることができますね」と続けた。

チームはさまざまな目標を持っているが、まず手始めに可観測性に焦点を合わせている。チームは、オーバーヘッドの少ないエージェントを使用して、AIシステムの中で何が起こっているのかを継続的に記録する新しいツールを開発し、同時にオープンソース化を行っている。そのプラットフォーム独立のシステムは、WhyLogs(ホワイログス)と呼ばれ、AI/MLパイプラインを移動するデータを実務家が理解することを助ける。

ヴィスニッチ氏は、多くの企業にとってシステムを流れるデータの量は非常に多いため、「将来必要となる調査のために、針が入っているかもしれない大量の干し草の山」を維持することには意味がないと指摘した。そのため、一般的に行われていることは、すべてのデータを単に破棄してしまうことなのだ。WhyLabsは、提供するデータロギングソリューションを使用して、そうした企業に対して、パイプラインの入口でデータを調査し、問題を見つけるためのツールを提供することを目指している。

カライバノワ氏によれば、同社にはまだ有料顧客がいないものの、多くの概念実証に取り組んでいる最中ということだ。そうしたユーザーの中には、同社のデザインパートナーでもあるZulily(ズリリー)がある。同社は当面、中規模企業を対象に考えているものの、カライバノワ氏が指摘するように、同社の強みを生かすためには、顧客は10〜15人のML実務家を擁する独立したデータサイエンスチームを持っている必要がある。チームはまだ価格モデルを検討中だが、それはおそらくボリュームベースのアプローチになるだろうとカライバノワ氏はいう。

MadronaのマネージングディレクターであるTim Porter(ティム・ポーター)氏は「私たちは最先端の企業内で大規模なソリューションを構築し、適切なタイミングでより広い市場に製品を提供できる、優れた創業チームに投資するのが大好きです。WhyLabsチームは、実務家のために開発を行う実務家たちです。彼らはAI開発者が直面している困難を、アマゾンでの経験から肌感覚で理解していて、その経験と知見を顧客のために役立てようとしているのです。WhyLabsに投資し、彼らと提携して、クロスプラットフォームモデルの信頼性と可観測性を、爆発的に拡大中のML運用カテゴリに持ち込めること以上に、興奮できることはありません」と語る。

画像クレジット:WhyLabs

原文へ

(翻訳:sako)