アマゾンのエンジニアが創業した機械学習運用の透明性を高めるWhyLabs

Allen Institute(アレン・インスティテュート)からスピンアウトした、新しい機械学習(ML)スタートアップのWhyLabs(ホワイラブス)が、米国時間9月23日ステルス状態から抜け出した。元Amazon(アマゾン)機械学習エンジニアのグループであるAlessya Visnjic(アレッシャ・ヴィスニッチ)氏、Sam Gracie(サム・グレイシー)氏、Andy Dang(アンディ・ダン)氏、およびMadrona Venture GroupのプリンシパルMaria Karaivanova(マリア・カライバノワ)氏によって設立されたWhyLabsは、機械学習モデルの作成ではなく、そうしたモデルがトレーニングを受けた後の、ML運用に焦点を当てている。

またチームは同時に、Madrona Venture GroupBezos Expeditions、Defy Partners、Ascend VCからシードラウンドとして、400万ドル(約4億2000万円)を調達したことも発表した。

同社のCEOであるヴィスニッチ氏は、かつてアマゾンの需要予測モデルに取り組んでいた。

「チームメンバーは皆リサーチサイエンティストで、私は第一線の運用経験を持つ唯一のエンジニアでした」と彼女は語った。「そのとき私は『どれくらいまずいことが起きるのだろう?』と考えたのです。私は以前、小売ウェブサイト用のポケットベルを持ち歩いていました。それはアマゾンで大規模に行われた、初のAI展開事例の1つでした。それまで実用的なツールがなかったので、ポケットベルの仕事は非常に楽しいものでした。しかし、変なことが起きたとき、例えば青色に比べてものすごく大量の黒色ソックスを注文したとか、なぜそんな問題が発生したのかを解明するために、多くの手作業が必要になりました」。

アマゾンのような大企業は、データサイエンティストやAIアナリストが、AIシステムを運用するのに役立つ独自の内部ツールを構築しているものの、ほとんどの企業はそれに苦労し続けている。そして多くのAIプロジェクトはただ失敗し、実運用されることはない。「そうした問題が発生する大きな理由の1つは、運用プロセスが、極めて手作業に頼ったものだからだと思っています」とヴィスニッチ氏は語る。「そこでWhyLabsでは、その問題に対処するためのツールを開発しています。具体的には、データ品質を監視および追跡してアラートを発します。AIアプリケーション用のDatadog(データドッグ)と考えることができますね」と続けた。

チームはさまざまな目標を持っているが、まず手始めに可観測性に焦点を合わせている。チームは、オーバーヘッドの少ないエージェントを使用して、AIシステムの中で何が起こっているのかを継続的に記録する新しいツールを開発し、同時にオープンソース化を行っている。そのプラットフォーム独立のシステムは、WhyLogs(ホワイログス)と呼ばれ、AI/MLパイプラインを移動するデータを実務家が理解することを助ける。

ヴィスニッチ氏は、多くの企業にとってシステムを流れるデータの量は非常に多いため、「将来必要となる調査のために、針が入っているかもしれない大量の干し草の山」を維持することには意味がないと指摘した。そのため、一般的に行われていることは、すべてのデータを単に破棄してしまうことなのだ。WhyLabsは、提供するデータロギングソリューションを使用して、そうした企業に対して、パイプラインの入口でデータを調査し、問題を見つけるためのツールを提供することを目指している。

カライバノワ氏によれば、同社にはまだ有料顧客がいないものの、多くの概念実証に取り組んでいる最中ということだ。そうしたユーザーの中には、同社のデザインパートナーでもあるZulily(ズリリー)がある。同社は当面、中規模企業を対象に考えているものの、カライバノワ氏が指摘するように、同社の強みを生かすためには、顧客は10〜15人のML実務家を擁する独立したデータサイエンスチームを持っている必要がある。チームはまだ価格モデルを検討中だが、それはおそらくボリュームベースのアプローチになるだろうとカライバノワ氏はいう。

MadronaのマネージングディレクターであるTim Porter(ティム・ポーター)氏は「私たちは最先端の企業内で大規模なソリューションを構築し、適切なタイミングでより広い市場に製品を提供できる、優れた創業チームに投資するのが大好きです。WhyLabsチームは、実務家のために開発を行う実務家たちです。彼らはAI開発者が直面している困難を、アマゾンでの経験から肌感覚で理解していて、その経験と知見を顧客のために役立てようとしているのです。WhyLabsに投資し、彼らと提携して、クロスプラットフォームモデルの信頼性と可観測性を、爆発的に拡大中のML運用カテゴリに持ち込めること以上に、興奮できることはありません」と語る。

画像クレジット:WhyLabs

原文へ

(翻訳:sako)

サーバーレスワークロードの保護とトラブルシューティングを支援するThundra

サーバーレスツールスタートアップのThundra(サンドラ)は、米国時間1月22日に、Battery Venturesが主導する400万ドル(約4億4000万円)のシリーズAを発表した。同社は、2018年に2億9500万ドルでAtlassian(アトラシアン)に売却されたOpsGenie(オプスジニー)から、スピンアウトした企業だ。

画像クレジット: Adrienne Bresnahan / Getty Images

ラウンドにはさらに、York IE、Scale X Ventures、そしてOpsGenieの創業者であるベルケイ・モラムスタファオール(Berkay Mollamustafaoglu)氏も参加した。Batteryのバッテリーのニーラジ・アガルワル(Neeraj Agarwal)氏は、契約条項に基づき、同社の取締役会に参加する。

このスタートアップはまた、最近Ken Cheney(ケン・チェイニー)氏をCEOとして雇い、技術創業者のSerkan Ozal(セルカン・オザール)氏がCTOになったことも発表した。

もともとThundraは、OpsGenieの中でサーバーレスプラットフォームの実行を支援していたツールだ。商用ツールとしてThundraは、AWS Lambdaでのサーバーレスワークロードの監視、デバッグ、セキュリティ保護を支援する。チェイニー氏は、これらの3つのタスクを別のツールとして提供するのは簡単だが、それぞれが互いに何らかの形で関連し合っているために、すべてを一体として提供することには意味があると語る。

「すべてを統合して、アプリケーション内で何が起こっているかをエンドツーエンドで表示します。これがThundraの本当にユニークな点なのです。実際に、絶えず変化するアプリケーションの高レベルの分散ビューを提供し、そうしたアプリケーションのすべてのコンポーネント、それらの相互関係、およびそれらのパフォーマンスを示します。また、ローカルサービスのトラブルシューティングを行うだけでなく、ランタイムコードを調べて問題の発生箇所を確認し、迅速に通知することもできます」とチェイニー氏は説明した。

同氏によれば、これにより、開発者は通常は難しいサーバーレスアプリケーションの非常に詳細なビューの取得が可能になり、インフラストラクチャ自身の基本部分に対する心配を減らすことができるという。そもそも開発者がサーバーレスを選ぶ理由が、アプリケーションにより多く集中するためなのだ。

Thundraの提供するサーバーレストレースマップ。スクリーンショット提供:Thundra

Thundraはこれらすべてを、(サーバーが固定されておらずリソースが一時的なために)問題の特定と修正が難しいサーバーレスの世界で行うことができる。これはAWSのLambda(AWSのサーバーレス機構)レベルに、またはライブラリレベルのコンテナに、実行時にエージェントをインストールすることによって行われるとチェイニー氏は語る。

Batteryのニーラジ・アガルワル氏は、OpsGenieに投資したことで、エンジニアリングチームを知ることができ、彼らがその内部ツールをより広く適用可能な製品に移行させることができることに自信を持つことができたと語る。

「これまでOpsGenieを育ててきた、エンジニアリングチームの品質に関係していると考えています。彼らは非常にマイクロサービス指向であり、かつ製品指向なので、製品の反復開発をきわめて迅速に行います。これは社内のツールでしたが、製品化の価値が高いもので、それをより広範な市場に販売できることに対してとても興奮しています」と彼は語っている。

同社は無料版を提供し、その後、使用量、ストレージ、データ保持に基づいて段階的な価格設定を提供する。現在の製品はクラウドサービスだが、近い将来にはオンプレミスバージョンを追加する予定だ。