機械学習のモデルは、与えるデータの量や質で良し悪しが決まる。特に訓練のときにそういえるが、モデルはプロダクションの質も左右する。現実の世界では、新たな事象が起きるたびにデータそのものが変わり、データベースやAPIの報告やデータ保存の小さな変化でも、モデルの反応に影響することがある。そんなときMLのモデルは平然と間違った予測を与え、エラーを投げないため、そういうシステムではデータのパイプラインを監視することが絶対に欠かせない。
そしてそこに、Aporiaのようなツールが登場する。テルアビブに本社のある同社は米国時間4月6日、同社のMLモデル監視プラットフォームに500万ドル(約5億5000万円)のシード資金を調達したことを発表した。投資家はVertex VenturesとTLV Partnersだ。
Aporiaの共同創業者でCEOのLiran Hason(リラン・ヘイソン)氏は、イスラエル国防軍に5年間在籍し、その後はずっとAdallomのデータサイエンスチームにいた。セキュリティ企業の同社を、2015年にMicrosoftが買収した。買収の後、彼はベンチャー企業Vertex Venturesに入り、2019年にAporiaを始めるまでそこにいた。しかし今、Aporiaが解決しようとしている問題に彼が初めて出会ったのは、Adallomにいたときだ。
Adallomでの経験に関して「私は機械学習のモデルのプロダクションアーキテクチャを担当していました。だから、モデルをプロダクションに持ち込んだときに起きるありとあらゆるサプライズを初めて体験したのは、そこででした」とヘイソン氏は語る。
ヘイソン氏の説明によると、Aporiaの目標はエンタープライズによる機械学習モデルの実装を容易にし、AIの力を責任あるやり方で利用することだという。
「AIはとても強力な技術だが、従来のソフトウェアと違いデータへの依存が極めて大きい。AIのもう1つのユニークなところは、とてもおもしろいことだが、失敗するときに黙って失敗することだ。例外もエラーも何も出ない。だからAIは実に厄介であり、特に一旦プロダクションに入れば、モデルの訓練時のようなデータサイエンティストによる完全なコントロールがないため、なおさら厄介です」とヘイソン氏は語る。
しかもヘイソン氏によると、プロダクションシステムはサードパーティーのベンダーからのデータに依存しているかもしれないし、そのベンダーがある日、誰にもいわずにデータのスキーマを変えるかもしれない。そうなると、モデルの信頼性は完全に壊れる。銀行の顧客のローンが債務不履行になるという予測もできなくなり、数週間か数カ月後に実際に不履行になってから気づくことになる。
Aporiaは絶えず、入ってくるデータの統計的特性を調べ、それが訓練セットからあまりにも乖離してきたらユーザーに警報する。
そしてAporiaがユニークなのは、ユーザーにほとんどIFTTTやZapier的なグラフィカルなツールを提供して、モニター(監視系)のロジックをセットアップさせることだ。納品時にはモニターの50ほどの組み合わせであらかじめ構成されており、それらの楽屋裏での仕事ぶりを完全に可視化する。また企業はこれらのモニターの振る舞いを、特定のビジネスケースやモデルに合わせて微調整できる。
最初チームは、ジェネリックなモニタリングソリューションを構築できると考えていた。しかしチームが悟ったのは、そんなものを目指したら非常に複雑な仕事になるだけでなく、これからモデルを構築するデータサイエンティストが、モデルの仕事の仕方と必要事項をモニタリングのソリューションから正確に知らなければならない。
TLV Partnersの創立パートナーであるRona Segev(ロナ・セゲフ)氏は、「プロダクション(本番時)のワークロードのモニタリングは、ソフトウェア工学の実践としてすでに確立しており、機械学習を同じレベルでモニタリングすることもかなり前に確立しています。Aporiaのチームには強力なプロダクションエンジニアリングの経験があり、そのために彼らのソリューションはシンプルで安全で堅牢なものとして傑出しています」と語る。
カテゴリー:人工知能・AI
タグ:Aporia、機械学習、イスラエル、資金調達
画像クレジット:Aporia
[原文へ]
(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)