Google Cloudが機械学習の工程パイプラインを作るツールを提供

Google Cloudは米国時間3月11日、Cloud AI Platform Pipelinesのベータローンチを発表した。このエンタープライズ向けのサービスによりデベロッパーは、単一のツールで機械学習のパイプラインをデプロイできるようになり、そこにはモニタリングや監査のツールも備わっている。

Googleは 「機械学習のモデルをノートブックでプロトタイピングするとき、それはかなり単純明快に思える。しかし機械学習のワークフローを持続可能でスケーラブルにするための、そのほかの部分にも配慮するようになると、急に難解になってくる」と説明する。そうやってワークフローが複雑になると、反復できて監査も可能なプロセスの構築が一層困難になる。

そこで、このPipelinesが登場する。Pipelinesはデベロッパーに反復可能なプロセスを構築する能力を与える。Googleによると、このサービスには、ワークフローをデプロイして動かすためのインフラストラクチャ、パイプラインを構築してデバッグするためのツールの2つの部分がある。

このサービスは、Kubernetes Engineのクラスターとストレージのセットアップや、マニュアルによるKubeflow Pipelineの構成などのプロセスを自動化する。それはまたTensorFlow Extendedを使ってTensorFlowベースのワークフローを構築し、Argoワークフローエンジンを使ってパイプラインを動かす。これはインフラストラクチャサービスであると同時に、パイプラインの構築やバージョニング、アーチファクト(人工物混入)トラッキングなどができるビジュアルツールでもある。

「これだけの機能をわずか数クリックで始動できる」とGoogleは約束しているが、パイプラインの実際の構成はもちろん簡単ではない。Google Cloud自身にも複雑性(見方によっては柔軟性)があるし、しかもKubeflow Pipelines SDKとTensorFlow Extended SDKの両方を使いこなしてパイプラインのオーサリングをしなければならない。

[原文へ]

(翻訳:iwatani、a.k.a. hiwa