AWSが機械学習のためのエンド・ツー_エンド機能を備えたSageMakerの機能を拡張

立ち上げからすでに3年近くになるAmazon Web Services(AWS)の機械学習開発プラットフォームSageMakerが、自動化や機械学習能力の構築工程の、各ステップをより容易に自動化しスケールできるようになった新たな機能を追加した大規模なアップグレードを行った。

機械学習がメインストリームになるにつれて、企業のさまざまな事業部門が自動化のためのアプリケーションを求めるようになり、AWSはそれらの要求に対応してそのようなアプリケーションの開発がより容易にできるよう努力してきた。

「SageMakerのようなユーザーの多いサービスには、顧客からの提案をたくさん得られるという利点があり、それが次へ向けての改善の原動力になっている。本日(米国時間12月8日)、Amazon SageMakerのための一連のツールを発表しているが、それらは機械学習のエンド・ツー・エンドのパイプラインの構築を大幅に容易にするものであり、可視性と説明性に富むカスタムの機械学習モデルと大規模なオートメーションの準備と構築と訓練、説明、検査、モニタリング、デバッグおよび実行を可能にする」とAWSの機械学習担当副社長であるSwami Sivasubramanian(スワミ・シバスブラマニアン)氏は述べている。

AWSによると、すでに3MやADP、AstraZeneca、Avis、Bayer、Capital One、Cerner、Domino’s Pizza、Fidelity Investments、Lenovo、Lyft、T-MobileそしてThomson Reutersなどの企業がSageMakerのツールを利用して、それぞれの事業を運用しているという。

同社の新しいプロダクトには、統一されてないばらばらなソースからのデータを正規化して、一貫性のあるデータの利用ができるようにするAmazon SageMaker Data Wranglerが含まれる。また、Data Wranglerはバラバラなデータソースを特徴(feature)の集まりへとグループ化し、特定のタイプのデータを目立つようにするプロセスを容易にする。Data Wranglerツールには300種類あまりのデータトランスフォーマーが内蔵され、顧客は特徴量の正規化と変形と結合をコードを一切書かずにできるようになる。

アマゾンはまた、トレーニングや推論のための機械学習機能の保存、更新、取得、共有を容易にするリポジトリを顧客が作成できるFeature Storeを発表した。

Amazon Web Servicesが自慢するもう1つの新しいツールがPipelinesだ。これは、ワークフローの管理と自動化のためのツールキットだ。Pipelinesが提供するオーケストレーションとオートメーションの機能は従来のプログラミングと異なるものではないが、デベロッパーはパイプラインを使って、エンド・ツー・エンドの機械学習ワークフローの各ステップを定義できる。このツールを使うとデベロッパーは、SageMaker Studioのエンド・ツー・エンドのワークフローを同じ設定で再実行でき、毎回同じモデルを得ることができる。あるいは再実行を別の新しいデータで行って、モデルをアップデートすることもできる。

人工知能と機械学習における長年の課題であるデータの偏りを解決するために、アマゾンはSageMaker Clarifyをローンチした。それは米国時間12月8日、まさに発表されたツールで、同社によると機械学習のワークフロー全体にわたって偏りを検出し、デベロッパーはモデルのセットアップのされ方をよく理解した状態で仕事ができるようになる。このようなオープンソースのツールがすでにあることをアマゾンは認めるが、それらのツールは手作業が多く、デベロッパーの負担が大きいと同社は主張している。

機械学習のアプリケーション開発工程をを単純化してくれるその他のプロダクトの1つとしてSageMaker Debuggerがある。これはデベロッパーがシステムリソースの使用状況をモニタリングし、その間に異常が見つかれば警報するツールで、これによりモデルの訓練を高速化できる。

そしてDistributed Trainingと名付けられたプロダクトは、データを複数のGPUに分有させて並行処理し、ディープラーニングの大型で複雑なモデルをより速く訓練できる。

またSageMaker Edge Managerは、エッジデバイスのための機械学習モデルの管理ツールだ。これによりデベロッパーは、集団として存在するエッジデバイスにデプロイされるモデルの、最適化とセキュリティとモニタリングと管理を行う。

最後に、Amazonが発表したSageMaker JumpStartは、アルゴリズムやサンプルノートを見つけるための検索可能なインターフェースを開発者に提供し、彼らが機械学習の旅を始めることができるようにする。同社によると、機械学習を初めて使う開発者には、あらかじめ構築された複数の機械学習ソリューションを選択してSageMaker環境に導入するオプションを提供するという。

関連記事
AWSのSageMakerを使えばふつうのデベロッパーが機械学習のモデルを作れる
AWSが機械学習のデータ準備サービスSageMaker Data Wranglerを公開

カテゴリー:人工知能・AI
タグ:AmazonAWSAWS re:invent

画像クレジット:Jason Alden/Bloomberg/Getty Images

原文へ

(翻訳:iwatani、a.k.a. hiwa

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。