今日サンフランシスコで開催されたAWS SummitでAmazon Web ServiceのシニアヴァイスプレジデントであるAndy Jassyは、新しい機械学習のプラットフォームを発表した。
Amazon Machine Learning サービスでは、機械学習のバックグラウンドのない開発者でも、スマートなデータ駆動型アプリを制作できるツールを提供する。このツールを使えば、リアルタイムで起きていることや過去に起きたことの分析だけでなく、このサービスの一番の特徴である、将来何が起きるかの予測までできる。
今までもNetflixのような企業は、AWSのツールを使用して機械学習を取り入れてきた。だが、Jassyが言うように機械学習は一筋縄ではいかない仕事だった。そこでAWSは機械学習の専門的な知識がない人でも機械学習を取り入れることができるツールの開発を考えた。
AWSには既に多くのツールがあるが、今回の機械学習ツールはAmazon.comが何年にも渡って、様々な機械学習に取り組んできた経験に根ざしている。レコメンデーションエンジンなどは、この技術の初期の形と言える。レコメンデーションエンジンを購入して気に入ったのなら、この機械学習ツールも気に入るだろう。
データが世界を回す
AWSのMatt Wood博士は、何の担当の開発者であろうと、データを扱う機会が増えていると指摘した。一般的には既に起きたことを分析したり、リアルタイムで行われていることを分析するのだが、本当の価値は今あるデータに対して必要な答えを引き出す質問ができた時に生まれる。
例えば、データからeコマースで悪意のある行為の特定やユーザーが現在見ているものから、次にそのユーザーが見たいと思うものが何かを割り出すということだ。
ユーザーの行動を予測するには、統計分析、モデル構築、データクレンジングなど、多様な専門性が必要であるとAWSは知っていた。それに留まらず、どのように適切な予測を算出するかを考え、様々なデータの量に応じたデータの取り込みとスケーリングの問題も解決しなければならない。
Amazonの目的はその一連の流れを簡潔にすることだ。開発者が、簡単に妥当なモデルを構築し、時には何万、何億にも及ぶ予測データをリアルタイムで算出できるようにする。それがAmazon Machine Leaningが目指している所だ。
新しいツールを活用するための3つの基本ステップは以下の通りだ。
- Amazon S3 かRedshiftでモデルを構築する
- モデルの妥当性を確かめ、最適化していく
- 磨いたモデルを用いて、バッチで予測していく
プラットフォームの有用性をテスト
新しいプラットフォームを検証するため、Amazonはいくつかの実験を行った。まず二人の開発者に対し、ユーザーの性別の特定の正確性を増す課題を与えた。ユーザーの性別を知ることはAmazon.comのレコメンド機能の改善につながるのだが、現行のシステムでの性別予測の正確性は65%しかなかった。専門知識のない二人の開発者はこの問題に取り組み、予測の正確性を45日で65%から92%まで押し上げた。
今度は別の開発者がAmazon Machine Learningを使用して同じ課題に挑んだ。Jassyは、その開発者は20分で先の開発者と同じ92%の正確性を実現することができたと報告した。
このケースで注意してほしいのは、モデルは既に作られていて、その妥当性も検証されていたかもしれないということだ。ただし重要なのは、このようなツールを使用することで、欲しい解答を導き出す時間を大幅に削減できたということだ。
この分野には他にも競合がいる。Azureは2月に独自の機械学習ツールをローンチしたばかりだ。IBMは先月AlchemyAPIを買収 したことから、Watsonの機械学習の強化を進めているだろう。
[原文へ]