企業には日々四方八方から大量のデータが流れこんでくる。顧客、ソーシャルメディア、モバイルアプリ、センサー、Excel表計算ファイル等々、その種類と量は増えるばかりだ。Microsoftは企業のビッグデータ処理を助けるためクラウド上の機械学習のAPIを公開した。
今日(米国時間2/18)、MicrosoftはStrataカンファレンスで、クラウド機械学習サービス、Azure Machine Learningを正式に発表した。このサービスは6月にベータ版が公開されていたが、今回の正式リリースを機に機能のアップデートも行われた。
われわれは6月の記事で、「Azure MLはXboxやBingですでに使われている機械学習機能を利用している。またデベロッパーが未来予測アプリを開発するために使うテンプレートとワークフローも用意される。これによって機械学習アプリを開発するスピードは大幅に加速されるという。サービスのプロバイダはAzure MLプラットフォーム上で各種のウェブサービスを開発できるだけでなく、APIを公開することも可能になる」と解説した。
Azure ML担当のコーポレート・バイスプレジデント、 Joseph Sirosh,はMicrosoftで現在の地位に就く前にAmazonで長く機械学習を担当していた。Siroshによれば、人気のあるデータ処理言語Rに加えて、今回のアップデートで新たにPythonがサポートされたという。
「われわれはPythonを追加したが、これは多くのデータ・サイエンティストに好まれている言語だからだ。Pythonのエコシステムは巨大だ」と SiroshはTechCrunchに語った。
またSiroshによれば「われわれはPythonの追加以外にも多数の改良を行った。Azure Machine Learningはプラットフォームだ。デベロッパーはPythonの短いコードをコピー&ペーストするだけで新たなAPIが作成できる」という。
新しいAzure MLプラットフォームはPythonに加えてHadoopとSparkもサポートした。 これでビッグデータを処理するための標準的ツールはプラットフォームを選ばず、ほぼ全面的にカバーされることになる。
このプラットフォームの真の強みは簡単にAPIを作成し、即座にカスタムデータ処理を開始できるところにある。
「クラウドは『最後の1マイル』問題も解決した。以前このようなサービスではまずデータ・サイエンティストがビッグデータを分析してパターンを見出し、IT部門がそれに応じてアプリケーションを開発するという手順を踏む必要があった。このプログラムのコーディングがきわめて手間のかかる作業であり、何週間、何ヶ月もかかっていた。しかしAzure MLならアプリケーション開発は数時間ですんでしまう」と Shiroshは6月の記事で説明している。
Siroshは今回プラットフォームのサポート範囲が広がったことに満足している。「データサイエンティストはクリック数回で新しいAPIを発行できるようになった。アプリケーションにはRとPythonのコードを組み合わせて利用できる。ユーザーには信じられないほど広い選択肢が提供される」と述べた。IBMやSASも同種のサービスを提供しているが、Azure Machine Learningプラットフォームほど統合的なサービスは他にないという。
「Azure MLは完全に統合され、マネージされたツールセットだ。ユーザーは新たにハードやソフトを用意する必要が一切なく、クラウドで完結した高度な機械学習とビッグデータ分析が実行できる」ということだ。
またAzure MLでは機械学習とデータ処理のツールが提供されるだけでなく、ユーザーは自ら開発したアプリやAPIを他のユーザーと共有できる。Siroshは「これはデータサイエンティストが新しいアイディアを試すのに絶好の環境だ」と強調した。
マーケットプレイスには現在、20件のテスト・プロジェクトが登録されているが、Siroshは「マーケットプレイスの可能性は巨大だ。将来、エンタープライズのあらゆるデータ処理ツールがこのマーケットプレイスで得られるようになるだろう」予測する。
Azure MLは標準的なデータの視覚化ツールを備えているが、さらに高度な視覚化のためにはMicrosoft Power BI、IPython Notebookと連携させることができる。
[原文へ]
(翻訳:滑川海彦@Facebook Google+)