GoogleがGoogle Photosの画像検索、スマート返信機能などに用いている機械学習技術をオープンソース化

Googleは本日、Google Photosの検索機能、Googleアプリの音声認識、新しくローンチしたばかりのメールアプリの受信箱の「スマート返信」機能に搭載している機械学習技術をオープンソースにしたことを発表した。TensorFlowという名のこの技術はアプリを賢くし、前世代のシステムより大幅に強力になっているという。TensorFlowでは、ニューラルネットワークの構築と訓練が以前の5倍も早く行うことができるという。

Googleにとっても、プロダクトを素早く改善することにつながると同社は説明している。

Tensor Flowは、Google Brain TeamとGoogleの機械知能研究組織に務める研究者とエンジニアが製作したプロジェクトが元となっている。最初は機械学習とディープニューラルネットワークの研究を行うために開発したものだった。しかし、このテクノロジーは他の分野にも応用することができるとGoogleは説明する。

技術的な側面では、このディープラーニングのフレームワークは、CPU、Nvidia GPU、Android、iOS、OSXで使うことができる実用的なC++バックエンドを持ち、またPythonのフロントエンドのインターフェイスであるNumpy、iPython Notebooksや他のPythonをベースとしたツールにも対応する。Brain Teamのテックリードでマネージャーを務めるVincent Vanhouckeは、Google+のプロフィールにそう記している。

コンピューター処理のフローグラフとして表せる処理ならどんなものでもTensorFlowを使うことができるという。勾配法に基づく機械学習アルゴリズムなら、TensorFlowの自動微分と一連の最適化の仕組みを応用できるとGoogleは伝える。

「TensorFlowは、Google Brain Teamが毎日使用しているものです。まだTensorFlowは初期の段階で、これから磨いていくべき部分は多々あります。今回の取り組みで、TensorFlowの周りに研究者、開発者、インフラのプロバイダーのコミュニティーを構築できることを嬉しく思います」とVanhouckeは言う。

目標は人間の脳のように動く機械学習のテクノロジーを構築することだが、様々な面でそれが実現するのはまだ遠い未来の話だ。

Googleのこのニュースを伝えるブログ記事はCEOのSundar Pichaiが記した。技術をオープンソースにすることで、コミュニティー全体にとって有益になるよう機械学習研究を加速させること、そしてテクノロジーがより洗練されることを期待していると彼は伝えている。Pichaiが指摘するように、現代の最高のシステムさえ、4歳の子供ができることでも苦戦する。例えば子供は、ある恐竜の絵を何枚か見るだけで、その恐竜の種類を判別できたり、あるいは「I saw the Grand Canyon flying to Chicago」という文章の本来の意味「シカゴへの飛行機の中からグランドキャニオンが見えた」を「グランドキャニオンがシカゴに向かって飛んでいるのを見た」と勘違いしたりはしない。

また、GoogleはTensorFlowを複雑なデータを理解するために活用できるという。例えば、タンパク質の構成や天体のデータを計算するといったことだ。

TensorFlowは機械学習テクノロジーで研究者が開発者と強力して取り組める興味深い方法だ。各グループが別々のツールを使うのではなく、TensorFlowは研究者が新しいアイディアを試し、それが機能するようなら、コードを書き直さずともプロダクトに導入することができる。プロダクトの改善を加速させることができるだろう。そしてもちろん、多くの機械学習コミュニティーが活用できるようになることで、Googleもイノベーションが加速したオープンソースのテクノロジーの恩恵を受けることだろう。最新テクノロジーをより多くのGoogleのプロダクトに導入したり、プロダクトの改善に用いたりすることで、Googleのサービスの底上げにもつながる。

TendorFlowは写真や動画に映っているものの判別、音声認識、文章を読んで（ある程度）理解などができる。

最後の技術はGoogleの「スマート返信」を可能にしている技術だ。スマート返信とはGoogleのメールアプリの受信箱にあるユーザーの代わりに自動でメールの返信内容を製作する機能だ。この例から、毎日使用するプロダクトに機械学習を付加することでさらに便利になることが分かるだろう。スマート返信は、メールの内容を読み、画面の下に短い返信フレーズを提案する。スマート返信を利用するほど学習し、ユーザーが何に対して「はい」や「いいえ」と答えるかを理解していく。

GoogleのプロダクトのいくつかですでにTensorFlowを使用しているという。例えば、Google Photosや音声認識システム、Gmail、Google検索などだ。

GoogleはこれまでDistBeliefという2011年に開発したシステムを利用していた。DistBeliefは、ラベルのないYouTubeの画像から「猫」の概念を学んだり、Googleアプリの音声認識機能を25%改善したり、Google Photosの画像検索の構築に用いたりした。DistBeliefはImagenetが2014年に開催したLarge Scale Visual Recognition Challenge（コンピューターによる視覚情報を認識を競う大会）で優勝したインセプションモデルを訓練し、Deep Dreamの自動画像キャプションの実験にも使用された。

しかしDistBeliefには限界があるとGoogleはいう。「DistBeliefはニューラルネットワークという狭い分野をターゲットとしたもので、設定するのが難しかったのです。また、Google内部のインフラと密接に関連していたことから、コードを外部と共有することがほとんど不可能でした。」とResearchのブログ記事に掲載した別の声明でGoogleは伝えている。この記事はGoogleのシニアフェローのJeff DeanとテクニカルリードのRajat Mongaが記したものだ。

TensorFlowはそれらの課題を解決するものだ。

「TensorFlowは一般的で、柔軟で、順応し、簡単に使えて、完全にオープンソースです。DistBeliefのスピード、スケーラビリティ、プロダクションへの応用力からさらに磨き上げています。事実、いくつかのベンチマークでは、TensorFlowはDistBeliefの2倍早いのです」と記事は伝えている。

機械学習システムに取り組んでいる大手テクノロジー企業はGoogleだけではない。IBM Watson、 Amazon Machine Learning、Azure Machine Learningは、この市場における競合だ。

[原文へ]

（翻訳：Nozomi Okuma /Website/ twitter）