いまさら聞けない機械学習入門

wtf-machine-learning

機械学習についての沢山の記事を目にして、何やら深遠なものが発見されつつあると思う人もいるかもしれないが、実際はその技術はコンピューティングと同じくらい古いものだ。

歴史上最も影響力のある計算機科学者のひとりであるアラン・チューリングが1950年に、コンピューティングに関する彼の論文の中で「機械は考えることはできるか?」という問いかけを始めたことは偶然ではない。空想科学小説から研究室に至るまで、私たちは長い間、自分自身を人工的な複製が、私たちに自分自身の意識の原点、より広義には、私たちの地上での役割、を見出すことの役にたつのだろうかと問いかけてきた。残念ながら、AIの学習曲線は本当に急峻だ。歴史を少しばかり辿ってみることによって、機械学習が一体全体何物であるのかに関しての、基本概念位は見出してみたい。

もし「十分に大きな」ビッグデータを持っていれば、知性を生み出すことができるのか?

自分自身を複製しようとする最初の試みには、機械に情報をギチギチに詰め込んで、上手くいくことを期待するようなやり方もあった。真面目な話、ただ膨大な情報を繋ぎ合わせすれば意識が発生するといった、意識の理論が優勢を占めていた時もあった。Googleはある意味このビジョンの集大成のように見做すこともできるが、同社がすでに30兆ページのウェブを収集したにも関わらず、この検索エンジンが私たちに神の実在について問いかけ始めることを期待するものはいない。

むしろ、機械学習の美しさは、コンピューターに人間のふりをさせて、単に知識を流し込むことではなく、コンピューターに推論させ、学んだことを一般化させて、新しい情報へ対応させるところにある。

世の中ではよく理解されていないが、ニューラルネットワーク、ディープラーニング、そして強化学習は、すべて機械学習である。それらはいずれも、新しいデータに対する分析を行うことのできる一般化されたシステムを作り出す方法である。別の言い方をすれば、機械学習は多くの人工知能技術の1つであり、ニューラルネットワークとディープラーニングといったものは、より広範なアプリケーションのための優れたフレームワークを構築するために使用できるツールだというだけのことだ。

1950年代のコンピューティングパワーは限られていて、ビッグデータへのアクセスもなく、アルゴリズムは初歩的だった。これが意味することは、機械学習の研究を進めるための私たちの能力は、極めて限られていたということだ。しかし、それは人びとの研究の意欲を削いだりはしなかった。

1952年のこと、Arthur Samuelはアルファ・ベータ法と呼ばれるAIの非常に基本的な形式を利用して、チェッカープログラムを作った。これは、データを表す探索木上で作業する場合に、計算負荷を減らす方法の1つであるが、全ての問題に対する最善の戦略を常に与えてくれるわけではない。ニューラルネットワークでさえ、Frank Rosenblattの懐かしのパーセプトロンが現れたものである。

いずれにせよ読む必要のある、複雑で大げさなモデルScreen Shot 2016-08-25 at 1.53.58 PM

パーセプトロンは随分と時代に先行したものだった、機械学習を進めるために神経科学を利用したのだ。紙の上で、そのアイデアは右に示したスケッチのようなものだった。

それがやっていることを理解するために、まず大部分の機械学習問題は、分類(classification)もしくは回帰(regression)の問題に分解できることを理解しなければならない。分類はデータをカテゴリ分けするために用いられ、一方回帰モデルは傾向からの外挿を行い、予測を行う。

パーセプトロンは、分類装置の1例である – それはデータの集合を受け取り、複数の集合に分割する。この図の例では、それぞれの重みの付いた2つの特徴量の存在が、このオブジェクトを「緑」カテゴリーだと分類するために十分であることが示されている。こうした分類装置は、現在は受信ボックスからスパムを分離したり、銀行における不正を探知するために使われている。

Rosenblattのモデルは一連の入力を使うものだ。長さ、重さ、色といった特徴にそれぞれ重みのついたものを考えてみるとよい。モデルは、許容誤差以内に出力が収まるまで、連続的に重みを調整していく。

例えば、ある物体(それはたまたまリンゴであるとする)の重量が100グラムであると入力することができる。コンピュータは、それがリンゴであることを知らないが、パーセプトロンはその物体を、既知のトレーニングデータに関する分類装置の重みを調整することによって、「リンゴのような物体」あるいは「リンゴではないような物体」に分類することができる。そして分類装置が調整されると、それは理想的には、これまで分類されたことのない未知のデータセットに対して再利用することができる。

まあ仕方がない、AI研究者たちでさえ、こうしたことには混乱しているのだ

コンピュータと少年パーセプトロンは、機械学習の分野で行われた多くの初期の進歩の、ほんの1例に過ぎない。ニューラルネットワークは、協力して働くパーセプトロンの大きな集まりのようなものである。私たちの脳や神経の働き方により似通っていて、それが名前の由来にもなっている。

数十年が過ぎて、AIの最先端では、単に私たちが理解した内容を複製しようとするのではなく、心の仕組みを複製する努力を続けている。基本的な(または「浅い」)ニューラルネットワークは、今日まだ利用されているものの、ディープラーニングが次の重要事項として人気を博している。ディープラーニングモデルとは、より多くの層を持つニューラルネットワークである。この信じられないほど満足感の得られない説明に対する、完全に合理的な反応は、その層とは何を意味するのかと問うことだ。

これを理解するためには、コンピューターが猫と人間を2つのグループに分類できるからといって、コンピューター自身はその仕事を人間と同じようには行っていないことを認識しておかなければならない。機械学習フレームワークは、タスクを達成するために抽象化のアイデアを活用する。

人間にとっては、顔には目があるものである。コンピュータにとっては、顔には線の抽象を構成する明暗のピクセルがあるものだ。ディープラーニングの各層は、コンピュータに同じオブジェクトに対して、違うレベルの抽象を行わせるものである。ピクセルから線、それから2Dそして3Dへ。

圧倒的な愚かさにもかかわらず、コンピューターは既にチューリングテストに合格した

人間とコンピュータが世界を評価する方法の根本的な違いは、真の人工知能を作成するための重大な挑戦を表している。チューリングテストは、AIの進捗状況を評価するために概念化されたものだが、この事実は無視してきた。チューリングテストは、人間の反応をエミュレートするコンピュータの能力を評価することに焦点を当てた、行動主義のテストである。

しかし模倣と確率的推論は、せいぜい知性と意識の謎の一部でしかない。2014年の時点で私たちはチューリングテストに合格したと考える者もいる、5分間のキーボードによる対話の間、30人の科学者のうち10人を、人間を相手にしているものだと信じさせることができたからだ(にもかかわらずSiriは質問の3件に1つはGoogleを検索しようとする)。

それで、「AIの冬」のためにジャケットを用意する必要はあるのか?

こうした進歩状況にもかかわらず、科学者や起業家を問わず、AIの能力への過剰な約束は迅速だった。この結果引き起こされた騒ぎと破綻は一般的に「AIの冬」(AI winters)と呼ばれている。

私たちは、機械学習によっていくつもの信じがたいことができるようになってきた、例えば自動運転車のためのビデオ映像内の物体の分類をしたり、衛星写真から収穫の予測をしたりといったことだ。持続する短期記憶は、私たちの機械に、ビデオ中の感情分析のような時系列への対処をさせることを可能にしている。ゲーム理論からのアイデアを取り込んだ強化学習は、学習を報酬を通じて支援するための機構を備えている。強化学習は、Alpha GoがLee Sodolを追い詰めることができた、重要な要因の1つだった。

とは言うものの、こうした進歩にもかかわらず、機械学習の大いなる秘密は、通常私たちは与えられた問題の入力と出力を知っていて、それらを仲介する明示的なコードをプログラムするものなのに、機械学習のモデルでは入力から出力を得るための道筋を特定することが常にできるわけではない、ということなのだ。研究者はこの挑戦を、機械学習のブラックボックス問題と呼んでいる。

ひどくがっかりする前に指摘しておくならば、人間の脳自身もブラックボックスだということを忘れてはならない。私たちはそれがどのように動作しているかを本当に知らず、抽象の全てのレベルでそれを調べることもできない。もし誰かに、脳を解剖してその中に保持されている記憶を探させてくれと頼んだら、即座にクレイジーというレッテルを貼られてしまうだろう。しかし、何かを理解できないということはゲームオーバーを意味しない。ゲームは続くのだ。

この記事では、機械学習を支える多くの基本的な概念を紹介したが、将来の「いまさら聞けない(WTF is …?)」シリーズのための沢山のネタがテーブル上に残されている。ディープラーニング、強化学習、そしてニューラルネットは、それぞれより深い議論に進むことが可能だが、願わくばこの記事を読んだ後、読者のこの分野への見通しが良くなって、日々私たちがTechCrunchで取り上げている沢山の企業間の関連が理解しやすくなることを期待している。

他の「いまさら聞けない(WTF is)」シリーズ

いまさら聞けないコンテナ入門

いまさら聞けないクリックベイト入門【英語】

いまさら聞けないミラーレスカメラ入門【英語】

[ 原文へ ]
(翻訳:Sako)

AIが引き起こす破壊の波

gettyimages-4964795042560x-80

【編集部注】著者のRudina Seseri氏は、Glasswing Venturesの創業者でマネージング・パートナーであり、かつハーバード・ビジネス・スクールのアントレプレナー・イン・レジデンスと、ハーバード大学イノベーション・ラボのエグゼクティブ・イン・レジデンスも務める。

情報技術はディストラプション(破壊)の波を超えて進化する。最初はコンピューター、そしてウェブ、遂にはソーシャルネットワークとスマートフォン、全てが人びとの生き方や、ビジネスの回し方に革命を起こす力を持っていた。それらは適応に失敗した企業を破壊し、一方では成長するマーケットの新しい勝者を生み出して来た。

そうした波の到来のタイミングと形を正確に予測することは困難だが、それらがたどるパターンは認識しやすい。例えば、ウェブ/デジタルのディストラプションを考えてみよう:まず先行するテクノロジー(例えばTCP/IPや設置済のコンピューター群)の利点を活かした、テクノロジーのブレイクスルーがあり(例えばTim Berners-LeeのWWW)、そして一見緩やかに見えながら、実は爆発的に、既存の市場を破壊したり(例えばAmazon)創造したり(例えばGoogle)する、新しいアプリケーションとプラットフォームの勃興が導かれた。

そして今、新しい波のうねりが見え始めている。ウェブが既存の技術を利用したことと同様に、この新しい波は、コンピューティングハードウェアのコストの低下、クラウドの出現、企業システムのコンシューマライゼーション(専用機器ではなく消費者向けデバイスを利用すること)、そしてもちろん、モバイル革命などの動向に基いている。

更にスマートデバイスと「モノ」の急増と多様化は、定常的なコミュニケーションと共有を可能にし、一方ソーシャルネットワーキングネイティブたち(世界のSnapchatユーザーは団結する!)は常時共有と自己表現を「必需品」としている。この結果が、私たちが普遍接続性(pervasive connectivity)として作り出したものの出現だ。

普遍接続性はこれまで以上に豊かでパーソナライズされたデータの急増につながる、そしてそのことはデータを処理し、価値があり操作可能な洞察を引き出す方法への、完全に新しい機会を生み出すのだ。人工知能が、まさにそれを可能にする。

AIのもたらす機会 – なぜ今なのか、どうそれを活用するのか

AIは、より広い意味では、知性を発揮する機械の能力として定義され、ここ数年で劇的に改善された、学習、推論、プランニング、そして知覚といった、いくつかのコンポーネントで構成される。

機械学習(ML)は顕著なブレークスルーを達成し、それによりAIコンポーネント全体にわたるパフォーマンスの向上が促進された。こうしたことに最も貢献しているMLの2つの流れは、理解に関わる深層学習(ディープラーニング)と、特に意思決定に関わる強化学習(リインフォースラーニング)だ。

興味深いことだが、これらの進歩はアルゴリズムではなく、むしろ(高品質な注釈付の)データ(セット)の指数関数的成長によって促進されたことはほぼ間違いないだろう 。その結果は驚くべきものだ:ますます複雑になるタスクに対してしばしば人間のパフォーマンスを上回るよい結果が継続的に達成されている(例えばゲーム音声認識、そして画像認識の分野で)。

とはいえ、それはまだ黎明期であり、いくつかの課題が残されている:ほとんどのブレークスルーは「狭い」アプリケーションの領域で起きているものであり、(作成には高いコストのかかる)大量のラベル付データセットが必要な訓練手法を使っている。ほどんどのアルゴリズムは(いまでも単に)人間以下の能力を発揮できているのに過ぎず、その訓練にはかなりのコンピューティングリソースを必要とし、大部分のアプローチが理論的フレームワークを欠いた発見的手法に基いている。

AIは、既に自宅と職場の両方で、私たちの日常生活の多くの側面を変えている。しかし、これはほんの始まりに過ぎない。

これらの課題の多くは、おそらく中長期的には克服されるが、今日作成されている大部分のAI応用プロダクトは、こうしたことを考慮して置かなければならない。これが、AIを活用することを計画している企業が以下の事に気を配ることが重要である理由だ:柔軟なアプローチをとること(すなわち、最初は、良いパフォーマンスを出すためのMLアルゴリズム訓練データを集めることができるか、あるいは非AIアプローチをとるか)、(AI機能を開発しその性能を促進するための)「ラベル付けられたデータ」をユーザーから集める連続的な情報の流れを作り出すこと、そして十分に支援されていない、あるいは「人間が介在している」ユースケースに注力することだ。

現在多くの注目は、大規模テクノロジー企業(Google/DeepMindFacebookPinterestなど)に向けられているが、わたしはこの(もしくはこれに類似した)アプローチを使って、企業と消費者市場にAIディストラプションの波を起こすのは、スタートアップたちだろうと考えている。そして、既にいくつかのスタートアップはそれを始めているのだ。

企業内のAIディストラプション

企業内でAIは、企業が消費者とインタラクトするための新しい方法や、従業員同士が相互にコミュニケーションするための新しい方法、そしてそのITシステムと共に、より大きな収益と生産性の向上の両者を促進している。

マーケティングは、新技術の典型的なアーリーアダプターであり、それは既にAIを採用していて、セクター全体にわたって高い認識とコンバージョン指標が育っている。ソーシャルメディアでは、SocialFlow*などの企業が、キャンペーンの効果を向上させるための機械学習の使用を開拓してきている。ディープラーニングによって支えられる新しい画像認識技術は、Netraのようなスタートアップが、視覚に対する知性と検索性の改善をすることを可能とし、ユーザーエクスペリエンス全体を向上させている。電子商取引では、Infinite Analyticsが、より良いパーソナライゼーションを可能にするプロダクト群を作成することができている。

セールス分野では、営業チーム/見込み客とCRMの間のUIを再考した新しいプロダクトが、効率を大いに改善し、成約率を向上させている。Troops.aiは、セールスチームが現在自身の使っているプラットフォームを通して、CRMデータに簡単にアクセスすることを可能にする。Rollioは自然言語を介したCRM情報のアクセスおよび更新を可能にする。Conversicaは、より良いスクリーニングを行い、見込み客をフォローアップできる、セールスアシスタントを作成した。

普遍接続性の世界では、AIがデータのパワーを活用するための鍵である。

人事分野では、スタートアップは様々な活動にわたった効果と効率性の改善を行おうとしている。Tallaは、企業内のナレッジマネジメントの改革を目指している。一見単純な会話エージェントから始めて、最終的には本格的で先回りを行うナレッジエージェントへと向かうのだ。Wade & Wendyは採用時に使用するための両面会話エージェントを作った、目的は向かい合う両者の満足度のレベルを上げながら、全体の採用時間を短縮することである。

生産性という話では、x.aiのような企業たちが、スケジューリングに際しての苦痛を大幅に取り除き、シームレスなユーザーエクスペリエンスを生み出そうと努力している。

最後に、部門をまたがるアプリケーションを擁する広範なプラットフォームを作っている企業もある:Indicoは、アプリケーション間をまたがったアルゴリズムの訓練をかなり高速に行うために、学習転送を使っている;Receptivitiは、人びとのテキストやボイスメッセージを解析して、彼らの心理的かつ個人的な意思決定スタイルと感情をリアルタイムに明らかにする。

消費者市場におけるAIディストラプション

消費者市場で、おそらく最も私を興奮させるものは、AIが新しいプラットフォームを創造し、日々の生活の中の重要な空間で私たちが技術と対話する方法を再定義していくやり方である。

そのような重要な空間の1つが家だ。Jibo*は家庭の変革を目指す、フレンドリーでインテリジェントなソーシャルロボットだ。よりよいユーザーエクスペリエンスを生み出すために、それは人間臭いリアクションを採用している。一方、幅広いタスクにとても役に立つ働きをする、誰が話しているかによって調整を自動的に行うインテリジェントビデオコールから、料理をする際の材料の提案、そして子供向けの読み聞かせの手伝いまで、といった具合だ。

また別の重要な空間は車だ。nuTonomyはシンガポールにおける自動運転の導入で、テクノロジーを迅速に市場に持ち込み、現行勢力を飛び越えることができたスタートアップの良い例だ。

そしてどうなる?

ほとんどの人が、AIの仮説上の発展の、長期的な可能性と脅威に焦点を当てているが、いまのところ、新しいディスラプションの波を促しているのは、経験則に基づく、限界のある適用形態である。これまでの波のように、この変化は微妙で最小のもののように見えるが、ほどなくそれはひろく普及し、無視することができないものになる。

普遍接続性の世界では、AIがデータのパワーを活用するための鍵である。企業が生き残るためにはAIの利点を活かす必要がある ‐ Google、Facebook、Amazon、そして無数のスタートアップはそれを知っている。そして、あなたも知るべきなのだ。

AIは、既に自宅と職場の両方で、私たちの日常生活の多くの側面を変えている。しかし、これはほんの始まりに過ぎない。AIは、ゆっくりと、着実に、そして広範囲に、私たちとテクノロジーの関係を再定義している。そして人間の能力と、基本的には私たちの生き方を、向上させているのだ。

*Rudina Seseriの投資ポートフォリオには、SocialFlowとJiboが含まれている。

[ 原文へ ]
(翻訳:Sako)