SFから現実世界へ広がるAI、その質を左右するのは?

photo01

TechCrunch Tokyo 2016で11月17日の夜に行われたセッション「機械学習と音声UIのゆくえ、元Cortana開発者に聞く」では、人工知能が適切に学習していくために不可欠な、「適切なデータ」の提供に特化したスタートアップ企業、DefinedCrowdの共同創業者兼CEO、ダニエラ・ブラガ氏が登場し、AIや機械学習の動向を説明するとともに、新たなβプラットフォームを発表した。

SFから現実へ、多様化進むAIの姿

2001年宇宙の旅の「HAL 9000」、ナイトライダーの「K.I.T.T」、そしてエクス・マキナの「エヴァ」——古今東西、さまざまな小説や映画の世界では、人間と対話し、考え、自ら判断を下すAIの姿が描かれてきた。ブラガ氏は今、それらが「SFから現実になろうとしている」と述べた。

すでに世界中で多くの企業がAIとそれを搭載したロボットの開発に取り組んでいる。音声認識機能や自然言語処理機能を備えた家庭用AIロボット「Jibo」はその一例だ。Jiboのオフィシャルトレイラー動画では、人間とのやり取りを通じて学習し、命令に従って写真を撮影してくれたり、子どもと遊んだり、いろんな仕事をしてくれる様子が紹介されている。

ブラガ氏はこうした例を紹介し、AIやロボットには「Pepperのように人間型をしているものとそうでないもの、体を持たないソフトウェアだけのものとハードウェアを持つもの、そして(同氏が開発者の1人である)CortanaやWatsonのように音声で会話を行うものと、テキストチャットで意思疎通を図るものなどさまざまなものがある」と説明。市場規模はますます拡大するだろうと述べた。

さて、AIとはそもそも何なのだろうか。ブラガ氏は「人の振る舞いを真似て、認知し、会話し、考え、ビジョンを持つもの」と定義する。そして機械学習は、AIが学習していくための1つのテクニックという位置付けだ。AIはさまざまなアルゴリズムを使って機械学習を行い、より賢くなっていく。

データの質がAIの質を左右する

AIの機械学習にはデータが欠かせない。しかしそのデータの質が、時にAIそのものの質を左右することになる。かつてマイクロソフトでCortanaの開発に取り組んだ経験を持つブラガ氏が新たに起業した理由は、そこにあるという。

「今や人間は日々、2.5クィンティリオン(10の18乗)というとんでもない量のデータを生み出している。しかもその9割は、機械が処理できる構造化データではなく、非構造化データだ」(同氏)

photo02加えて、これまでのAI分野でのさまざまな経験も、起業の理由の1つになった。「マイクロソフトでCortanaを開発する際、学習のためのデータはアウトソーシングで集めてこなければならなかった。しかしそのデータのうち2割は質の悪いデータだった。もし質の悪いデータを受け取って学習されると、何が起こるかを紹介しよう」とブラガ氏は述べ、過去にメディアでも報道されたいくつかの残念な例を挙げた。

1つは、マイクロソフトがTwitterで公開したチャットボット「Tay」だ。Tayはユーザーとのやり取りから学ぶように作られていたが、数時間後には人種差別発言を繰り返すようになり、公開後わずか24時間で停止に追い込まれた。また、グーグルが2015年5月に公開したフォトアプリ「Google Photos」は、アップロードされた画像を解析し、自動的にタグを付ける人工知能機能を搭載していたが、2人の黒人が写った写真に「ゴリラ」とタグを付け、謝罪する事件も発生している。いずれも「Garbage in, garbage out」の典型例と言えるだろう。

「このように質の悪いデータを用いると、AIの機械学習にも影響が及んでしまう。AIは構造化され、かつクリーンなデータで学ばなければならない。そこにわれわれの役割がある」とブラガ氏。同氏らが設立したスタートアップ企業のDefinedCrowdは人工知能をトレーニングするためのデータを収集し、構造化し、機械学習に使えるプラットフォームを影響することが役割という。

自然言語処理技術とクラウドソーシングを組み合わせたプラットフォームを提供

同社のプラットフォームは、技術とクラウドコミュニティーを組み合わせて実現されている。入力データに対し、音声認識や自然言語処理といったパイプライン処理を加え、そのデータに対してさらに、世界53カ国、46の言語をカバーする約5000人のクラウドソーシング協力者(学生らが中心という)がタグ付けなどの処理を行う。そうした質の高いデータを用いて学ぶことによって、機械学習のクオリティを保つことができると同氏は説明し、人を介することによる品質の高さとスピード、そして世界の言語の9割をカバーする拡張性が、同社プラットフォームの特徴だとした。

DefinedCrowdはこの日、TechCrunch Tokyo 2016に合わせて、新たなプライベートベータ版を発表した。音声処理テンプレートの強化に加え、新たに画像処理用のデータ群ならびにデータパイプラインを追加したことが大きな特徴だ。イメージおよび動画のタグ機能や感情ラベリング、診断システムなども搭載されているという。

ブラガ氏によると既に、Fortune 500も含むいくつかの企業が同社のプラットフォームを利用し、AI開発に活用しているという。広告やメディア企業も含まれており、「例えば、インターネット上で自社ブランドに関してどんな会話が行われているかを知りたいというときには、プラットフォーム上でパイプラインを作るとクリーンなデータが構造化された形で流れ込み、傾向を把握できる」そうだ。フレッシュなデータを得てフィードバックできることも利点という。

最後にブラガ氏は、「AIはこれから5年で、コールセンター、クルマや公共交通機関、さらには小売店鋪や医療、音楽、教育(特に外国語学習)、高齢者の介護など、あらゆる領域に普及していくだろう。わたしのお気に入りだけれど、家事もその1つに入るだろう」と予想し、セッションを締めくくった。

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。