IBM WatsoのCTO Rob Highが機械学習の“偏り”などAIの最新の課題を語る

IBM WatsonのCTO Rob Highにとって、機械学習における現時点の最大の技術的課題は、少ないデータでどうやってモデルを訓練するか、ということだ。バルセロナで今行われている例年のMobile World Congressでインタビューしたとき彼は、“それはチャレンジであると同時に目標でもあるが、それが可能だと信じられる理由もある”、と語った。

彼のこの意見は、業界全体の声を反映したものでもある。GoogleのAIのチーフJohn Giannandreaはたとえば最近、それを同社の機械学習グループが取り組んでいる主要な課題の一つとして挙げた。通常、機械学習のモデルは、正確であるために大量のデータで訓練する必要があるが、しかし、そんな大きなデータ集合がそもそも存在しない問題も多い。

しかしながらHighは、これが解決可能な問題だ、と信じている。なぜか? “人間はそれをしているからだ。われわれ人間にはデータポイントがある”、と彼は言う。ここで心に留めなければならないのは、人間がやってることの中にその証拠がある、と彼が言うのは、具体的なあの機会やこの瞬間に、人間の学習の仕方に関する情報がある、という意味ではない。“むしろ、テーブルの上にはありとあらゆるコンテキストがあるのだ”。つまりHighが言いたいのは、少ないデータでモデルの訓練が可能になるのは、コンテキストのおかげであり、また、転移学習(transfer learning)における最近の進歩だ。それは、すでに訓練されているモデルを、データの少ない別のモデルの訓練に利用する技法だ。

しかしAIの課題、とくに会話的AIの課題は、さらにもっと困難だ。“もう一方では、人間が自然だと感じるようなやり方で人間と対話し、人間の思考に影響を与えるにはどうするか、という課題がある”、とHighは語る。“人間は、彼らがやり取りする言葉だけから影響されるのではなく、それらの言葉を収めている発声や屈折、抑揚、韻律、気分、顔の表情、腕や手のジェスチャー、などなどの影響も受ける”、Highは、AIがこれらの要素を擬人的に模倣すべきだ、とは考えていない。むしろ、デバイス上の何らかの形のビジュアルキューを使うだろう、と。

それと同時に、多くのAIシステムがもっと上手になるべきなのが、質問の意図を正しく理解することだ。その質問は、何かに関するその人の前の質問とどう関連しているのか。その人の今の心の状態や人柄が、質問の意図にどう影響しているか、など。

しかしここから、もうひとつの疑問が生ずる。今実用化されている機械学習のモデルの多くは、それらが訓練されたときのデータによって偏りが生じている。分かりやすい単純な例としては、そのモデルは白人の男性に関しては精度が高く、黒人の女性に対しては成績が悪い、ということがありえるだろう。この問題にHighはこう答える: “方程式の両辺を見る必要がある。ひとつは、データの集積による偏りで、これに対してはよく注意して、人間ならばそのモデルが表している文化的および集団的側面を広げる努力をしなければならない。しかしもうひとつは、個人的偏りよりは、集積的偏りの方が望まれる場合もある、ということだ”。〔偏りが求める母集団の特性を表しているような場合。〕

Highは、IBMがSloan Kettering Cancer Center(がんセンター)で行った例を取り上げた。その病院は、がん治療の優れた外科医たちの仕事に基づいてモデルを訓練した。彼曰く: “しかしSloan Ketteringには、治療のやり方に関する独特の哲学があり、その哲学が偏りとして組み込まれた。それはその機関の偏りであり、彼らのブランドでもある。[…]Sloan Ketteringの外でそのシステムを利用するときも、その哲学による偏りを免れない”。

“偏りが正しい偏りであるためには、モデルの利用者や、彼らが代表している集団が、多様な文化集団がある中でもとくに、その偏りにとって適正な人びとでなければならない”。これは、IBMのクライアントに対してHighがよく言う言葉でもある。偏りを偏りとして直視し、ときにはその意義も認めることは、今だにこの種の話題を無視しがちな業界における、肯定的な兆候のひとつだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

IBM WatsonとUdacityがパートナーしてネット上に人工知能の単科学位コースを開設(全26週)

ibm-watson-servers

社会人のスキルアップ&キャリアアップのためのネット教育をやっているUdacityが、IBM WatsonDidi Chuxing、およびAmazon Alexaとパートナーして、人工知能のナノディグリー*を提供していく、と今日(米国時間10/25)のIBM World of Watsonカンファレンスで発表した。〔*: nanodegree、ナノ学位、‘ミニ’よりもさらに小さな学位、特定単一科目限定。Udacity独特の用語である。〕

この課程のためのカリキュラムはIBM WatsonとUdacityが共同開発する。‘中国のUber’(のひとつ)Didi Chuxingは、このナノ学位を取った学生を雇用する。IBMも、だ。人工知能ナノ学位の開発に関し、Amazon AlexaがUdacityのアドバイザーとなる。

UdacityのファウンダーSebastian Thrunは、Googleのイノベーション部門Google Xと、その自動運転車開発事業を創始した人物だが、彼によるとこのAIナノ学位は、ソフトウェア開発にある程度精通している人が対象だ。

IBMでWatsonを担当しているVP Rob Highが同社のブログ記事に、このナノ学位の教程では、ゲーム、検索、ロジックとプランニング、コンピュータービジョン、自然言語処理などのアプリケーションやプラットホームの作り方を学生に教えていく、と書いている。

人工知能と倫理の問題についてThrunはこう言う:

“その問題は、ナノ学位のカリキュラムには含まれない。AIに関して恐怖を声高に広める人たちがいるが、AIと世界の支配や破壊は無関係だ。むしろそれは、退屈な繰り返し作業から人間を解放する。あなたがライターじゃなくて、オフィスで毎日同じことをしているオフィスワーカーだ、と想像してご覧”。

“あなたの仕事のやり方を見ていたAIは、あなたの仕事をあなたの100倍の効率でできるようになるだろう。あなたには、大量の自由時間ができる。AIと人間の心との関係は、蒸気機関と人間の体との関係とパラレルだ、と私は思う。どちらも、世界にとって、ポジティブなニュースだ”。

UdacityのAIナノ学位課程は、13週間の学期を2学期受ける。最初の学期は、2017年の初めに開く。

カリキュラムは目下開発中だが、教えるのは人間だ。ただしそれらの先生たちが、自分の授業のためのAIアプリケーションを開発するのは、かまわない。

UdacityはEdX, Courseraなどなどのエドッテック(edtech)プラットホームと競合している。どこも、今のテクノロジー社会における、一般社会人のスキルアップとキャリアアップを、売り物にしている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))