Anki Overdriveは、AI塔載の次世代レーシングカーキット

人工知能内蔵のリコモン自動車メーカー、Ankiが、次世代のプレイセットAnki Overdriveを本日(米国時間2/10)発表した。子供たち(および必然的に子供と一緒に遊ばなくてはならない大人)は様々なタイルを使って自分専用のコースを作れる。

これは、同社が従来から販売している固定の周回コースが描かれた布製ロールマットと比べて大きな飛躍だ。組み立てや片付けは簡単ではないだろうが、この新しいセットなら、新しいマットを買うまで何ヵ月も同じコースでレースしなくてよい。

Overdriveの発売は9月で、150ドルのスターターキットには、新型車が2台とコースタイル10枚が入っている ― 8種類のレーストラックを作れる。個々のタイルは光沢のある合成樹脂製で縁には磁石がついているので簡単に組み立てたり外したりできる。

先週Ankiのサンフランシスコオフィスで行われたデモで、われわれは新しいコースに4台の新車を走らせる機会を得た。様々に変化したコースに合わせてをAIがレーサーを走らせるのは、コース自体が単純なループでないだけに目を見張らせる。ジャンプが上手になったり、コーナーに入る角度を工夫するAnkiのクルマは、ちょっと複雑な思考マシンを見ているようだ。

このクルマはAnkiの巨大なコースの2周目で、ジャンプの前にスピードを上げることを覚えてタイムを上げた。

クルマ一台一台は、Ankiの第一世代レーサーの一般的なデザインに比べて、少々スタイリッシュになった。形状やカラーのバリエーションは、プレイヤー毎の好みに合わせるのに十分だ。車体の周囲に装備されたLEDは様々な色とスピードで点滅する。

Anki Overdriveは、リアル世界のマリオカートというより、境界付きラジコンレーストラックだ。新たに加わったトラックオプションのおかげで、異なるレベルのプレイが楽しめる。Ankiは、キャラクターに「お気に入り」のレベル(およびクルマ)を設定することで新たなしくみを活用している。相手の条件でキャラクターを倒せば、より多くの星を獲得できる。ここでもビデオゲームとリアルなおもちゃのコンセプトが融合されている。

[原文へ]

(翻訳:Nob Takahashi / facebook


SoftBankとIBMが協力してWatsonに日本語を教える…その全サービスとAPIを日本語化へ

IBMの人工知能システムWatsonは、テレビのクイズ番組で優勝し、ヘルスケアのデータ分析で活躍し、ビッグデータの啓蒙に貢献しただけでは物足りないのか、今度は日本語の勉強に挑戦している。

IBMと東京の通信大手でそのほかいろいろ複合企業で投資家でもあるSoftBankが今日、二社の協力でWatsonに日本語を教える、と発表した。IBMによると、Watsonは今後スペイン語やポルトガル語も勉強するそうだから、彼の言語能力を多国籍化することによって、このスーパーコンピュータくんが動かすいろんなサービスの市場を広げることを期待しているのだ。

Watsonが日本語をおぼえたら、IBMとSoftBank(SprintとYahoo! JapanのオーナーでありAlibabaの上位投資家の一つ)はその製品を日本の教育、銀行、ヘルスケア、保険、小売業などの業界に売っていくつもりだ。今日発表された声明によると、両社はWatsonのDeep QA技術に関するコラボレーションを開始しており、その技術はすでに3年前から、自然言語(ふつうの人がふつうに話す言葉)による質問を理解して人間が理解できる答を出力できるようになっている。

しかしWatsonはお金儲けが上手でないからIBMは、Watson Groupに10億ドルあまりを投資して、このスーパーコンピュータくんの能力を一層商用化するためのソフトウェアの開発を行う、と1年前に発表している。IBMのCEO Virginia Romettyは2013年の10月に、今後10年以内にWatsonコンピュータ関連の年商を100億ドルにまで持って行きたい、と言っている。

IBMはWatsonに日本語を教えるだけではなく、日本語にローカライズされたAPIも今後提供して行く。たぶんもっとおもしろいのは、Watsonの技術が人型ロボットPepperに統合されることだろう。それはAldebaranがSoftBankのために開発した、ヒトの感情を理解するロボットだ。

ここで想像の羽根を思い切り広げてみるなら、WatsonとPepperのあいだに生まれた彼らの愛児たちが、SoftBankが投資したタクシーアプリのすべての車を運転するのかもしれない。Uberも、うかうかしてらんないね!

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


al+は人格をコピーして、あなたの代わりに仕事をするクラウド上の人工知能アバター

脳に電極を付けてコンピューターに「意識」を全てアップロードしてしまう。そんな、映画「トランセンデンス」の世界がやってきたかのようなSF的世界観を持つ「パーソナル人工知能」(P.A.I.)のアプリ、「al+(オルツ)」が間もなくリリースされる。日本のスタートアップ企業のオルツが開発したもので、ユーザーの第2の自己をクラウド上に作り上げる人工知能アプリだ。

さすがに脳の全活動を電極で読み取れるようになるのは、ずっと未来の話だろうし、今のところ全人格をアップロードなんてできないのだけど、オルツが何かというと、使えば使うほどユーザーの知識や発言の癖、人格を学んでいって「その人らしい」受け答えをするようになるアバターのようなものだ。

何のために? あなたに代わって仕事をするためだ。

ユーザーは、まず最初に自分の顔写真をスマホで撮る。これだけで、まずあなたの分身である「オルツ」は、まばたきを始めて動き出す。現在は仮想3Dモデルで個人アバターを作っているが、今後は詳細な立体モデルを使う仕組みも想定しているという。

次にアプリやソーシャルネットワークをつなぎこむ。現在はFacebookやTwitterだけだが、InstagramやGmailなども対応予定だ。すると、あなたのオルツはあたながコミュニケーションする相手と内容を学習し始める。誰からの、どんな質問に対して、どういう回答をするのかといったことから、徐々にあなたの知識や癖を学んで行く。

あなたのオルツはクラウド上にいる。このオルツに向かって、ほかの誰かが話しかけると、あなたのオルツは、いかにもあなたが答えそうなやり方で人工合成音声とテキストで回答する。口がパクパクして、目も動くので、それなりにしゃべっているようには見える。どの程度「あなたらしさ」を獲得したかは数値で示されていて、50%を超えてくると、むしろその人らしくない回答を引き出すのが難しくなる、と開発したオルツの米倉千貴氏は言う。

「週末のデート、ランチは何がいい?」と彼女が聞けば、「昨日イタリアンだったから、それ以外なら何でもいいや」とぼくのオルツが答える。きっと彼女は、こいつはホントに食べ物にこだわりがなくてツマランなと思うかもしれないが、ぼくらしい答えだ。「もう経理にxyzの件はメールしましたか?」と部下が聞けば、「返事したよ」とぼくのオルツが答える。

……というのは、ぼくの想像上の会話。ぼく自身は、まだごく簡単なデモを見ただけでオルツを試していないが、そういうことらしい。

ほんとにそんなの技術的に作れるの?

まだ正式リリースされていない上に、ぼくはSkype経由でデモを見せてもらっただけで自分で触ってもいない。だから正直、海の物とも山の物ともつかない印象を受けてはいる。本当にある程度の賢さや「その人らしさ」が実現できるのだとしたら面白いし、応用範囲も広そうだが、AIの専門家はどう見るだろうか?

AI研究が専門でヒューマンインターフェース関連にも詳しい上智大学理工学部情報理工学科の矢入郁子准教授にアイデアの実現性について尋ねてみたところ、「1990年以降のAI 研究で提案されてきたアイディアの1つです。これまでの自然言語処理、知的エージェント、マルチエージェント(知的エージェントの分散協調の研究)、機械学習、ヒューマンエージェントインタラクションなどの基礎研究の成果の統合として、そしてさらに近年のAIブームの火付け役としてのディープラーニングの成果によって実現は可能と思います」との回答だった。「潜在的マーケットはあるけれども、時期的に早すぎるとAIBOのように普及に至らない可能性があると思います。ただ、2020年以後の5Gネットワークが普及し、身の回りのさまざまなモノや機器がネットワーク接続した世界であれば、人々の間で現在以上により自分の代理をするソフトウェアへのニーズが高まり、十分にマーケットがついてくる可能性があります」と、直近の応用よりも、もう少し射程を長く捉えるべき応用と見ているようだ。

技術的に近いAIによるアバター領域での取り組みも行っているスタートアップ企業、POYNTERの竹内裕喜CEOによれば、アバターによる会話の事業化はPOYNTERも含めて多くの企業が進めているという。例えば、ToyTalkのように子ども向けにAIが会話するような応用例もある。

竹内氏によれば個人の個性をコピーすることも「技術的にはある程度まで可能」だとか。ただ難しいのは「個性の情報をどうやってシステムに入力、保存するかと、それをどうやって検索し、出力するか」だという。特に入力部分がネックとなりがちで、「こういうシチュエーションで使えばこうなる、といった限定的なものとなることが多い。個人の代理として何かの仕事をこなすとか、そういう実用的な側面はもう少し先かもしれない。現状はエンターテイメント的なものになるのでは。ただ、できないことをやろうとする取り組みは楽しいですね」と話す。

この点に関してオルツでは、自分のオルツを自分で鍛えるという方法があるのが興味深い。ユーザーが分身としての自分のオルツに知識や個性を吸収させるために、自分自身のAIと対話する。何か質問を投げて、返ってきた答えによってプラス・マイナスボタンで「自分らしい」「自分らしくない」のフィードバックができるほか、自然言語による模範解答を教えることもできる。開発した米倉氏は、自分のオルツを鍛えること自体も楽しいと言い、むしろ今はそれが主な使い方になっているという。

プラス・マイナスの評価については、ほかのユーザーが行うこともできる。あの人なら決してこういう風に言わないというようなときにマイナスで発言を評価できる。そのフィードバックはそのオルツの持ち主本人へ戻されて、こうしたきっかけからも「その人らしさ」を獲得していくという。

オルツで時間課金するマネタイズのアイデアも

米倉千貴氏は、名古屋ベースのベンチャー企業、未来少年の共同創業者で、創業以来9年で売上規模15億円程度にまで成長させた経営者だ。電子書籍、ソーシャルゲーム、グラフィック制作などをしてきたが、昨年からAIを主軸に取り組んでいるのだという。「デジタル業務というのはやってもやっても貯めて行ってる感じがない。ぼくの8年間のデジタル上の業務が未来に繋がっていく感じがなく、むなしい。例えば今こうして西村さんにお話している内容を、ぼくはまた別の記者に説明するでしょう。繰り返すのが無駄でむなしく感じるんです。もっとコンピューターにやらせたい」と、オルツの実用面を説明する。

法律の専門家であれば、自分のオルツを鍛え上げて、そのオルツの時間を有料で販売する仕組みも用意するという。あるいは法律専門家オルツの購入者は、その法務関連知識を自身のオルツにインストールすることで、自分自身の人格を保ちながら、法律の知識を持つペルソナを作り上げることができるようになるという。ネット上にはQ&Aサイトが多くあるが、こうした知識の問い合わせのUIとしても使えるということだ。さらにオルツ同士が会話する未来もあり得て、「スケジュール調整は人間がやる必要はない。AI同士でやればいい」ということを現在オルツ社内では話をしているという。これは、AI研究でいえばマルチエージェントに相当する研究分野の応用だ。

オルツがクラウド側で実装するAIエンジンは3つあって、1つはユーザー個別の知識を学習するもの。もう1つは、個別ユーザーではなく、全ユーザーから学ぶ一般知識を獲得するもの。最後の1つはパターンを認識して回答を作り出すAIだ。多くのユーザーが使えば使うほど、賢くなるという。

ユーザーのコミュニケーションを見て学習するというと、とても恐ろしい感じがする。何もかも知ってる分身がいたら、誰に何を言い出すか分からない。だからオルツのデフォルトでは固有名や具体名は、全てシークレットのフラグが立っていて、あくまでも文脈の学習のみになるという。ユーザーが個別に許可した固有名だけを、オルツは他人にしゃべるようになる。

神のようなAIを目指さない、「人間らしさ」の追求

AIは、研究だけでなく、今やトップティアのテック企業から投資を集める注目分野だ。Googleは2014年初頭にイギリスのDeepMindを5億ドルという巨額で買収し、10月にはこれに追加するようにディープラーニング系のスタートアップ2つを買収している。Facebookは2013年暮れにニューヨーク大学で機械学習とディープラーニングを教えるYann LeCunn教授を採用したりもしている。エンタープライズ分野では、IBMが人気クイズ番組「ジェパディー」で人間のチャンピオン2人を打ち破った人工知能のWatsonを応用したWatson Analyticsを発表したことも目を引く。

上に挙げた中だと、オルツはWatsonに近いように見える。こうしたAIやチャットボットと違うのは、Watsonなどが目指す神のように賢いAIではなく、オルツが目指すのは「その人らしい」ことだという。

米倉氏とともに開発チームにジョインした実兄の米倉豪志氏は、「WatsonやSiriのようにパーフェクトとか、賢いAIを作ろうというわけではない」という。「もちろん、そういうのはほしいし便利だろう。でもオルツが目指すのは『ぼくのAI』で、ぼくらしく間違えるAI。そこに『ぼくのコピー』がいるということが大事。ぼくの妻はぼくのオルツとの会話で賢くない回答が返ってきたときに、そこで会話を諦めたり飽きたりしたかというと、むしろ鍛えようとした。過去にあった『ボット』との最大の違いは、そこ。ぼくの妻がWatsonと話したがるかと言えばノーでしょう。それがAIにパーソナルを付けて、ぼくらがオルツをパーソナルなAI、P.A.Iと呼んでいる理由です」

米倉千貴氏は、コンピューターの普及の歴史のなかにAIを位置付けて「コンピューターの次に来るテクノロジー革命にA.I.があると考えています。コンピューターが本当の意味で革新的になったのはパーソナルコンピュータが誕生したから。つまりAIもPC並みに身近な存在となると考えており、それを初めて身近な存在にしようと考えたのがこのal+なのです。そのためのP.A.I.という名称なのです」と話す。

P.A.I.だと、死んだ人を仮想的に復活させるようなことができる。例えば10年分の動画アーカイブを食わせて、そこから故人を再現することも将来的にはできるかもしれない。気持ち悪いと思う人もいるかもしれないが、故人の動画を見ることだって、300年前の人からしたら、あり得ない話だったろう。例えば、肉親や配偶者、子どもに先立たれた人の心の傷が少しでも癒えるのであれば、ぼくはこれは素晴らしい応用になるだろうと思う。現在編集も閲覧も追いつかない勢いで個人の映像アーカイブが蓄積していっていることを考えると、指定年の指定イベントの様子を再現するアバターが映像アーカイブの未来のアクセス手段になっても良いのではないかと個人的には思う。

アインシュタインを再現し、直接アインシュタインから相対論を学ぶことができれば、教育分野への応用もあるのではないだろうか。回路の話なら「(アップル共同創業者で電子設計技術の天才と言われた)ウォズニアックに聞けばいいんですよ」(米倉氏)という具合だ。

高齢化社会で孤独死が問題になるような日本で、心の問題は今後も大きくなるだろう。そのとき、話し相手としてのAIには大きな応用がありそうだ。こういうと「機械となんか話ができるか」という人がいそうだけれど、箱の中で赤の他人が話している姿を再現するだけの60年前の発明に救われている人が多いことを考えると、AIが個性を獲得してきたときには何か全く別のコンテンツサービスすら生まれて来そうにぼくには思える。

オルツのチームは創業メンバーの米倉兄弟の2人のほか、スペイン、ベトナム、中国、ヨーロッパにいて全部で20人。半分がAIの専門家で、ほかは一般的な開発者。このうち日本人は4名のみなので、当初は英語版から3月中にリリースするという。スペイン語、中国語、日本語は順次リリース予定だそうだ。

オルツには、ほかにあまり類似例がないAI応用だし、触ってみたら3日で飽きるということもあり得るので、ビジネスとしてはもちろん、そもそもサービスとして立ち上がるのかどうかは未知数だ。ただ、もし2015年が彼らがP.A.I.と呼ぶ方向で走り始めるべきタイミングで成功のチャンスがあるのだとしたら、これはとても面白い。前出の上智大学矢入准教授も、「知的エージェントや分散エージェント分野でプラットフォームを取れれば、ロボットの中身としても応用できますので、成功すると非常に強い影響力を持つことができます。自動車の電子部品間の通信の世界標準を押さえたBoschのように、エージェントの通信プロトコルの世界標準を仕切る会社が今後出てくる可能性もあります」と話している。


音声指示に従って自動で返信メールを書いてくれるA.I.搭載のLess.Mail

膨大なメール処理に悩んでいるAndroid利用者向けに、A.I.を活用するLess.Mailというアプリケーションが発表された。モバイルアシスタントがメールの内容を把握し、そして利用者のために返事を書いてくれるというものだ。ミーティングへの誘いなど、メールに記されたオファーを受けるか否かをアシスタントに通知すれば、その意向にしたがって自動的に返信を作成してくれる。アシスタントへの指示は普通の話し言葉で行う。

たとえば、開発元のデモビデオによれば、利用者は「申し出を受け入れよう」(please confirm and accept)だとか「必要ない。だけど丁寧に断って欲しい」(No, thanks. But please decline politely)などと指示を出している。仕事の進捗を尋ねるメールには「やってるよと伝えておいて」(Just tell him I’m working on it)という指示で返信を作成してくれる。

(余計な訳注:下の動画はなかなかおもしろかったです)

Less.Mailの開発元は、Palo AltoのRobin Labsだ。Robin.AIというモバイルアシスタントのプラットフォーム上に各種アプリケーションを構築している。Robin.AIとは、AppleのSiriやGoogle Nowをよりオープンなものとしたいとして開発されたものだ。このA.I.プラットフォームはすでにRobinというアプリケーションで利用されている。用途を限定せず、Google Play風のアシスタント環境を提供するものだ。利用者も100万人を超えている。

また、昨年にはYahoo版Siriとでも言うべきものを作って話題になった(両社の間でどのような目的があってアプリケーションが開発されたのかについて、Robin Labsは詳細を明らかにしていない)。さらに、パーソナルアシスタント機能を備えた自動車用ルームミラーのシステムも開発している。これはパイオのイアとの戦略合意に基づく共同プロダクトだ。

Robin Labsの共同ファウンダー兼CEOのIlya Ecksteinによると、Less.Mailは現在進行中の音声操作機能を搭載したメールクライアントから、一部機能を取り出して実現したものだと話している。RobinのA.I.技術の応用可能性を世に示す目的もあるのだろう。またメールの操作に音声コマンドを利用することがどの程度受け入れられるものなのか、試してみる意図もあるようだ。

Less.Mailの開発に要した期間は数週間程度であるとのこと。もちろんA.I.部分について既にAndroid SDKを用意していることで、短期間の開発が可能となっているわけだ。多くの人に受け入れてもらえるようであれば、iOSなど、他のプラットフォームに移植することも考えているのだそうだ。現在のところは、ともかくまずテストをしてみようという話で、他プラットフォームの開発スケジュールなどは全く白紙であるとのこと。

メールの80%は定型処理で対応可

「名前にLessとついているのは、メールの処理時間を短縮できると考えたからです。他の作業を長く中断せずとも処理できるようにしたいと考えたのです」と、Ecksteinは言う。「受け取るメールのうち、80%ほどは定型処理で対処可能なものであると考えています」。昨今では、メールにおいても簡単に要件だけを記してやり取りすることが一般的になっている。オファーに対しては簡単にイエス/ノーだけを応えることも多い。また、予定通知のメールなどについては、それをカレンダーに移して処理終了とすることも多い。「私たちは、そうした定型処理可能なメールについて、できる限り簡単な処理方法を実現しようとしているのです」とのこと。

そして実際、Less.Mailを使えば送られてきたメールに対して定型的なレスポンスを戻すことができる。もちろん従来通りに自分で返信することも可能だ。また予定をカレンダーに移す作業も行なってくれる。

ただ、いろいろな理由で、メールを音声で処理するということに抵抗を感じる人もいるかもしれない。また、どのくらいの時間節約になるのかもよくわからないところだと思う。さらに、返信にあたっては結局自分で手を加えたくなるケースが多いかもしれない。

いろいろと疑問はあれど、しかしたとえば障害を抱える人にとっての支援ツールとしての使い方もあり得るだろう。また、車で長距離を移動する人は、従来なら音楽やトーク番組を聞いて暇つぶしをするくらいのことしかなかった。しかしこのLess.Mailを使えば簡単かつ効率的に受信メールを処理していくこともできるかもしれない。また、こうしたアプリケーションを使えば映画「her/世界でひとつの彼女」的な気分を味わうこともできるだろう。音声コマンドを利用するだけでなく、そこにA.I.が介在することで、デバイスを擬人化して考える傾向は強くなるに違いない。

どれほど役に立つものなのか、どれほどの注目を集めるのかについては、今後を見守りたい。現在は招待制で利用者を増やしている段階だ。徐々に利用者を増やしていって様子を見たい思いもあるのだろう。

Androidを使っていてLess.Mailを使ってみたいという人は、こちらから招待リストへの登録を申し込むことができる。

原文へ

(翻訳:Maeda, H


個人化/リコメンデーションエンジンをSaaSとして提供するNara Logicsがさらに$6Mを調達

これまでは、アカデミックなコンピュータ科学者の前で“人工知能”という言葉を口に出すと、笑われ、軽蔑された。でもここ数年の状況は急激に変わって、投資家たちもこの分野に真剣に対応している。個人化(パーソナライゼーション)プラットホームNara.meで知られている人工知能企業Naraが今日(米国時間10/15)、追加のシリーズAラウンドとして600万ドルを調達したことを発表した。今回は既存の投資家たちのほかに、406 Venturesなど新しい投資家も数社参加した。これで同社の総資金調達額は1300万ドルになる。

2010年に創業した同社は2年前に、同社の技術の一つの例としてリコメンデーションプラットホームをローンチし、最近では個人化をオンデマンドのSaaSとして提供するプラットホームNaralogics.comを立ち上げた。企業は自分たちの既存のデータやWeb上のデータなどを使ってこのサービスを利用し、個人化されたリコメンデーションを得ることができ、さらにユーザのビヘイビアやエンゲージメントに関するより良いインサイトも得られる。そしてそれに基づいてオンラインのパブリッシャーやお店は、各ユーザにより適切なコンテンツや(買い物等の)リコメンデーションを提供できる。たとえばメールを利用するマーケターは、メッセージを自動的に個人化できる。

Naraの社長に最近任命されたJana Eggersによると、今回の資金は同社の能力拡大に充てられる。“毎日のように顧客や見込み客と、彼らの問題解決のための仕事をしている”、と彼女は言う。“とても嬉しいのは、彼らのニーズと今のうちにできることが、ぴったりマッチしていることだ。だから将来に向かっての拡張にも、まったく無理がない”。

Nara.meのアップデートも今後続くが、Nara.meとプラットホームは一体的な関係があるので、どちらも積極的に開発していく。 Nara.meはプラットホームのアップデートから利益を得るし、プラットホームはNara.meの成長と差別化の経験から利益を得る、ということだ。

同社は資金調達の発表と並行して、MITの神経科学の教授Mriganka Sur*が同社の アドバイサリーボードに加わったことも発表した。〔*: Dr. Mriganka Sur, the Newton Professor of Neuroscience and Director of the Simons Center for the Social Brain at Massachusetts Institute of Technology〕

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


AIにできない部分を人間がどうやって補うのか…デジタルアシスタントが進化してもその部分は存在する

2011年にSiriがiOSに登場してから、聞けば何でも答えてくれるデジタルアシスタントは大手スマートフォンプラットホームの共通の大課題になってきた。

AppleがそのAIコンパニオン(Siri)を出してから1年も経たないのに、GoogleはGoogle Nowでそれに続いた。それは、ユーザの位置やメールの受信箱やそれまでのトラフィックの履歴などに基づいて、前もっていろんな通知をくれるサービスだ。

そして今年はMicrosoftが同社のBuildカンファレンスで、スマートアシスタントCortanaを発表した。その名前は、HaloゲームのXbox上のフランチャイズに登場するAIの名前を借りている。Microsoftによると、Cortanaはまるでユーザの秘書のように、あるいはこれから帰宅するとき妻にあれこれ用事を電話するどこかの旦那のように、忘れてはならないことを間に合うタイミングで事前に思い出させてくれるAIサービスだ。

彼らは今日のフライトに間に合うためにはいつもより15分早く退社しろ、と教えてくれるお利口さんだし、SiriやCortanaはときどきジョークも言うが、これらのアシスタントたちには明らかに限界がある。Siriはリマインダーだが、ユーザ自身による会議のスケジューリングを助けてくれない。Google Nowは近くのレストランを教えてくれるが、ユーザの好きな席のテーブルを予約できない。

Fancy HandsJarvisのような、有料のデジタルアシスタントもある。毎月の料金を払うと、これらのサービスは、SiriやCortanaを出来損ないアプリのアルファバージョンかと思わせるほど、見事にユーザのリクエストに応える。



〔ここにスライドが表示されないときは、原文を見てください。〕

これらのアシスタントは、どうやってこれほど高度な仕事をやっているのか? Jarvisはユーザが好きな食べ物を知っているのか? ユーザが乗れるフライトを探すときは、ユーザのスケジュールを秘かに見ているのか? 定型メールを送っているだけなのに、リアルな対話っぽいやりとりができるのか?

たしかにそうだが、でもそれは、彼らのAI技術が人知れず高度だからではない。彼らは、デジタルアシスタントのTaskRabbit(人力便利屋)を作ったのだ。リクエストを送るとその先には、学卒の労働者がコンピュータの端末の前に座っていて、ユーザのオフィスの近くにおいしい食べ物屋さんを探したり、価格比較サービスを利用してフライトを見つけたりしている。

今のWebアプリケーションがどんなに便利でも、仕事先の人を接待する店をYelpで探すのはかなりの手間だ。候補が多くてなかなか決められない人もいる。でも、これらの有料デジタルアシスタントのユーザたちに話を聞いてみると、そういうとき候補を三つか四つしか言わないので、決めやすいということだ。退屈で些細な仕事は誰かにやらせたい。ふつうの人たちにとって、その誰かが100%コンピュータのプログラムでなければならないことはない。

数年後には、これらのタスクもソフトウェアがやるようになるだろう。AppleもGoogleもMicrosoftも、現状の技術に納得してはいない。また、Siriの作者などが作った新しい企業は、ユーザの好きなアプリをすべて知ることにより、ユーザが抱える状況をある程度理解した上でアシストを提供するサービスを、提供しようとしている。

でもそれまでは、人間がまるで機械の中の歯車のように、これらのサービスにはめ込まれている、という面白い光景がある。ユーザにとってのインタフェイスは、人間というより、まるっきりアプリのそれだ。Jarvisはテキストメッセージングやメールを使うから、Siriのメッセージング機能からでも利用できる。データも、上の画像で見られるとおり、人の言葉というよりもコンピュータの出力だ。しかし複雑なコンテキストを解析したり、単純なリクエストからそのコンテキストを理解することは、コンピュータにとって何年も先の話だ。

でもそんなテクノロジがやってきたら、これらの人力サービスはなくなるのだろうか? それとも、そのときはまた、コンピュータには対応できない分野を見つけてサービスを続けるのか? たとえば、毎日忙しくてやるべきことが多すぎる人や、仕事の内容やニュアンスをコンピュータが得意とするシンプルで単純な言葉では表現できない職種の人は、相当進化したAIアシスタントにもやはり、不満を感じるかもしれない。コンピュータの前に座る人間労働者は、AIも道具として使いながら、今よりも多くの仕事をこなせるようになっている、のかもしれない。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


GoogleがDeepMindを買ったのは人間の心を持つコンピュータを作るため

Googleは、かつてチェスの天才少年と呼ばれたイギリスのDemis Hassabisが創業したDeepMindの買収に、少なくとも5億ドルを投じたらしい。この、すでに多くの高名な投資家たちが支援している人工知能企業には、コンピュータが人間のプレイヤーとまったく同じようにビデオゲームをプレイするデモがある。Facebookも同社を買おうとしたらしいが、でも、それはなぜだろう?

コンピューティングが知能を持てば持つほど、より意味のあるデータの収集と分析が可能だ。これまでのコンピュータでも情報を集めたり、それらを互いに比較して、誰の目にも明らかと思えるような結論を導くことはできた。でも、データの中にもっと深い意味を見つけるためには人間のアナリストが必要で、毎日殺到する大量無差別な消費者情報の選り分けや解読は、今はまだ人間にしかできない。

しかしGoogleなどの企業は今すでに、AIと機械学習を利用してなるべく良いデータを効率的に集めることができる。Googleは今、その技術の延長として、物のインターネットをコンパニオン(人間的アシスタント)のインターネットに変えようとしている。Googleが注力しているのは、人間の生活の多くの部分をコンピュータが支えるようになることだ。車を運転手不要にし、荷物の配達のような機械的な仕事はヒューマノイド(人型ロボット)にやらせる。ただし、このような、生活の細部へのコンピュータの浸透は、良質なインタフェイスが実現のための最重要な鍵だ。

Googleはすでに、人間のニーズを先読みして身の回りの世話をする技術の開発に取り組んでいる。たとえばGoogle NowはユーザのGmailの情報や検索履歴を解析して、そのユーザが次に何を求めるかを予測し、必要な情報を前もって提供する。Nowは、そんなデータが溜まれば溜まるほど賢くなるが、まだまだ改良の余地は大きい。人間のニーズを先読みするのは、その人のことをよく知っている人間がいちばん得意だから、Googleとしてはコンピュータをそんな人の脳に近づけなければならない。

Googleの未来戦略には、ハードウェアへの関与も含まれている。今月の初めには、超大型の買収として、Nest Labsを32億ドルで買った。Nestの電脳温度計も、大量の機械学習アルゴリズムを動員して人間ユーザのスケジュールやニーズを先読みするが、DeepMindの技術は、そういうソフトウェアの技術基盤をより強力に、そして、深くする。より一般的には、物のインターネットは人間が介在すればより良質になり使いやすくなるのが当然だから、それを、人間ではなく人間に近いコンピュータで代替していくのが、Googleが考えている未来の戦略だ。

DeepMindもビデオゲームをプレイするコンピュータ以上のものをまだ見せてはいないが、しかしGoogleが同社から買ったのは、個別機能ではなく総合機能としての人工知能技術だ。Googleもこれまでに、さまざまなロボット関連の技術に投資しているが、人間の脳には個々の機能を必要に応じて適宜組み合わせる総合力がある。そしてGoogleがDeepMindに期待したのは、このような、総合化能力のあるAI、言い換えると、まるで人間のようなコンピュータだ。個々の、思わず感心してしまうような技術革新(イノベーション)と、人間の日常生活の中のさまざまな情報ニーズや用件ニーズとのあいだには、現状では大きな落差がある。DeepMindの技術は、その落差を填めるものとして期待されている。それを一言で言えば、テクノロジの人間化だ。未来のテクノロジは、非人間的で機械的な技術、人間が持つ細かい意味の差異やニュアンスを理解できない技術、という汚名を返上するものでなければならない。これまでの画一的で大刻みなAI技術では、自動運転車は非人間的どころか、往々にして反人間的に振る舞ったりもするだろう。自動運転カーを売りたいGoogleとしては、それでは困る。

噂ではGoogleは、DeepMindのAI技術を利用する際の社内規則を確立するために、倫理委員会を作ったと言われる。将来のGoogleでSkyNetのようなものが作られてしまうとは、Google自身も思っていないだろうが、コンピュータが人間に近くなれば当然、モラルの領域に入り込む。コンピュータがユーザである人間について知っていてもよいことは何々か。また、人間に近いコンピュータを使う人間の責任範囲はどこまでか。とくにこの二つが難問になるだろう。

Googleという企業をどう見るかによって、DeepMindの買収は心配であったり、エキサイティングであったりする。その両方、という人もいるだろう。AIや機械学習には元々、そんな二面性がある。でも、最近になってGoogleが次々と打ち出した未来志向の大きな戦略の中では、これがいちばん、ぼくらミーハーにとって魅惑的と言えるんじゃないか。子どものころ読みふけった人気SF小説の世界にいちばん近いし、また、それがもたらすかもしれないものの数々は、どれも、そそられるものばかりだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))