MicrosoftがAIで入力予測をするキーボードアプリ「Swiftkey」を2億5000万ドルで買収

cm-founders

Microsoftはロンドンに拠点を置くSwiftkeyを買収する計画のようだ。Swiftkeyは人工知能でキーボード入力を予測し、革新的なスマホのキーボード入力を開発した。The Financial Timesの報道によると、買収額は「2億5000万ドル付近」としている。TechCrunchは、この金額をちょっと下回るくらいと認識している。更新情報:投資家の情報筋によると、今回の取引は全て現金で行われ、確定しているものだそうだ。近い内に発表があるという。

両社はここ数ヶ月間、話し合いを重ねてきたと聞いている。Swiftkeyのスタッフは、今日買収について聞いたそうだ。Swiftkeyはコメントを控えている。

Swiftkeyは、これまで合計2159万ドルをOctopus Ventures、Index Venturesらから調達している。イギリスのセレブStephen Fryもエンジェル投資家として初期から投資していた。

SwiftkeyキーボードとそのSDKは現在5億台以上のAndroidとiOSのスマホで使用されているという。このテクノロジーはユーザーにとって大幅な入力の時間短縮に繋がるものだが、AI駆動のプラットフォームはMicrosoftにとってキーボード以上の利用価値がある。このキーボードを支える予測エンジンは他にも応用が効くだろう。

さらに、Swiftkeyのスタッフ、ファウンダーのBen Medlock博士(CTO)とJon Reynolds (CEO)を獲得することで、最先端のAIを開発する尖ったチームを手に入れることができる。彼らはスティーブン・ホーキング博士が使用するコミュニケーションシステムを改良するプロジェクトにも取り組み、かの有名科学者からその技術を賞賛された。

Swiftkeyの使い方は下の動画で見ることができる。

[原文へ]

(翻訳:Nozomi Okuma /Website/ twitter

「人工知能」の新時代到来か。欧州囲碁チャンピオンがコンピューター相手に5戦5敗

8297692520_1993250e99_o

史上初めて、コンピューターがプロ囲碁棋士を破った。中国出身でフランスで碁を打っているファン・フイに対して勝利をおさめたのだ。人工知能およびニューラルネットワークが新たな段階に到達したことを意味するできごとだといえる。囲碁でプロを破るのはまだまだ先の話だと思われていたのだ。

GoogleのDeepMindが産んだAlphaGoは、IBMのチェスマシンであるディープ・ブルーと比べても相当に洗練されているようだ。私たちは真に役立つ人工知能が誕生する時代に立ち会っているということなのかもしれない。

ちなみに囲碁とは、2名で行う盤上のゲームのことだ。ルールはシンプルながら、2500年の歴史を経ても未だに最善手の追求がなされている。

1手打つたびに、そこには数百もの選択肢がある。自分の地(陣地)を作るために、もっともエレガントな筋を発見しようとするゲームだともいえる。チェスなどと比べても選択する着手の幅がはるかに広いゲームなのだ。ゲームをすすめる上で、自らの個性を働かせる余地が大きいということもできよう。

私が囲碁について学んだのは15年ほど前のことになる。当時は素人の私ですら「最強」の囲碁ソフトを負かすことができた。もちろん私がうまかったわけではない。囲碁プログラムはほんの少し前までそのようなレベルにあったのだ。そうであるからこそ、このたびのニュースが世界中の囲碁ファンならびに関係者を驚かせているのだ。

GoogleやFacebookのみならず、さまざまな企業が将来を見据えてAI分野の研究開発を行なっている。顔認識、自動運転カー、Google Now、Facebook MessengerのMなど、さまざまなアプリケーションが登場しつつある。しかしそれだけでなく、各社ともに今後のAIの可能性を探るさまざまなプロジェクト(囲碁プログラムなどもそのひとつだ)を進めているのだ。

そのような中で、ともかく現状ではAlphaGoが一歩抜きん出た成果をおさめたということができると思う。ニューラルネットワークを利用して、モンテカルロ法を活用した効率的着手選択を行う。外部から取得するアルゴリズムやデータをうまく活用するのもDeepMindの特徴であると言われている。

簡単にいえば、AlphaGoは時間を経るに従って学習を積み重ねていくのだ。経験値をあげるほどに、より強くなっていく。自分を相手に対局することですら、実力を上げていくことができるのだ。

DeepMindは欧州囲碁チャンピオンのファン・フイを相手に5局対局し、そのすべてで勝利を収めた。そして3月には、世界最高のプレイヤーのひとりである李世ドルを相手に対局する予定ともなっている。すでに「李世ドルに勝てるか」が問題になるのではなく、「李世ドルをいつ破るのか」という段階に入っていると見るべきなのかもしれない。

Twitterにも投稿したように、ある点では、猿の時代から引き継いできた脳みそと、コンピューター・プログラムの差は小さくなってきているのだろう。「ハイテク」と呼ばれていたものが、たんに「テクノロジー」と呼ばれるようになったのと同様、「人工知能」は間もなく「知能」と呼ばれ区別されなくなる時代がくるのかもしれない。

原文へ

(翻訳:Maeda, H

未来の高度な人工知能技術の私蔵化を防ぐ非営利団体OpenAIがそうそうたる創立メンバーでスタート

artificial-intelligence-503592_1920

今日(米国時間12/11)、非営利の人工知能研究団体OpenAIの創立が発表された。そのトップは、Googleの研究員Ilya Sutskeverだ。前日には、Facebookが同社のAIハードウェアをオープンソース化した。

その存在理由は、こう説明されている:

目標はデジタルインテリジェンスの高度化をできるかぎり人類全体の利益に資する形で推進すること。それが、経済的(financial)な利益目的に制約されないことだ。

グローバルな支払い決済サービスStripeのCTOだったGreg Brockmanが、OpenAIのCTOになる。このほか多くの著名人が名を連ねており、中でもY CombinatorのSam Altmanと
Tesla/SpaceXのElon Muskが共同で理事長になる:

この団体の創立メンバーは、世界のトップクラスのリサーチエンジニアとサイエンティストである: Trevor Blackwell, Vicki Cheung, Andrej Karpathy, Durk Kingma, John Schulman, Pamela Vagata, そしてWojciech Zaremba。Pieter Abbeel, Yoshua Bengio, Alan Kay, Sergey Levine, およびVishal Sikkaはアドバイザーとなる。OpenAIの共同理事長は、Sam AltmanとElon Muskだ。

資金提供者は、Altman, Brockman, Musk, Jessica Livingston, Peter Theil, Amazon Web Services, Infosysおよび YC Researchで、寄付額の合計は10億ドルだ。Muskが公共的なAI研究に出資するのは、AIがSkynetになってしまうのを防ぐため、といわれる。OpenAIへの出資や理事長就任も、そのねらいの延長だろう。

[原文へ]。
(翻訳:iwatani(a.k.a. hiwa)。

今ある人工知能に取り組む企業の分類

humanrobotoverlap


編集部記Shivon Zilisは、Crunch Networkのコントリビューターである。Shivon ZilisはBloomberg Betaの投資家である。

私はここ数年、人工知能の分野に注目してきた。何百人もの起業家、研究者、投資家と機械がどのように私たちの生活を賢くするかについて話をした。

以前私が人工知能関連企業の状況を共有したところ、人工知能の企業をどう捉えているのかと多くの人に尋ねられるようになった。彼らも多かれ少なかれ同じことに関心があるようだ。(1997年にはこのような雰囲気で「ドットコム」の話をしていたのかもしれない。)

多くの人はこの技術が世に解き放たれた時には、人はどのように関わるべきなのかを知りたいようだ。この記事では、人工知能企業が採用している手法だけでなく、市場との関わりについても考察したい。

各分野の企業と市場への参入の違いについて説明するのに、私はそれぞれのカテゴリーに自分にとって分かりやすい愛称を付けていて。最終的に便利であることが判明したので、それについても少し詳しく記した。あなたが自分の会社を説明する際、何か愛称が必要になった時の参考になるかもしれない。

以下のカテゴリーは厳密なものではない。人工知能は複雑な分野だ。しかし、このフレームワークは私たちのファンド(良い結果が出すことが予想される会社に投資している)で、人工知能企業について深く考察し、彼らと関わる上で役立っている。

広範なデータセットを収集する「パノプティコン」

人工知能はコンピューターが分析するデータから始まる。私が「パノプティコン」と呼ぶタイプの企業は、重要な新規のデータセットを大量に揃える企業だ。確立したビジネスは自然とグローバル展開する傾向がある。Planet Labsのような企業を表すのに「グローバル」という言葉はぴったりだ。彼らは、物理的に地球の軌道に衛星を飛ばしている。一方でPremiseのような企業の場合「グローバル」の意味は比喩的なもになる。彼らは多くの国からデータをクラウドソースで収集している。

これらの新しいデータセットを多く集めることで、私たちはこれまで答えを出すのに苦戦していた課題に対して、自動で答えを得ることができるようになる。この分野に参入するには巨大な障壁がある。重要なデータセットを世界規模で収集するのは大変困難だからだ。

人工知能の分野はとても活発だ。

しかし、彼らは他に安価で代わりとなるような「十分に良い」データセットはないかと問う必要があるだろう。データライセンスビジネスは、コモディティ化するリスクにあるからだ。この分野を目指す企業は「十分に良い」ような代わりとなるデータを集めることができたり、しようとする他社がいないこと、そして自社のデータセットとエンドユーザーを活用するための知的なレイヤーを得ることができるかを検討すべきだろう。

この領域の企業例:Planet Labs、Premise、Diffbotなど。

「レーザー」は特定のデータセットを収集する

私が「レーザー」と呼ぶ企業も新しいデータセットを構築しているが、それらのデータはニッチで、特定の業界の課題解決のためにレーザーのように的を絞って活動している。この分野で成功している企業はデータセット以上のものを提供している。彼らは自社でアルゴリズムとユーザーインターフェイスを保有している。彼らはより対象を絞った初期ユーザーの獲得することに注力していて、カスタマーを獲得するためにはデータ以上の価値を彼らに提供しなければならない。

彼らのプロダクトはユーザーの特定の課題に対して瞬時に答えを出す。例えば「どのくらい作物に水を与えるべきか?」や「どの申込者がローンの適格者か?」などだ。このカテゴリーから数百という数多くの企業が生まれるだろう。何故なら、彼らはビジネスの価値をすぐに生み出せるからだ。

このテクノロジーで初めて多くの業界は意思決定をデータドリブンな方法で行うことができるようになる。世界を良い方向に進める力は強力だ。すでにこのテクノロジーは、世界の食糧事情を効率的にする助けになり、医療診断を改善し、自然保護プロジェクトを推進し、貸付を行えなかった人にそのアクセスを提供した。

しかしこの分野の企業が成功するには、何か一つ課題を解決する「必殺(良い意味で)」のユースケースが必要で、ユーザーの仕事を増やすのではなく、シンプルにする解決法を提案しなければならない。

この領域の企業例: Tule Technologies, Enlitic、InVenture、Conservation Metrics、Red Bird、Mavrx、Watson Healthなど。

データを金塊に変えることを約束する「アルケミスト」

この領域の企業のピッチは分かりやすいものだろう。「あなたのデータを見せてください。金塊にして返します。」彼らは自社のデータセットを構築するのではなく、重厚なアルゴリズムを持ってカスタマーのデータを磨き、知見を得る。彼らはさらに3種類に分けられる。

  1. セルスサービス型APIベースのソリューション
  2. カスタマーの既存のスタック上で解析するサービス・プロバイダー
  3. 自社のハードウェアに最適化したスタックによるフルスタックのソリューション

アルケミストは様々なデータ型を横断的に見るため、早くから強力な人工知能を活用できるようになるかもしれない。彼らがハンズオンでカスタマーの課題解決を行うなら(コンサルティングサービスと共に行う場合など)、彼らは信頼の置けるパートナーになるだろう。

「あなたのデータを見せてください。金塊にして返します。」

しかし、気をつけるべきこともある。この業界は誕生したばかりだ。APIベースのアプローチを採用している企業は、まだ小さいユーザーベースの中でしか収益を得ることができず、スケールの問題に直面するかもしれない。多くのセルフサービス型の企業は、その壁を避けるためによりハンズオン型のモデルへと移行している。(また、人に重きを置くコンサルティングサービスもスケールするのが難しい場合もある。)

この領域の企業例:Nervana Systems、Context Relevant、IBM Watson、Metamind、AlchemyAPI(IBM Watsonが買収)、 Skymind、Lucid.ai、Citrineなど。

特定のデータ型から新しいユースケースを作り出す「ゲートウェイ」

この領域の企業は、法人がこれまで分析の難しかったデータ型から知見を得ることを可能にする。例えば、画像、音声、動画、ゲノム情報などだ。彼らは、自社でデータを収集するのではなく、クライアントのデータやサードパーティーのデータプロバイダーと協力する傾向にある。アルケミストはどちらかというと様々なデータの種類やユースケースにまたがって分析を行うが、ゲートウェイは専門的である。

ここで最も期待できることは、真に新しい知見が得られることだ。法人はこれまでもこのようなデータを保有していたが、保存していなかったり、それらの情報を経済的に解析することができなかった。それらの「失われた」データを今後は活用することができる。

それでも「それが何?」問題には気をつけた方が良いだろう。情報から新たな知見を抽出する方法を手に入れたからといってそれが価値のあるものであるとは限らない。解くべき課題の解決を目指していた企業が、手段という魔法に惑わされるところを何回か見てきた。彼らは資金調達で苦戦することになる。

この領域の企業例: Clarifai、Gridspace、Orbital Insight、Descartes Labs、Deep Genomics、Atomwiseなど。

ワークフローを遅滞なく改善する「魔法の杖」

彼らは仕事を効果的にするSaaSツールだ。データから知見を抽出するだけでなく、そこで得た知見を毎日のワークフローにスムーズに統合する方法を提供する。人工知能によるアシスタントはまるで「魔法」のように感じる新たなレベルを創出する。彼らは、レーザーと似ていて、ユーザーの特定の課題解決を助けるインターフェイスを持っている。しかし、彼らは自社でゼロから新しいデータセットを作るのではなく、ユーザーや法人のデータを必要とする傾向にある。

例えば、Textioは人材採用の募集要項の改善点を提案するテキストエディターだ。タイプしながら改善点を解析する。Textioを使用すると、人工知能アルゴリズムによる丁寧な提案によって完成度の低い求人情報を数分で格段に良くすることができる。

このようなツールに依存するリスクは、人が専門性を失うということだろう。

私はこれから5年の間に様々なユースケースでこのようなツールを使用することになるだろうと考えている。分野が限定されたデータを基にコーディングされた提案によりユーザーを瞬時に専門家に変えるようなものだ。彼らは知識を集約し、誰にも気づかれずにプロダクトに埋め込むことができる。この領域が加速し、魔法の杖が増えることに期待したい。

このようなツールに依存するリスクは、人が専門性を失うということだろう。(オートパイロット機能が飛行士の重要なスキルを低減するのと同じリスクだ。)そのリスクを回避するには、プロダクトを製作する側が、ユーザーの知識を置き換えるのではなく、強化できるようなUIを作ることだ。(例えばユーザーに提案するプロセスでユーザーを教育したり、ダブルブラインドのインターフェイスを採用することが考えられる。)

この領域の企業例: Textio、RelateIQ (Salesforceが買収)、InboxVudu、Sigopt 、The Gridなど。

物理世界で自立システムを構築する「ナビゲーター」

人工知能は、自動運転車、ドローン、倉庫や農場、高齢者介護などで手伝うロボットのような自立システムを実現するのに大きな役割を担っている。このカテゴリーには現在、アーリーステージの企業とGoogle、Apple、Uber、Amazonといった大手の確立した企業が混ざって存在している。

このテクノロジーは私たちに交通や物流を一から考え直す力を与える。特に頑強な物理インフラが整っていない新興市場の国に関係するだろう。また、これまで人間には危険だった作業もこのテクノロジーで行うことができる。

このようなテクノロジーの開発に本腰を入れる前に、企業は大量の資金を調達でき、最も需要の多い分野での最高峰の能力を持つ人を採用できるかどうかを検討した方が良いだろう。この領域の課題を解決するためには、ハードウェア、ロボティクス、映像、音響といった多様な分野の専門家が必要となる。また、厳しい法規制というハードルも超えなければならない(自動運転車の法規制など)。

この領域の企業例: Blue River Technologies、Airware、Clearpath Robotics、Kiva Systems (Amazonが買収)、3DR、Skycatch、Cruise Automation、Googleの自動運転車グループ、Uber、Apple、Teslaなど。

仮想タスクを手伝うサイボーグやボットを作る「エージェント」

人工知能を最も効果的に使うには、人の知能と組み合わせることが良い場合もある。サイボーグとボットはタスクを実行する手伝いをするという意味では似ているが、違いはサイボーグは人に似せているということだ。(裏では人の知能と機械学習を組み合わせている。名前があり、実際に人が関わるのと同じように人と関わろうとする。)一方でボットは人間ではなく、人がガイダンスを提供することで指示に従って行動することができる。

人工知能を最も効果的に使うには、人の知能と組み合わせることが良い場合もある。

サイボーグは複雑なタスクを実行することができる場合が多いだろう。例えば、リアルタイムのチャットでカスタマーサービスを行うことや、メールでミーティングをスケジューリングしたりすることだ。(Clara LabsのClaraや x.aiのAmyのように)ボットは基本的な調査、オンライン決済を実行したり、タスクを滞りなく管理するための手伝いを提供する(Howdyのようなプロジェクト管理ボットなど)。

どちらの場合も、人と機械の良い部分を合わせている。コンピューターはタスクの中の通信が必要なつまらない作業を行い、人は意思決定やクリエイティブな作業を行って互いにやりとりをする。

サイボーグベースの企業の多くはマニュアル的なサービスとして始まっているが、テクノロジーが成熟するほど機械が主導するようになるだろう。人が機械への移行を早期に受け入れられるかどうかがリスクとして捉えることができる。サイボーグでもボットでも、私たちが重要なデータ(カレンダー、メール、書類、クレジットカードなどの情報)を機械を預けるようになるほどプライバシーとセキュリティーは今後も重要な懸念材料となる。

この領域の企業例: Clara、x.ai、Facebook M、Digital Genius、KasistoとHowdyなど。

抜群に賢い「パイオニア」

いくつかの人工知能の企業は、学術的なプロジェクトとして始まっている。専門分野での経験がある何年もある教授や大学院生のチームが何か市場に出せるものを発見した時、彼ら(あるいは大学)は企業に転身する。

このようなチームは解決するのが不可能に思える課題に取り組んでいるだろう。

そのように集まったチームはマーケット戦略としても良い。何故なら、この分野で8年から10年もの経験がある人はほんの少数だからだ。彼らの知見は非常に価値が高く、多少ビジネスモデルを磨き上げる必要があったとしても、チームの構成だけで投資するリスクを負っても良いと考える投資家もいるだろう。

直近考えられる人工知能のユースケース以外にも非常に重要な解決すべき課題も多くある。このようなチームは解決するのが不可能に思える課題に取り組んでいるだろう。彼らはその問題を潜在的に解くことができる数少ない人たちなのだ!

このアプローチは、本当に追究したい課題に取り掛かっているなら素晴らしい仕事を成し遂げることができるだろう。しかし、連帯するためだけに人が集まっている組織やアクハイヤー目的の場合だとチームの団結が難しくなる。また、彼らの長期的な目標を理解する投資家も必要だ。

この領域の企業例:DeepMind (acquired by Google), DNN Research (Googleが買収)、Numenta、Vicarious、NNaiSense、Curious AIなど。

人工知能はとても活発な分野だということが分かったと思う。市場には一つのカテゴリーにあてはまらない企業もあるだろう。ただ、私が見てきた中ではこれらのカテゴリーにあてはまる企業が多いと言える。

次の明確な質問は、これらの中で最も投資家を惹きつけるカテゴリーがどれかということだろう。個別のスタートアップはその性質上、はっきりと断定することはできない。そして多くの人は人工知能の分野の成長に期待していて、どのカテゴリーにしても楽観的な見方の度合いが多少違うくらいだと言えるだろう。個人的には特に「レーザー」と「魔法の杖」のカテゴリーに注目している。何故なら、これらは今すぐにでも新しいデータ型から次の行動につなげることのできる知見を導き出し、十分に浸透したSaaSのテクニックを有効活用することができるからだ。

それにはついてはまた書きたいと思う。乞うご期待。

開示情報: Bloomberg Beta はDiffbot、Tule Technologies、Mavrx、Gridspace、Orbital Insight、Textio、Howdyや記事には登場していない人工知能企業にも投資をしている。

[原文へ]

(翻訳:Nozomi Okuma /Website/ twitter

メッセージングアプリでコンピュータサイエンスおたくがデザイン偏重のWebに復讐する

chatapps

[筆者: Indus Khaitan](Oracleに買収されたエンタプライズモバイルのBitzer Mobileの協同ファウンダ。その前はソーシャルメディアのコンテンツ発見プラットホームSezWhoのCTO。)

初期のWebサイトは単純なHTMLだった。長いHTML文が何でも表現し、左右対称のページレイアウトが好まれた。CSSがなかったので、今日のように、HTMLのコードが三次元的に肥大することはなかった。ぼくは最初からCSSが嫌いで、今でも大嫌いだ。

敬愛すると同時に憎たらしくもあるデザイナーたちが、ぼくのWebを乗っ取ってしまった。彼らは、ぼくのシンプルなHTMLのコードを、CSSとJavaScriptの煮えたぎるマグマの中に放り込んだ。Webサーバ以外の部分では、元々デザイナーだった友だちの多くが、Webデベロッパやアプリのデベロッパになった。

しかしぼくは、あくまでもコンピュータサイエンスのエンジニアなので、Webデザインという軽薄なアートに手を染めることはなかった。その代わり、お金を払った。たくさんのお金を、Webデザイナーたちに払った。

Webのフロントエンドの開発は、今や混乱のきわみだ。フォームの記入欄を表示するといった簡単なことでも、10とおり以上ものやり方がある。そしてそれらのやり方は標準性がなく、どれもばらばらだ。ささやかなHTMLをCSSで粉飾し、それにJavaScriptを加えてページを100%混乱させる。言うまでもなく、同じマークアップコードを複数のJavaScriptフレームワークが管理していると、混乱は倍増する。もっとひどいのは、複数のデベロッパが触ったページだ。それは、複数の外科医が昼休みにバーガーを食いながら手術をした患者の体になる。

モバイルアプリともなると、デザイナーへの依存度がWebの10倍になる。さまざまな画面サイズや、解像度、ボタン、画像、それらと絡み合うテキスト…これらを管理しなければならない。そしてルックスがすべてに優先するから、関係データベースの湖から流れ出るビットの内面的な美を鑑賞する楽しみは、消え去る。

でも、解脱の時が近づいている。チャットのウィンドウが、新しいユーザインタフェイスになりつつある。エージェント(人間またはマシン)と会話をする、仕事はそれだけだ。今日の、ごてごてしたWebページと違って、メッセージングアプリにはマークアップがなくて、テキストをネットワークに乗せるだけだ。Human Computer Interaction(HCI)の理論は、人間の日常の動作に倣え、と教える。メッセージングアプリなら、それが可能だ。

チャットでコンピュータサイエンスが再び輝きを取り戻す。

メッセージングアプリは今でも、新種が続々出ている。Magic, GoButler and Operatorなどなど、WeChatの成功の後を追うアジア製が多い。いずれも単純なテキストメッセージをやりとりするだけがアプリの仕事だが、料理の注文も、タクシーの呼び出しも、航空券の予約も、何でもできる。どれも人間の生活を助ける人間コンシェルジュが相手だが、中には人間とマシンの対話もある。後者の場合でもしかし、人間の日常の会話を真似ている。人間がエージェント(人間または機械)に話しかける。向こうにいる人間またはマシンがメニューを説明し、配達してほしい品物の購入トランザクションが完了する。

チャットでコンピュータサイエンスが再び輝きを取り戻す。Webページやアプリの画面で、何をどこに置こうか考えるのではなく、チャットアプリでは、機械学習やデータ構造をめぐって本物のイノベーションが起きている。単純なテキストによる会話が定型データへと整理され、JSONのペイロードを介してどこかのAPIに投入される。

今日では、アプリの多くを人間がサポートしている。ときには、人間の大群が。でも彼らの仕事には、機械学習の技術が使いやすくなったために、完全に自動化できるものが多い。たとえば、誰でも使える機械学習エンジンIBM Watsonをベースとして、(Facebookが買収した)wit.aiのような新進スタートアップが続々登場している。Y Combinatorの傘下にも、MonkeyLearnのような機械学習大衆化サービス、AIaaS(artificial intelligence-as-a-service)が増えているという。

機械学習をクラウドサービスとして使えるようになり、メッセージングがユーザインタフェイスになれば、今や時代は再び、コンピュータサイエンスおたく(nerd)のものだ。メッセージングアプリによって、今日のWebページが陥(おちい)ってしまった軽佻浮薄なフレームワークにおさらばできる。そして、人間と機械の対話の、単純性を取り戻せるのだ。

[原文へ]。
(翻訳:iwatani(a.k.a. hiwa)。

イギリスのYears & YearsがGoogleのニューラルネット技術DeepDreamを使った幻覚的音楽ビデオを制作

数か月前にGoogleがリリースしたDeepDreamは、ニューラルネットワークの技術を利用して既存のビデオから幻覚的な映像を作り出す、オープンソースのツールだ。Googleは長年、画像認識や発話認識のためにソフトウェアによる人工ニューラルネットを研究しているが、今度登場したのは、初めての、DeepDreamで加工された音楽ビデオだ。

それはイギリスのエレクトロニックポップグループYears & Yearsの最新シングル”Desire”のリミックスのビデオで、元の荒涼とした映像にDeepDreamによる狂ったような効果が、うまく加わっていておもしろい。

Years & YearsのリーダーOlly Alexanderは、こう言ってる、“音楽ビデオにAIを使うことは、おもしろいと思っただけでなく、(いい意味で)ちょっと怖いとも思った。最先端の技術に触れたことは嬉しかったし、このクレージーな映像を、ぼくらだけでなく、ファンにも楽しんでもらいたいと思う”。

監督のBrian Harrisonによると、それは撮影にカリフォルニア南部の複数の場所(Montaña de Oro州立公園など)で4日もかけた労作だ。編集の終わったビデオをArtificial ExperienceのエンジニアSamim WinigerとRoelof Pietersに渡し、一緒に加工を行った。その過程で新しいビデオ編集ソフトが生まれ、それをDeepUIと名づけた。それは今回のような映像加工工程をガイドし助けてくれるソフトウェアだ。

Harrisonは最初この技術を知ったとき、クールだ、と思っただけだが、深入りするにつれて、これは新しい映像アート技術の誕生だ、と思うようになった。“まるで、マシンが意識を持って、夢を見たり、想像したりしているようだ。今回ささやかながら、新しいアート技術の誕生に貢献できたことが、嬉しい”、と彼は語る。

Years & Yearsのデビューアルバム”Communion”は、Interscope Recordsから出ている。

[原文へ]。
(翻訳:iwatani(a.k.a. hiwa)。

InboxのSmart Replyはユーザーに代わって着信Gmailに返信する―Googleの機械学習は進歩中

2015-11-04-gmail-inbox-logo

一部では「メールはもう死んだ、次第に滅びるだけだ」と考えられているらしい。しかしGoogleはそう考えていない。高度な機械学習と人工知能テクノロジーをinboxに適用してメールを大きく進歩させようとしている。

Inboxは言うまでもなくGmaiをベースにしたメール・クライアントだが、今回の改良で人々がコミュニケーションを図る方法が改善され、いわばメール体験の効率性を測定するバーが跳ね上がった。今日(米国時間11/3)、Googleが公開したSmart Replyはユーザーに代わって自動的に返事をするテクノロジーで、同社としてInboxに対する最大のアップデートの一つだろう。

Googleによれば、Smart Replyは今週中に一般に利用できるようになるという。機能は概ねこうだ。ユーザーがメールを受け取ると、Smart Replyがその内容を「読む」。そして内容に応じて、予め設定されている3種類の基本的な返信の一つを選んで送信する。返信内容は画面下部に表示される。

smartreply1

Googlesでこのサービスの開発を担当したエンジニアのBálint Miklósは次のように説明する。「メールの返信をいささか貯めこんでしまうユーザーの場合、Smart Replyはコミュニケーションをたちどころに大きく加速させる。ユーザーは即刻返信のメールを出すことができる」。

「たちどころの加速」の秘密はInboxに設定された短い自動返信メッセージだ。これがSmart Replyの処理の入り口となる。

このアプリはまた使用するにしたがって自ら「学習」する。もしX氏が開発したプロダクトに関する情報をメールで送ってきたとき、ユーザーが何も介入しなければシステムは自動的に「さらに詳しい情報を送ってください」という短いメッセージを返信する。 以後同じ人物から製品情報が送られてきた場合、Inboxはユーザーにいちいちオプションを表示することなく、同じメッセージを(繰り返し)返信することになるだろう。

受信トレイの混雑を解消しようというのは他にも多くのアプリが試みているが、Smart ReplyはTL;DRという小さなアプリを思い起こさせた。これは今はシャットダウンされているEverything.meというAndroidのアプリ・ランチャーの共同ファウンダーの一人が開発したもので、読むのに手間を食う長いメールをメッセージアプリのメッセージのように短く要約し、さらに返信の雛形も提示してくれる。

このアプリもSmart Replyもそうだが、重要な点は、一般ユーザーにとって大量のメールの返信をスマートフォン上で書くのが苦痛だという点にある。そこでこの苦痛を軽減するテクノロジーというのは理にかなっている。

今回のSmart Replyは、モバイル・アプリが次第に認識、予測能力を高めていることの証でもある。他の分かりやすい例としてはAppleのSiriや
Google Nowなどがある。また連絡相手がユーザーの付近に来るとその旨表示するLinkedInのアプリもその仲間かもしれない。スマートフォンの小さな画面での大量の入力を省き、ユーザーにアプリを使いやすいものにさせることが大きなトレンドだ。また入力量だけの問題でなく、こうしたアプリはさらに高度な知能を獲得し、われわれを助ける能力も増大している。

もちろん、デベロッパー側ではこうした方向に努力をせざるを得ないという面がある。スマートフォンのホーム画面アプリのアイコンでごった返すようになると、われわれは使いにくいアプリを開かないようになる。それでもすべてのアプリがやがて知能化していくことは大きな流れだろう。

Googleは長年にわたって大量の優秀な人材を機械学習、自然言語処理、人工知能などの開発の分野に投じてきた。その成果が検索やモバイル・アプリを始め各方面に現れている。

その意味で、Smart Replyは単に Inboxの改良と見るべきではないだろう。2015年5月にこうしたテクノロジーに基づくアプリがInbox始め多数公開された。 Googleはその後も予定を通知するリマインダーや旅行を管理するアプリなど、われわれの生活を「助ける」ソフトを多数発表してきた。こうしたアプリはそれぞれささやかな形ではあるが、われわれが「次にどうすべきか」を教えてくれる。Smart Replyの場合、Googleのエンジニアはディープ・ニューラル・ネットワークのテクノロジーを用いている。これはGoogleの音声認識による検索やYouTubeに適切なサムネールを表示する技術の基礎をなすものだ。Smart Replyのテクノロジーに関してはこちらが詳しい

[原文へ]

(翻訳:滑川海彦@Facebook Google+

人工知能に「憎悪」をプログラミングする正当性と倫理的な問題

killerrobot

編集部記Zoltan IstvanはCrunch Networkのコントリビューターである。Zoltan Istvanはフューチャリストで、2016年アメリカ合衆国大統領選挙のトランスヒューマニスト党の候補者である。

ここ数年で多くの人が人工知能(AI)の話をするようになった。SF好きやオタクやGoogleのエンジニアたちだけが口にする話題ではなくなり、私はパーティーやコーヒーショップ、さらには食卓でも人々がAIの話をしているのを聞いた。5歳になる私の娘もタコスラザニアを食べながらAIについて話をしていた。学校で何か面白いことはあった?と聞いたところ、彼女は先生が話したスマートロボットの話と答えたのだ。

知能の探求、それが人間の知能であろうと、人工的な知能であろうと、それは最終的に知識の研究である認識論へと行き着く。初めてAI製作の構想がなされていたその昔、どのように実現するかという議論に認識論が挙がった。この分野で多くの人が疑問に思うことは「人間は自身の意識する知能でさえ理解していないのに、別の意識のある知能を作れるのだろうか?」ということだろう。

慎重に考えるべき問題だ。人間の脳は重量でいうと3ポンド(約1.3kg)程度しかないが、人体の中で最も理解が進んでいない臓器だ。脳では何十億のニューロンが、何百京のつながりを形成している。脳という臓器を完全に理解するのに、まだまだ多くの時間がかかることは間違いないだろう。

科学者は一般的な理解として、人間の意識とは脳内の多くの化学物質が協奏し、プリズムに投影することで認知的な気づきが生まれ、その存在が自分自身だけなく自身の周りの世界にも気づくことができることだとしている。

「人間は自身の意識する知能でさえ理解していないのに、別の意識のある知能を作れるのだろうか?」

意識の重要な鍵は気づきがあると主張する者もいる。フランスの哲学者で数学者のルネ・デカルトは意識への理解の最初のステップとして「我思う、ゆえに我あり」と説いた。しかし、意識を定義するのに、思考だけでは十分ではない。自身の思考を正当化している状態こそが意識の正確な定義に近いだろう。つまり「我に意識があると確信する、ゆえに我あり」というのが近い。

しかし、意識を説明する大枠の理論を探求する私にとって気付きの理論もしっくりくるものではない。私たちはロボットに気づきがあることを教えこむことはできるだろうが、それが「水槽の脳」でないと証明する術を教えることはできない。人間ですらそれはできないのだ。

アレン脳科学研究所のチーフ神経科学者であるChristof Kochは、よりユニークで包括的な意識の仮説を提示している。Kochは、それが動物だろうと、みみずだろうと、そして可能性としてはインターネットでも、複雑な処理システムには意識が発生しうると考えている。

インタビューで意識とは何かと尋ねられた時、Kochは「ウィスコンシン大学のGiulio Tononiが提案している意識の情報統合理論と呼ばれる仮説があります。これは脳や他の複雑なシステムがどの程度統合されているかを数値で示すものです。つまり、そのシステムがどの程度そのシステムを構成するパーツ以上のものであるかを示します。その数値はギリシャ文字のΦで表します。Φは、 仮説上の意識の情報指数です。どんなシステムでも情報統合の数値がゼロでないのなら、それは意識があると言えます。どんな統合でも何かを感じているのです」と話した。

もしKochやTononiが正しいのなら、ある意識が別のある意識と同じようなものであると考えるのは誤りということになる。りんごやオレンジのようにまるで違うものだ。地表に降る雪片がどれも違うように、それぞれの意識を人の意識のように捉えて偏見を持つことに気をつけなければならないだろう。

人間の脳は人体の中で最も理解が進んでいない臓器だ。

このように考えると、人類が機械で製作する最初の独立した超知能は、私たちと全く異なる思考を持ち、行動を取ることが考えられる。あまりに違い過ぎて、人類が超知能を理解したり、超知能が人類を理解することはできないかもしれない。だが、私たちが今後製作するどのAIも、人類の手の届かないデジタル世界の領域を身近なものにするのかもしれない。 映画Her はこのエゴに満ちたコンセプトを見事に視覚化している。もちろん、AIは自分が生きていることを知り、好奇の目で見る人間に囲まれていることに気が付けば、自分自身を停止させしまうこともあるだろう。

何が起きるにしろ、人類学の文化相対主義のコンセプトと同じように、意識も相対主義的に扱う準備を整える必要がある。この理論は、数学、理論、コードといった互いにコミュニケーションが取れる明確な手段が利用できたとしても、それぞれの意識は全く異なるものであると考えるということだ。

人間の考えと意識は実際には狭いものだと考えた時、さらにそれは重要な意味を持つ。人間の知覚のほとんどは、5つの感覚器官から構成されるものであり、それを介して脳が世界を理解している。そして、世界を認識する能力という意味での各感覚器官の精度はそれほど良くないと言える。例えば、私たちの目は世界に降り注ぐ光スペクトラムのわずか 1%程度しか認識することができない。

この理由で、ある意識が別の意識と似通うと考えることに私はあまり賛同できない。どちらかというとKochとTononiが主張するように、意識というものはスペクトラム上に様々な形で存在するのではないかと考えている。

同じ理由でAIが基本的に私たち人類に似通うと信じることに私は気が進まないのだ。AIは私たちの行動を学習し模倣すると推測できる。それも完璧に行うことができるかもしれないが、それでもそれは全く異なる意識だ。模倣は操り人形とそう変わらない。多くの人はそれ以上のことを自分自身と自分自身の意識に望むだろう。もちろんAIのエンジニアも、彼らが意識を与えて目覚めさせようとしている機械とその意識にもそれ以上のことを望んでいる。

しかし私たちは、人類と同様の価値観や考えを持ち、人類と同じ特徴を持つAIを構築しようともしている。全ての人間が共通して持つ意識の特性で、AIにも教えこむべきだと思うものを挙げるとしたら、それは「共感」だ。世界が必要として求めるAIの意識は「共感」の要素を持つだろう。人類はそれを理解し、許容することができる。

しかし一方で、製作した意識が「共感」できるということは、それは好き嫌いも認識できるという意味だ。さらには何かを愛したり、憎んだりすることにもなるだろう。

意識が価値観に基いて判断をするのなら、好き嫌い(あるいは友愛と憎悪)の感覚もシステムの中に組み込むことが必要だ。

それは議論を必要とする。意識が価値観に基いて判断をするのなら、好き嫌い(あるいは友愛と憎悪)の感覚もシステムの中に組み込むことが必要だ。AIが友愛の感情を持つことに特に異論を持つ者はいないだろう。しかし、超知能が憎悪するとなればどうだろうか?あるいは悲しんだり、罪悪感を感じたりしたらどうだろうか?それは議論を呼ぶ内容だ。機械が自立して武器を持てるような時代なら尚更だろう。だが共感を組み込んでいない機械は追従するだけの存在、つまり操り人形を作るということだ。

ニューヨーク工科大学のKevin LaGrandeur博士は少し前に「もし実際に多様なレベルの罪悪感を感じることのできる機械が作れたとしたのなら、私たちは苦しんだり、さらには自殺したりする機械と対峙することになる」と記した。真に強力な人工知能を開発した際には、私たちは苦しむ存在を創造したことに対する倫理的な問題に直面しなければならないかもしれない。

これは難しい問題であることに違いない。私が超知能をこの世界に誕生させようとしているプログラマーを羨ましくは思わないのは、彼らが製作するものは、彼らを含め、常に何かに憎悪を抱いているかもしれないからだ。彼らのプログラミングは、現代の人間と同じような問題を抱える機械仕掛けの知能を世界に送り出すだけなのかもしれない。人類が不安を抱えて意固地になったり、うつや孤独や怒りで苦しんだりするのと同じ様に人工知能も苦しむのかもしれない。

[原文へ]

(翻訳:Nozomi Okuma /Website/ twitter

シンギュラリティに反論する: それはテクノロジの議論の仮装をした宗教だ

marooned-in-realtime

Ray Kurzweilのシンギュラリティ(Singularity)の予言にはすごく違和感を感じたので、以前はそれを批判する記事を本誌のために書こうとしたこともある。シンギュラリティを主張する理論は、テクノロジはその指数関数的な進歩によって、数十年後には想像を絶するほどの高能力に達し、それによって人間とその知覚・感覚、さらに現実が抜本的に変わる、と言う。それは別名、ナードの携挙(Rapture of the Nerds)*とも呼ばれる〔*: 仮訳: コンピュータマニアたちの天国〕。

その記事は結局書かなかったが、それは、いまいましいことに、技術の進歩に関するKurzweilのこれまでの予言がそれほどひどく間違ってはいないからだった。それらはとても強気で、超楽観的で、成長カーブは大げさだが、カーブの形そのものはそんなに荒唐無稽ではない。違和感は感じるけど、予言の内容そのものは、平凡な預言者のそれに比べると、何か感じさせるものがある。

しかし、それではなぜ、シンギュラリティには違和感を覚えるのか?

最大の理由はそれが、技術的理論に仮装した神学的信仰、と思えるからだ。それには、それ自身の有名な‘科学史’もある。今や伝説の数学者/物理学者John von Neumannが発明し、偉大なるSF作家Vernor Vingeが世に広めた。ここで<科学史>をかっこで囲むのは、それがあくまでも信仰の範疇に属するからだ。

確かに今は、テクノロジが指数関数的に進歩している。ムーアの法則は鈍化したとはいえ、今後のコンピュータ化の進展によって、テクノロジ以外の分野も同様に進歩していくだろう。

しかしシンギュラリティの理論は、ムーアの法則のような指数関数的成長が、別の新しい、(彼らにとって都合よいことに)未知の、パラダイムに取って代わられる、と主張する。“古いパラダイムがその必然的限界に近づいたとき新しパラダイムの支配が始まる”、とKurzweilは述べている。過去にもそういうことは何度も起きている、という彼の主張は認めるにしても、しかしいずれにしてもそれは、現状では信仰や信条でしかない。

その、おもしろくて、しかも深さもある主張によると、神の降臨は未来においてもないけれども、われわれ人間自身が必然的に神になるのだ。それは多くの人の脳と心を刺激する、中身の濃い考えだ。人間のすべての知覚や感覚に神性がある、とする考え方は、ぼくも嫌いではない。それは、真理かもしれない! しかしシンギュラリティはまことしやかな宗教であり、信仰の産物ではあっても科学ではない。そう見なすべきだ。

シンギュラリティ説の賛同者の多くが、それが自分たちが生きている今の時代に起こり、彼ら自身が天国に携挙される、と信じているのも、偶然ではない。宗教には、死の恐怖を和らげ死後の生を約束するものが多い。しかしシンギュラリティは、いとも簡単に、人が永遠に生きられると約束する初めての宗教だ。しかもそのために個人的な犠牲や、食事の制限は課せられない。このおいしい勧誘を断るのは、むずかしい。

シンギュラリティという宗教は、天使と悪魔も用意している。どちらも、自分で自分を強化する人工知能だ。半神半人もいて、それは強大なコンピュータに脳神経を直接接続した超人だ。だから、このような、まことしやかなSFと古代宗教を融合させるテーマは、すごくおもしろいことはおもしろい。実現してほしい、とすら思う! これに比べると、そのほかの未来論はどれも、退屈だ。

しかし同時にそれには、どの宗教にも共通する欠点がある。信仰を優先するのあまり、現実をないがしろにしている。この場合はとくに、その機会費用が大きい。シンギュラリティを信仰すると、貧困や格差、不正義、気候変動などの社会的現実的困難が、どうでもよくなる。でも心配は要らない。その信仰によると、テクノロジの神代が訪れれば、これらの問題のすべてを、われわれの並外れた優秀性が、野菜にたかる小さな害虫のように駆除してしまうだろう。

シンギュラリティを信ずる者と議論しても無駄だ、とぼくは思う。彼らが必ずしも間違っているとは思わないが、ぼくの問題は、必ずしも正しいとも思えないことだ。でもぼくは彼らに、「逆パスカルの賭け」のようなものを当てはめるのがふさわしい、と思う。あなたがシンギュラリティを信じているとしても、それは実際には起きないと思って生きるのがベストである。実際に起きたら、あなたがやってることは無意味になるかもしれない。そしてもし起きなかったら、あなたがやってることは、この、あなたが期待しなかった限界と制約の多い世界で、あらゆる意味と意義を持ちうるだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa)。

Appleがスマートフォン上で人工知能で写真を分類するアプリのデベロッパPerceptioを買収

apple-logo-dark

AppleがディープラーニングのPerceptioを買収したことを、今日(米国時間10/5)Bloombergに確認した。Perceptioのプロダクトは、人工知能を使ってスマートフォン上の写真を分類するアプリだ。

昨年10月のRe/codeの記事によると、Perceptioの技術ではデータをクラウドに保存せずモバイルデバイス本体の上で高度な計算処理ができる。ファウンダのNicolas PintoとZak Stoneは、写真共有アプリSmoothieも作った。

PintoのTwitterプロフィールによると、彼はMITとハーバードのリサーチサイエンティストおよびコンピュータ科学の講師だそうだ。一方Stoneは、ハーバードでコンピュータヴィジョンのPhDを取得している。

AppleのスポークスマンColin JohnsonはBloombergに、“Appleは小さなテクノロジ企業をときどき買収するが、その場合一般的に買収の目的や今後の計画を議論しない”、と述べている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

ゲームのキャラ、情景、環境などのアートデザインをArtomatixの人工知能が迅速に作ってくれる

artomatix-3

ビデオゲーム産業はなんと、800億ドル産業といわれる。しかもさらにクレージーなのは、ゲームの開発コストの60%が、ゲーム内アートのデザインという骨折り仕事に投じられていることだ。

今日(米国時間9/21)のDisrupt SF Startup Battlefieldに登場したArtomatixは、データからヴィジュアル関連の情報を読み取り、ゲームアートを自動的に描く、という人工知能アプリケーションだ。これを使って、没入型ゲームの(背景、シーン等の)デザインに投じられるお金とマンアワーを大幅に減らす、という。

どういうことかというと、たとえばデベロッパが求めるゾンビーのデザインのラフスケッチをArtomatixに投げ与えると、簡単にゾンビーの何千人〜何万人の大群を作ってくれるのだ。さらにこのプログラムは、それまでに作ったキャラクターの類似性や違いに基づいて、新しいキャラクターを次々と作る。それらの他との違いは、乱数で作られる。

とくに、あまり裕福でないインディーのゲームデベロッパは、広大な情景シーンや個々のキャラクター、さまざまな環境要素などを作るのが、かなりたいへんな作業になる。Artomatixは主なユーザとしてそういうインディーのデベロッパをねらっており、彼らが仕事をもらっている大手のゲーム制作スタジオから干されないように、人工知能に頑張ってもらう。

Artomatixの使用料は、それをスタジオが負担する場合はその規模によって異なる。またこのSaaSをインディーデベロッパ個人が利用する場合は、ArtomatixのCTO Dr. Eric Risserによると、月額30ドルだ。大手のスタジオがArtomatixを自分たちの工程に組み入れる場合には、ライセンス料が年額10万ドルに達することもある。

当面Artomatixの人工知能エンジンはビデオゲームのデザインワークをターゲットにするが、同社によると、それと近い応用が効くのが、仮想現実コンテンツや映画の制作だ。しかもそれらの業界も、ゲーム業界に劣らず市場機会が大きいだろう、と同社は皮算用している。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Appleは人工知能と機械学習関連のエンジニアの採用を強化する予定

apple-wwdc-20150247

ロイター通信によるとAppleは最低でも86名の人工知能と機械学習の専門家を採用しようとしているらしい。iOS 9の主要機能が「Proactive提案」なのも理由の一つだろうが、Appleはスマートフォンを更にスマートにする考えのようだ。

Appleはこれまでモバイル端末のデジタルアシスタントの分野では遅れを取ってきた。Siriは音声入力のインターフェイスの先駆けではあったが、Google NowはiOS 8で提供していないスマートな機能を多く提供している。

しかし、次のような機能がiOS 9に搭載される予定だ。検索画面は、ユーザーのいる場所や行動を元にアプリや連絡先を提案するようになる。例えば、自宅にいる時はゲームを薦めたり、仕事にいる時はビジネス向けのアプリを薦める。

カレンダーとメールでは、iOSは過去のイベントやメールを参照して、メールの受取人やイベントを提案する。他には、モバイル端末を車のBluetoothに接続した場合、iPhoneはユーザーがドライブする時にいつも聞いている曲を元にプレイリストを提案する。

カレンダーは次のミーティングに向かうために何時に出発すれば良いかを知らせたり、フライト時間や予約をカレンダーに入力するよう促す。また、iPhoneユーザーはSiriに誕生日パーティーの時の写真を表示するように指示するなど、Siriに色々なことを依頼できるようになる。

しかし、今日の採用の噂からするとAppleはそこで留まる予定ではないようだ。採用される機械学習エンジニアはAppleで難しい課題に取り組むことになるだろう。Appleは6月に開催されたWWDCでユーザーのプライバシーの重要性を強調していた。例えば、iMessageは暗号化したプロトコルを使用しているため、AppleはiMessageを分析してそれを元にパーソナライズした機能を提供することはできない。Appleがユーザーのメッセージの内容を見ることは決してないのだ。

一方Googleは、Google Nowをこれから登場予定のGoogle Now on Tapで強化を図る。Android Marshmallowではユーザーはモバイル端末で起きていることに連動した情報を得ることができる。例えば、ホームボタンを長押しするとSpotifyで聞いている曲の歌詞を見たり、友人がテキストメッセージで送ったレストラン候補のレビューを検索することができる。

Appleは少しずつだが、追いつこうとしている。iOS 9では、画面上の情報を元にSiriにリマインダーを設定することができる(「車に乗る時にこの場所のリマインダーを送って」といった具合だ。)iOS 10では更に多くの機能が期待できるだろう。Appleがプライバシーを守りながらどこまでできるかに注目しよう。

[原文へ]

(翻訳:Nozomi Okuma /Website/ twitter

画像とメッセージの組み合わせを無限に生成するInspiroBot(ときどき、おもしろいのがある)

inspire-4

[アイデアがアイデアなのは、それらがたぶんアイデアだからだ]

 

きれいな写真を撮って、格言ふうのメッセージを貼り付け、Facebookにポストし、そしてたくさんの同類を見物する。

それが大好きな人は、ご用心。これからはロボットがそれをやるようになる。けたたましくランダムで、おそろしいほどお利口なロボットだ。

それが、InspiroBot、“格言ふうの引用文を無限に作り出す人工知能が、無意味な人間存在をかぎりなく豊かにする”、というのだ。

言い換えるとこいつは、Mad Libsのような言葉の構造体に、それらしき画像をくっつけたものだ。ランダムに選んだ画像にランダムなメッセージを載せるだけだが、なぜかおもしろいし、たぶん、ときには“名作”もあるだろう。

でも、なんか、あまりにもうますぎて、人間が介在しているのではないか、と思うこともある。結局、最後にはそうなるのかもしれない。有名なInfinite monkeysの話もあるしね。現状ではほとんど、無意味なものばかりだけど。

わりと良かったものを、ここにご紹介しよう:

inspire 2
[ポジティブ思考で、成功するまで何度でも挑戦しよう。]

 

inspire 3
[時間(秒)はあなたの血を吸いにくる虫だ。]

 

inspire 1
[自分が馬鹿だと思えたときは、すなおに泣き崩れるべし。]

 

inspire 5
[情熱はエリートにとって退屈だ。]

 

inspire 6
[時間が終わったあとは、ゾンビだけが残る。]

 

遊んでみたい方は、ここへどうぞ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

都市の大規模建設プロジェクトから発生頻度の高い問題やエラーをビッグデータ分析で事前に取り除くVernox Labs

scaffolding

都市における建設や土地開発は、スケーラビリティとは縁遠いビジネスの典型だ。

まず、設計はそのときかぎりで、再利用性がない。土地利用の政策は各地域や国によってまちまちで、標準性がない。現場のサイズも大小まちまち、使用する素材も建物ごとに違う。つまりそれは、スケールするビジネスではない。

予算オーバーが日常化し、それはまれな例外ではない。

そこで、このほどY Combinatorから孵化したVernox Labsは、過去のプロジェクトから得られる多様な非定型データを活用して、上記のような、いろんな面での予測不可能性をできるかぎり排除しようとする。そして、ゼネコンや設計家やプロジェクトマネージャが、よくあるエラーをなるべく犯さないようにする。

まず、住居系のプロジェクトや病院などプロジェクトのタイプ別に、ゼネコンと設計事務所とのあいだで交わされる大量のメールやWordの文書やExcelのファイルなどを人工知能が読んで分析する。

そしてそれらのデータから、予測可能事のチェックリストないし設計の事前リビューを自動生成し、プロジェクトマネージャはそれと、新しい企画の細部を照らし合わせる。またGoogleのような検索エンジンを使って、部位や素材に対して下請けや建設労働者が抱く疑問に、即座に答える。

協同ファウンダのVinayak Nagpalはこう語る: “建設プロジェクトは、ひとつひとつが閉鎖的な蛸壺(silo, サイロ)だ。新規のプロジェクトは、できたてほやほやのスタートアップに似ている。しかしそれでも、毎回々々、同じような問題があちこちに生じてしまうんだよ”。

Nagpalは、トラブル続きのNokiaを辞め、Michael Savaianoと共に、UC BerkeleyのCenter for Entrepreneurship & TechnologyでVernox Labsを立ち上げた。

Savaianoは言う、“いつも、同じようなことを見忘れている。なにか、カーテンウォールのようなものが、毎度々々、過去に何千回も作られている。だから、過去の状況が分かれば、そこから学べるはずなのだ”。

Savaianoの説明によると、デベロッパは完成物の具体的なイメージを持っている。それを設計家に持ち込むと、設計家は設計を作る。次に、ゼネコンが登場して、その設計をいじくり回す。そこから、設計者と建築者とのあいだの、ありとあらゆる行き違い、コミュニケーションのエラーが生じてくる。

“今のビルは、とても複雑だ。その設計は、なお一層複雑だ。素材も、いろいろありすぎて複雑だ。建築を進めるシステム全体が、ものすごく複雑だ”、と彼は語る。“しかしそれでも、これまではプロジェクトのデリバリを助けるものが何もなかった。その状況は、何百年も変わっていない。われわれは、そこに着目したのだ”。

かつて大企業相手の営業をやっていたSavaianoは、パイロット協力企業を二社確保した。そのデベロッパ二社の名前は、当面非公開だ。Vernox Labsのサービスは今は無料だが、いずれは有料になる。

“うちがやるのは、起きうる問題を事前にシミュレートし、求めに応じて予測を作り出すことだ”、とSavaianoは述べる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

ブラックホール博士HawkingやTesla自動車のMuskらが、AI軍拡競争は始まる前に阻止せよ、と提議

terminator-salvation

高名な物理学者のStephen Hawkingや、先進的電気自動車を作るTesla Motors社などのCEO Elon Musk、そして1000名を超えるAIやロボット工学の研究者たちが、アルゼンチンのブエノスアイレスで行われた、人工知能に関する国際合同会議(International Joint Conference on Artificial Intelligence)で月曜日(米国時間7/27)に、AI戦争の禁止を提言する書簡に署名した。書簡は、“自律的能力を持った兵器”による激しい破壊の蔓延を警告している。書簡の宛先は、AI軍備競争に手を染めようとしている世界各国の軍事部門である。

それは、このような警告だ:

人工知能(Artificial Intelligence, AI)の技術は今、そのようなシステムの軍事的な配備が、法的にはともかく少なくとも実用的には、数十年以内ではなく数年以内に可能な地点にまで達しており、それが人類にもたらすリスクはきわめて大きい。自律的能力をもつそれらの兵器は、火薬と核兵器に次ぐ第三の戦争革命と言われている。

研究者たちは、すべてのハイテク戦争を終わらせる、といった理想を述べてはいない。むしろ力点は、人間が機械を確実に制御することに置かれている。彼らの焦点は自律能力を持った兵器の、人間による制御に置かれ、照準を人間が合わせる巡航ミサイルやリモコンドローンなどではなく、事前に決められている一定の基準を満たす標的を、自動的に探索し破壊する兵器の、人間による確実なコントロールを要請している。

書簡は、自律的兵器の開発を追求しないことが、世界の軍事大国の責務だ、と述べている。

世界の軍事大国が一国でもAI兵器の開発を推進すれば、世界的な軍拡競争の招来が不可避となる。そして、そのような技術競争の行き着く先は明白である: それは、自律的兵器が明日のカラシニコフになることだ。

〔カラシニコフ、誰にでも簡単に入手できる銃火器。〕

HawkingとMuskはこれまでにも、AI技術に関する警戒を声高に述べている。Muskは最近、人工知能は人類にとって実在する“最大の脅威だ”と述べ、一方Hawkingは、この技術が““人類の終末をもたらす”、と語った。

この書簡に署名した人の中には、このお二人に加えて、Appleの協同ファウンダSteve Wozniak、人工知能企業Google DeepMindのCEO Demis Hassabis、著名なMIT教授Noam Chomsky、Googleの研究部長Peter Norvigらがいる。

書簡の締めくくりは、

人工知能はさまざまな面で人類に利益をもたらす、とわれわれは信じており、当分野の目標はそこに置かれるべきである。AI軍備競争を開始することは良からぬ考え方であり、攻撃的自律兵器が人間による有意な制御を超えて使われることを禁じることによって、AI軍拡競争の開始を防ぐべきである。

となっている。

Hawking博士は今、一週間の予定で、RedditのAMAに出ておられるので、質問などはそのサイトにポストできる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

複雑膨大すぎてGoogle検索では対応できない法律文書にWatsonのNLPを適用するROSS Intelligence

 

今の法律関連の情報や裁判の判例などは複雑膨大だから、いくつかのキーワードで検索したぐらいでは、役に立つ情報がなかなか見つからない。

そこでY Combinatorから孵化したROSS Intelligenceは、IBMの人工知能システムWatsonの自然言語処理(NLP, natural language processin)の能力を利用して、法律文書をふるいにかけようとしている。

ドキュメントをキーワードで検索するのではなく、ふつうの英語で“Can an automatic stay be lifted if a plaintiff in another case requests it?”(原告が別の訴訟でそれをリクエストしたら債権執行の自動的停止を解除できるか?)と言えば、 複数の引用を確実性の等級をつけて出力する。ただし私自身はまだ試していないので、Lexis-Nexisとの比較などを、ここで述べることはできない。

カナダの弁護士で、長年法律の研究家でもあった協同ファウンダのAndrew Arrudaは、こう言う: “Watsonは、自然言語のような非定型データをうまく扱えると思うね。市場自体に、そういうニーズの高まりがあった。過去の判例や裁判官の判断などを、膨大な文書から迅速適切に取り出せるようになれば、われわれの‘法律産業’も変わるね。変化を前向きに受け入れる法律事務所も、今や多い。それはクライアントからのコスト圧力が、ますます強いからだ”。

あの悪名高き、法律事務所の課金対象時間(billable hour)は、1時間400ドルにもなることがあったが、数年前からすたれ始めている。それと同時に、文書作成などはインドなどにアウトソーシングされるようになっている。
ROSSによると、このようなコスト圧力の結果として、法律調査ソフトウェアの市場は年商84億ドルの規模に成長しており、そのユーザ(お客さん)である弁護士は、合衆国とカナダだけでも130万人近くいる。

“毎日、何千もの新しい法律が発布されている”、とArrudaは語る。“でもごく最近までは、法律に対するコンピュータの自然言語処理能力はきわめて表面的だった。ROSSは、ドキュメントの中にもっとも適切な小部分を見つけて取り出すために、人間の読み方や、関連テキストの見つけ方、状況に合った答えの見つけ方など、人間のやり方を律儀に模倣している”。

ROSSが得意とするのは、倒産や破産の分野だが、彼らは今そこに、いろんなサードパーティの素材も加えつつある。Arrudaと、そのほかの協同ファウンダJimoh Ovbiagele、Akash Venkat、Shuai Wang、Pargles Dall’Oglioなどは、神経科学とコンピュータ科学を専攻した人たちだ。

このサービスは、非公開ベータの今は無料で、何名かの法律の専門家たちがベータに参加している。

“Watsonをロースクールに入学させたね”、と人から言われるよ、とArrudaは語る。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Fly Or Die(飛ぶか死ぬか): Amazon Echoの巻

Amazon Echoのことを初めて聞いたとき、人間の声で指示する家庭用デバイスが良いアイデアだとは、全然まったく思わなかった。なによりもまず、自分が言うことをすべてAmazonが聴いてるということが、キモチワルかったし、SiriやGoogle Nowのような類似の音声ツールにも、感動したことはない。

でも実際に使ってみるとAmazon Echoは、今市場に出回っている音声デバイスの中では、かなり強力な方だ。

最初に”Alexa”と言うと、コマンドが始まる合図だ。それからいろんな質問をしたり、Amazonのショッピングカートに品物を入れたり、Evernoteでノートをとり、家庭のIoTデバイスを制御したりする(Phillips Hueの電球とかWiMoのスイッチなど)。

また、Amazon Echoは家庭用品に徹しているから、焦点がはっきりしている。SiriやGoogle Nowのように、スマートフォンはいろんな人がいろんなところで使うからといって、何でもかんでもやろうとしない。

Alexaはときどき、無反応になったり、混乱する。質問の種類は、限られている。でも179ドルの製品にしては、よくできている、と私もFitz(Fitz Tepper)も思った。AmazonはAPIを公開したから、デベロッパやガジェットのメーカーがEchoの脳を利用したいろんなソフトウェアツールやデバイスを作れる。それらの種類がものすごく豊富になったところを想像すると、Echoは家庭用の多芸な電脳として、かなりおもしろい。

Darrellの長い記事も、このあたりのことを述べている。

飛ぶ(fly、売れる、うまくいく)方に2点を入れよう。

*Amazon Echoはプライム会員なら179ドル、非会員は199ドル。初期の会員価格は99ドルだったから、上の古いビデオには混乱がある。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

サービスのパーソナライズを可能にするアルゴリズムの進化に必要なもの

funhouse


パーソナライズした体験をもたらすアルゴリズムは、昨日選んだものにも、今日選ぶもの、明日選ぶものの全てに影響を与えるようになる。

しかしパーソナライズ化が上手く行っていない所もある。私たちは興味のない、ユーザーの気を引こうとする広告に継続的に出くわす。デジタルのパーソナルアシスタントはそんなにパーソナライズされていない。ニュースフィードの深いアルゴリズムの溝がユーザーと友人を引き離しているし、オンラインで見るコンテンツは同じものがずっと繰り返し表示されている。

パーソナライズのための私たちの偶像は、遊園地の鏡張りの迷路に映る自分の姿のようだ。パーソナライズ化の過程でユーザーは抽象化され、デジタルという鏡に投影されたユーザーの興味関心は実際のものと乖離してしまっている。

パーソナライズ化のために埋めるべきギャップ

現在のパーソナライズされた体験が未完成なのには、5つの主要な要因がある。

データギャップ:これは、アルゴリズムの環境によりユーザーに関するデータが限定されていることで起きる。システムは、ユーザーに提供する体験とそれに対するフィードバックのループの文脈でしか、ユーザーを理解することができない。システムに外部のデータソースからの情報を入力したとしても、ユーザーの興味や好みの一部しか理解することができない。

計算処理ギャップ:計算処理の能力と機械学習テクノロジーの限界を指す。現在最速のシステムでも、複雑な個人をシステムのルールに従って理解するには遅すぎるのだ。同時に、最も先進的な機械学習のソリューションも、コンピューターがユーザーのことを遅滞なく学び、順応するには、まだ十分ではない。

パーソナライズ化の過程でユーザーは抽象化され、デジタルという鏡に投影されたユーザーの興味関心は実際のものと乖離してしまっている。

興味ギャップ:ユーザー、プラットフォーム、そしてサードパーティーの関係者(例えば、マーケッター)の意図が合致しないことを指す。つまり、ユーザーが見るものやできることは、誰の興味や好みを元に優先順位が決定されているかという問題だ。ユーザーは広告に興味がないかもしれないが、彼らの意思とは関係なく表示される。誰かがユーザーの注意を引くために料金を支払っているのなら、ユーザーが選べる範囲が狭まるのだ。

行動ギャップ:ユーザーの本当の意図と利用できるものの不一致を指す。例えば、ユーザーは存在していない「これは面白くない」ボタンを押したいと思っているかもしれない。あるいは、特定の画像を今後一切見たくないと思うかもしれないが、そのようにできる方法が存在しないといった場合だ。ユーザーの行動はフィードバックループの限定的な環境に収まるように簡略化されているのだ。

コンテンツギャップ:プラットフォームやアプリケーションにユーザーが求めていることやニーズにぴったり合うコンテンツがないことを指す。また、提供しているコンテンツの多様性が限定的な場合もある。例えば、スポーツニュースやレストラン情報のアプリやウェブサイトは関連するコンテンツがなくなる場合がある。トピックがニッチであるほど、ユーザーにとって継続的に有益なコンテンツが提供されるチャンスは少なくなる。

また、パーソナライズ化の根幹には普遍的なパラドックスが存在している。

パーソナライズ化は、デジタルの体験を個人の興味や好みに適応することを約束している。同様にパーソナライズ化はユーザーに影響を与え、毎日の選択や行動を起こす基準となり、ユーザーを形作っている。複雑でアクセスできないアルゴリズムが、ユーザーの代わりに見えない所で選択を行っている。それらは、ユーザーが認識できる選択肢を減らしている。つまり、個人の裁量を制限しているとも言える。

パーソナライズ化におけるギャップと内在するパラドックスにより、パーソナライズ化は不十分で未完成のままだ。ユーザーにとってアルゴリズムが自分の意図ではなく、他の誰かの意図を汲んでいるように感じてしまうのはそのためだ。

アルゴリズムによるパーソナライズ化の中核に人を置く

パーソナライズにより、個別ユーザーに対して更に良いサービスを提供するためには3つのデザインと開発の道が考えられる。

まず、パーソナライズ化には新しいユーザーインターフェイスの枠組みとインタラクションモデルが必要だ。直接的なアクションやそうでないアクションを効率的に学習してパーソナライズするインターフェイスは、データギャップを埋めることができる。同様に、システムがユーザーがしていることとそうでないことを学習することで、計算処理ギャップも埋まっていく。興味ギャップの問題を解くには、ユーザー自身が表示されるものを直接コントロールできるようにすべきだろう。ユーザー主導で異なるコンテンツやサードパーティーからの関連コンテンツを混ぜることのできるインターフェイスが必要だ。これによりユーザーは、自分に対し表示されているものを知ることができる。システムの透明性は、ユーザー自身が自分の好みを調節することを可能にし、プラットフォームやサードパーティーにとっても有益に働くだろう。

行動ギャップを埋めるには、本当の意図や反応を反映したカスタム絵文字やジェスチャーといった文脈も意識したインタラクションを実現する、ユーザー順応のインターフェイスが必要だ。また、システムはユーザーが興味を持ちそうなものが利用可能になった時、あるいは具体的なアクションが取れるようになった時に通知することでコンテンツギャップの減少につながるだろう。それは、腕に着けた端末の振動や、デバイスの画面の賢い通知メッセージといった形かもしれない。新しいインターフェイスは、リアルタイムではなく、パーソナライズ化した「自分時間」を優先するようになる。

次にパーソナライズ化には、関連したもの、意外なもの、タイムリーなもの、成熟したコンテンツを混ぜて提供することだ。データギャップと計算処理ギャップの観点では、より多様な選択肢を提供することで、システムがユーザーの本当に興味のあるものを詳しく理解することができるようになる。ユーザーは、自分の興味関心をより詳細に伝えることができる。そしてシステムは、ユーザーの行動から、これまで知り得なかったあるいは、形式通りではないものの中に関連性を見出すことができるだろう。

興味ギャップに関しては、関連情報と意外な情報を混ぜることで、ユーザー自身がどの情報を優先するかを決定することができる。関連した情報の中でも多様な選択肢を用意することで、システムが限定した情報の箱の中にユーザーを閉じ込めることがなくなる。時に表示される関連のないコンテンツも体験を阻害することはない。関連性があるかどうか、セレンディピティを起こす内容であるかどうかは、どちらも主観的で文脈に依存しているものだ。アルゴリズムはユーザーが新しいことを探索するのに前向きな時と、目標があり、特定の情報を求めている時を判別することができるようになる。

行動ギャップを狭めるためには、多様な賢いレコメンドで、ユーザーが自身のルールで選択することができるだろう。システムはユーザーの短期と長期における関心をそれぞれ理解し、ユーザーの情報ニーズを予測することができるようになる。タイムリーであるかどうかは、関連性と同義ではない。大量のコンテンツは、時間の経過と共に魅力や意味を失うのではない。コンテンツギャップは、幅広く分野の濃い内容の興味深い情報が集まるほど、効果的に埋まっていくことだろう。

そしてパーソナライズ化は、集合的知識と人工知能を取り入れるべきだ。物事の関連がすぐに分かり、コンピューターはより賢くなって、物事は更に効率的になる。計算処理ギャップを減少させるためには、人と機械の情報の流れを加速させることだ。人は(まだ)この世界で最もパターン認識に優れたシステムだ。私たちは協力して、意味のあるサインを見つけだすことができるだろう。人工知能が順応するインターフェイスと予測を立てる学習システムを強化することにより、人による意味付けを活用することができる。

人が主軸となるパーソナライズ化は、人がキュレートしたシグナルと順応する機械学習のソリューションを統合する。この方法で知的なシステムは、個人及び集合的なインタラクションと洞察により進化することができる。そして、人の想像力と非合理性がアルゴリズムの決定による制限を打破するだろう。

パーソナライズ化のパラドックスはどうだろうか?パーソナライズ化の領域の中には、客観性は存在しないし、客観的な視点もあるべきでもない。ユーザーがアルゴリズムを形作り続け、アルゴリズムもユーザーを形作り続ける。それがさらに私たちにとって有益になるよう、人が周りの物事の関連性や意味付けを主観的に行う方法をパーソナライズ化アルゴリズムが理解する必要がある。

結局の所、パーソナライズというコンセプトは、産業的な大量生産とマーケティングの世界から派生したものだ。アルゴリズムの力を借りた意思決定を行う新時代に移行しつつ、個人の能力に重きを置くには、パーソナライズ化アルゴリズムではなく、選択アルゴリズムを作らなければならないということかもしれない。

そのようなアルゴリズムをどこが構築することになるのだろうか?

[原文へ]

(翻訳:Nozomi Okuma /Website/ twitter

Google自製の完全自動走行車がマウンテンビューの路上を走り始めた

2015-06-26-google-car

Googleは自動走行車プロジェクトの情報をアップデートし、最新のプロトタイプがすでにマウンテンビューの路上を走っている ことを明らかにした。これは昨年12月にGoogleがお披露目したキュートなミニカーの改良版で、Googleがすべてを内製した。完全な自動運転を目的としており、車内にはハンドルなどのコントロールがない。

ただし現在は路上テストの際には万一の事態に備えたバックアップのドライバーの搭乗が義務付けられており、取り外し可能なハンドル、アクセル、ブレークなどが装着される。また自動運転モードでは最高速度は時速25マイル(40キロ)に制限される。ソフトウェアはLexusに搭載されてすでに長距離を走っているものと同一だ。

Beta public roads edit

Googleのパンダ風のミニカーは先週からスタートしたデザインを公募するプロジェクトのおかげで一層かわいくなった。Googleは「私のコミュニティー、私の隣人」というキャッチフレーズを掲げて、カリフォルニアのアーティストから自動走行車をさらに親しみやすくするペイント案を募集している。

自動走行車が人間の運転より安全だといかに統計的に証明しても、人間というものは統計ではなかなか動かないものだ。むしろかわいらしいボディーペイントの方が普及には効果的かもしれない。

[原文へ]

(翻訳:滑川海彦@Facebook Google+

ディープラーニングと検索エンジン最適化の新たな時代

thinker


編集部記:Nathan Sikesは、Crunch Networkのコントリビューターである。
Nathan Sikesは、
FoxtailmarketingのプロダクトのVPを務め、実践的なSEOとデジタルマーケテイング手法の調査と導入に注力している。

ディープラーニング、あるいは深層構造ラーニングのコンセプトは、ここ数ヶ月で頻繁に話題に上るようになった。世界に名だたる複数の大手検索関連企業がこの分野に力を入れ、進歩が見られるからだ。Google、Facebook、MicrosoftにBaidu(中国の検索エンジン)は、このテクノロジーに投資することでアプリケーションの進化を加速し、更には比較的新しい人工知能(AI)技術の活用も進んでいる。

この記事では、ディープラーニング技術とそれが今日のオンライン世界における検索エンジン最適化(SEO)にどのような影響を及ぼすかについて述べたい。ディープラーニングとは何か、そしてその歴史を簡単に振り返り、AI技術で私たちの身の回りのデジタル世界を創造し、より良くしようとしている主要プレイヤーの動きを見ていこうと思う。

本物の人工知能を探し求めて

ディープラーニングの影響を本当に理解するには、それが何であり、どこから来たかを知る必要があるだろう。ディープラーニングの起源を一つの場所や人に特定することはできないが、この分野に詳しい人なら、現代ディープラーニングの父はGeoffrey Hintonであると同意するだろう。現在彼は、Googleとトロント大学で活動している。Hintonは、1980年代にBackpropagation の開発に貢献し、最近ではNeural Computation and Adaptive Perception Program(ニューラルコンピューティングと適応知覚プログラム)で研究し、変化を求めていた分野を点火することとなった。「過去2、30年間Hintonは、ニューラルネットワークとディープラーニングの最前線を牽引してきました」とKai Yuは話す。彼は、Baiduのディープラーニング研究機関でディレクターを務めている。「私たちはこのような早いスピードで市場に影響を与える機械学習や人工知能を経験したことがありません。驚くべきことです」と続けた。

多くの企業はディープラーニングがこれからの時代を形作ると捉えている。また、この新しい商業サイエンスを有効に活用するのに多額の資金やリソースも必要ないことを知っている。

Hintonの功績は、現在人工ニューラルネットワークとディープラーニングの研究に取り組んでいるほとんどの大手企業に見ることができる。現在Facebookで働くYann LeCunは、1980年代にHintonと共にBackpropagationを開発していた。Baiduのチーフサイエンティストを務めるAndrew Ngは、GoogleのDeep Learning Projectを立ち上げ、Hintonとそこで何年も共に働いた。これら数人のエンジニアは、それぞれ競合する企業で働いているが、力を注いで追い求めているものは同じだ。本物の行動学習をする人工知能の開発だ。

10年以上前、ビジネスの世界はディープラーニングの分野に背を向けた。チップの処理能力の限界と人工ニューラルネットワークで用いるデータセットは、Hintonと彼の同士が掲げた仮説を実行不可能なものとし、時代が追い付いていなかった。

2015年に先送りすると、ポテンシャルのあるアプリケーションで溢れる全く新しい環境がある。これに気がついたのは何も大手企業だけではない。Clarifaiのような小さな組織も、拡張された学習能力を広告やコンテンツのキュレーションのための調整やフィルタリングに使用している。他にもMoz(SEO企業)のような企業も、カスタマーにより優れたプロダクトとサービスを提供するこの技術が、これからの時代を形作ると捉えている。「Mozのような企業も機械学習技術を部分的に一定のレベルは使用しています。ディープラーニングは全く活用していませんし、多くのニューラルネットワークの技術も使用していません。しかしその方向に向かうことはあると思います」とMozのブログでRand Fishkinは説明している。

多くの企業はディープラーニングがこれから時代を形作ると捉えている。また、この新しい商業サイエンスを有効に活用するのに多額の資金やリソースも必要ないことを知っている。IBMのWatson Analyticsは、500MBまでアップロードでき、ディープラーニング用のリアルタイムのアプリケーションを無料で試すことができるフリーミアムサービスを提供している。Google Adwordsや他の販売に関連する数値をツールに入力することで、スタートアップ企業でも、データの中に関連性や予測するのに役立つ情報が得られるだろう。Watson Analytics以外にも、他社が開発していて、活用しているテクノロジーを見てみよう。

Google Research:Googleは、Forbesの「2015年、最も価値あるブランド企業」のリストの三位に入った。ただ、誰もが彼らは検索で一位であることに異論はないだろう。Googleは、この10年で機械学習能力で多くの進化を果たした。彼らは、画像、動画、言語の理解を深めるための開発に力を入れている。

Googleは調査、買収(2014年に買収したDeepMindなど)やImagenet Large Scale Visual Recognition Challenge(単語と画像を紐付けるデータベース)とのパートナーシップなどを通して、ディープラーニングの新しい分野での検証と適応に注力してきた。最近Googleは、初めて見る画像を説明するためのキャプションを自動で付ける機能を公表した。Googleの検索アルゴリズムにこのような画像認識と検索機能が実装された場合を想像してみよう。

そんなに遠い未来のことではないだろう。Geoffrey Hintonは、Redditの「Ask Me Anything(何でも聞いて)」のセッションで「次の5年で最も面白い分野は動画とテキストの内容の理解だと思います。次の5年内に、例えばYouTubeの動画から、何が起きている内容かを説明する機能が出来ていなければ、がっかりします」と説明している。

Facebook FAIR:世界で最も人気のSNSは、検索でも強いプレイヤーに成長した。今後もこの分野においてマーケットシェアを拡大していくだろう。Facebook AI Research (FAIR)はFacebookが人工知能とディープラーニングを未来のソーシャル、購買活動とメディアへの応用に注力していることを表すものだ。事実、彼らの顔認識ソフトウェア、Torch(ディープラーニングのための開発環境)のオープンソースモジュールへの貢献、最近ではMike Schroepfer (FacebookのCIO) がFacebook AIが 動画内の登場人物の動きを認識できるようになったことを発表したことを考えると、Facebookは、ディープラーニングによる学習能力を最も活用している企業であると言えるかもしれない。

Microsoft Project Oxford:最近発表したhow-old.netの顔認証プロジェクトで Microsoftの技術を多くの人が知ることとなった。しかしほとんどの人はこのプロジェクトは、Microsoftの機械学習研究チームによって製作されたことを知らない。Microsoftのブログによると「数人の開発者が、ウェブページと機械学習APIを統合し、リアルタイムでアナリティクスをストリームするこのソリューションを全て構築するのに、一日しかからなかった」と伝えた。これは始まりに過ぎない。このようなプロジェクトの他にも、近い内にProject OxfordとCortana(Microsoftの「パーソナルアシスタント」)がWindows 10とInternet Explorerの代替ソフトであるEdgeに実装されるだろう。

WolframAlpha:WolframAlphaは抜群の知名度があるとは(まだ)言えないが、ここ数年の人工知能の分野の有力なプレイヤーである。彼らの究極の目標は、何もかもコンピュターで処理できるようにすることだ。まずは、専門的な知識と能力が要求される分野に注力している。彼らは最近、画像認識、新たな問題の作成、言語認識と更にはFacebookの分析まで開発対象を拡大した。

何故これが重要なのか?

もし人工知能が検索に統合されたらどうなるかと想像する時期を超え、それがいつ行われるかという時期に到達した。上記の企業は、それの実現に向けて業界を引っ張っている。これらの情報を鑑みた上で、ディープラーニングが次の5年間で検索にどのような影響を及ぼすのだろうかという予想をいくつか記載する。

新しいSEOの基準:あなたがオンラインのマーケターでこれらの技術に心躍らないのなら、この分野はあなたに合っていないのかもしれない。このタイプの人工知能を搭載した検索エンジンで、マーケターは画像優位のSNS、動画共有サイト、スライドでのプレゼンテーションプラットフォームといった新しいチャネルを有効に使うことができるようになる。また、検索者に役立つ画像や動画を提供し「信頼」を得ることもできるだろう。

画像でカスタマーのイマジネーションを喚起したり、注意を引くことが今後更に重要になってくると、検索を用いる企業は気が付いている。

スパムサイトの死:Googleは長い間スパムサイトとの戦いを繰り広げてきた。スパム手法を用いるサイトのランキングを下げるための専用アルゴリズム Penguinまで開発した。私の予想では、姑息なリダイレクト、中身が薄く価値の無いスパム手法を用いるウェブサイトは大幅に減少すると考えている。これにより、より安全で整ったウェブが出現するだろう。

デバイスとの連携の改善:Googleのモバイルゲドンのアップデートが、このタイプのアップデートの最後ではないはずだ。Facebook(Oculus)、Microsoft(Hololens)のような企業が仮想現実のヘッドセットを押し出すのなら、どのような端末にどのようなウェブサイトを表示させるべきか学習し優先順位を付けることができる、賢い検索エンジンが必要になる。

隠れ場所がなくなる:検索エンジンの企業の人工知能が賢くなり完璧に近づくほど、ユーザーをトラックする機能も高まるだろう。Verizon、AT&TやFacebookが最近リリースした、次世代の「スーパークッキー」のような技術が誕生し、オンラインでユーザーが隠れることが困難になる。

画像コンテンツの重要性が増す:ミレニアル世代は、彼らより上の世代より遥かに広告を見ない。 Simply Measured(ソーシャルメディアのアナリティクス企業)によると、Facebook上の全てのブランド投稿の62%、エンゲージメントの投稿の77%は写真だった。通常のテキストだけの投稿は少ない。更にHubspotの調査では、魅力的な画像要素とグラフィックスをブログ投稿やソーシャルメディアのコンテンツに加えることで、最大94%の閲覧数の増加と37%のエンゲージメントの増加が得られるそうだ。

画像でカスタマーのイマジネーションを喚起したり、注意を引くことが今後更に重要になってくると、検索を用いる企業は気が付いている。そのようなコンテンツが近い内に優先されるようになるだろう。

[原文へ]

(翻訳:Nozomi Okuma /Website/ twitter

画像:NeydtStock/Shutterstock