スマートスピーカーの販売額は来年末までに50%アップする――NPDがアメリカ市場のデータを発表

2014年の後半にEchoをリリースしたときにはAmazon自身もこうなるとは予想していなかったかもしれない。 AIを利用したスピーカーは次世代家電に必須のプラットフォームを作ることになりそうだ。

スマートスピーカーはAIを消費者レベルに浸透させ、さまざまな製品がWiFiなどを経由して協調作動するコネクテッド・ホームの世界へのドアを大きく開いた。

消費動向調査の有力企業、NPDが発表したレポートによれば、スマートスピーカーの売れ行きにはまったくかげりが見えないという。 これらのデバイスの販売額は2016-2017年と2018-2019年を比較して50%の成長を示すと推定されている。スマートスピーカーのカテゴリーには来年末までに16億ドルの売上があるものと期待されている。

AmazonがベストセラーになったDot、スクリーン付のSpotやShowを追加するつれ、Echoシリーズはこの4年間に 急速に売れ行きを伸ばしてきた。一方、GoogleもHomeシリーズでぴったりAmazonの背後につけている。最近LG、Lenovo、JBLが発表したスマートディスプレイはGoogleのホームアシスタントが組み込まれている。

Appleもこの分野に参入し、HomePodを発表した。これによりプレミアム版のスマートスピーカーというジャンルも成立した。Googleもハイエンド製品、Home Maxで続いた。Samsungが近くリリースするGalaxy Home(三脚にHomePodを載せたように見える)もこのジャンルの製品だろう。

こうした大企業はすべてスマートスピーカーがスマートホーム製品の普及に道を開くことになるのを期待しているのは疑いない。NPDの調査によれば、アメリカの消費者の19%は1年以内になんらかのスマートホーム製品を購入する予定があるという。

原文へ


滑川海彦@Facebook Google+

Alexaに音声によるイコライザーが登場、オーディオ機能の高級化に一歩前進

AlexaがEchoのイコライザーを設定できるようになり、たとえば“アレクサ、高音を下げて”(Alexa, decrease the treble)で高音が下がる。この便利な機能は、もっと前からあってもよかった、と思うが、とにかく二日後には展開を終了し、Echoに“アレクサ、低音を上げて”(Alexa, turn up the bass)と言えるようになる。

当面アメリカだけだけど、EchoとDot, Plus, Show, Echo Spotで帯域を-6dbから+6dbの範囲で増減できる。

デベロッパーのスキルAPIも同時に提供するので、Polk Command BarやSonos Beamなどのスピーカーのメーカーも、この“音声によるイコライザー”を実装できる。Echo以外のデバイスでも利用できることは、ライバルのApple HomePodやGoogle Home Maxに勝つための重要な戦略だ。

昨年Amazonは、HomePodの対抗機を作っている、と噂された。結果的にそれは、Echoの次世代機として実現した。より高度な設計になり、オーディオも良くなったが、でもそれは、一部で期待されたハイエンドのスピーカーではなかった。今度のイコライザーではオーディオのカスタマイゼーションが増え、高級オーディオ製品としてのEchoの準備が始まったのかもしれない。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

スマートスピーカーたちが示す2つの異なる道

Sonos OneとAmazon Echo ―― 2つのスマートスピーカーたちに対する実に面白い探求のなかで、BoltVCのBen Einsteinは、伝統的なスピーカーメーカーとインフラ巨大企業、それぞれのフラッグシップモデルにみられる興味深い違いを発見した。

その投稿は全部を読む価値があるが、要約するなら以下のようなものになるだろう:従来型のスピーカーメーカーのSonosは優れたスピーカーをデザインし、その最新のハードウェアを手直しすることでAlexaやGoogle Assistantのようなスマートホーム機能を入れようとしている。Einsteinによれば、The Sonos Oneは、なによりもまずスピーカーであり、スマートハードウェアとしての機能は二の次だということだ。

「ちょっと掘り下げてみれば、ほぼ全てに対して従来どおりのデザインと製造プロセスを見てとることができる。たとえばその一例だが、スピーカーグリルは、平らなシート状の鋼板であり、それが打ち抜かれ、湾曲した四角形に丸められ、溶接され、継ぎ目は平滑に仕上げられ、最後に黒く粉体塗装されている。この部品の見栄えは大したものだが、特にイノベーションがあるというわけではない」と彼は書いている。

一方Amazon Echoは、もしエンジニアが無限の予算を与えられ、人びとが話しかけることができるような何かを作れ、と言われたときに生み出されるようなものに見える。デザイン上の決定は奇妙で興味深いものであり、最終的には家庭内会話マシンである性格のほうがスピーカーであるという性格を上回っている。さらにそれは製造にとてもお金がかかる代物だ。

つやつやしたスピーカーグリルを外してみると、衝撃的な秘密があらわになる。これは押出成形をしたあと、回転させながらドリルで穴を明けたプラスチックチューブなのだ。家電製品を分解し続けてきた私の長い経験に照らしても、こんなやりかたで作られた大量生産プラスチック部品を見たことはない。生産タイムラインに対する概算をしてみたが、おそらく部品をある軸上で回転させ、それに対して複数のヘッドを持ったドリルで穴を開けているのだと思う。各穴を1つずつCNCドリルで開けていては、とても長い時間がかかってしまうからだ。もしこのような部品がどのように作られているのかに詳しい人がいるなら、是非教えて欲しい。何はともあれ:これもまた驚くほど高価な部品だ。

スマートスピーカーを15年間生産してきたSonosは、家電メーカーとしての名声は高い。一方Amazonは、そのデバイスを家庭の居間に入り込み、販売を行うための手段の1つとみなしているので、自前のハードウェアを作らずライセンスを行うだけでも十分なのである。したがって、この2つを比較するのは少々不公平ではある。Einsteinの見立てによれば、その従来どおりの製造技術に依存するSonosの将来性は明るいものではない。一方Amazonはその製品を実現するためには金を惜しむことがないのだ。だがSonosは驚くほど上手く協調して働くスピーカーを作っている。彼らはこれを15年にわたって続けてきた。もし彼らの製品を(私がそうしたように)、競合相手たちのオーディオ愛好ではない「ダム」スマートスピーカーたちと比べてみれば、UI、UXそしてサウンド品質すべてにおいて、Sonosがほとんどのものをはるかに凌いでいることがわかるだろう。

一方Amazonは、Amazonとのコミュニケーションを行わせるためのものを作っている。これが大きな違いだ。

とはいえ、EinsteinはSonosには明らかな欠点があると彼は考えている。Sonosは、AmazonとGoogle(そしてHomePodが何らかの先触れならAppleも)が先行する、スマート技術を追いかける立場だからだ。とはいえ、スマート機能を追加した優秀なコネクテッドスピーカーを作ることは、ホームシアターのあらゆる側面をカバーしたスピーカー製品のエコシステム全体を構築しなければならないことに比べれば、それなりの価値はある。

逆からみれば、Amazon、 Apple、そしてGoogleは、Sonosがリードしているオーディオ品質を追いかけている。この先、私たちの部屋のあちこちで、小さな丸いスピーカーたちが貧弱な音でSpotifyを流すようになっても、私たちは気にしないかもしれないが、良いウーファーセットもまた良いものである。この良い音へのノスタルジックな愛が、低解像度メディアを視聴するこの世代の傾向を生き抜くことができるかどうかは賭けであるが、Amazonはその賭けは勝ち目がないと思っているのだ。

いずれにせよSonosは強く魅力的な会社である。KickstarterとAmazonによってもたらされた家電業界の大規模破壊を行き残ったスタートアップであり、私がこれまでに利用した中でも最高の中級スピーカーを生み出しているのだ。Amazonは素晴らしく、ほぼ異次元と言っても良い製品を作っているが、それは容易にコピーすることが可能で、Amazon Echoの部品よりも少ないコストでホッケーパックに詰め込んでしまうこともできることを考えれば、Amazon自身の目標がスピーカー作りそのものではないことは明らかだ。

今後のSonosのIPOが成功するかどうかは、AmazonとGoogleとの付き合い方に、ある程度左右される。そして残りは製品自身の品質と、Sonosユーザーたちの献身に頼ることになるだろう。そうした善意は、大手インフラストラクチャプレイヤーたちとの契約ほどの価値は無いかもしれない。だが、人気は高いがともすれば押し付けがましい製品群で迫るAmazonやGoogleに比べて、Sonosの志は遥かに高い。GoogleとAmazonが侵入を狙う家の中に、Sonosは既に住んでいる。そこがSonosの勝てる点だ。

[原文へ]
(翻訳:sako)

ドラッグ&ドロップで簡単にAlexaのスキルを作れるStorylineが77万ドルを調達

Alexaに不満を感じたことは、ないですか? 冗談が通じないし、‘怖い話’をリクエストしても全然怖くない。そこで、会話のブロックをドラッグ&ドロップして積み上げ、誰もが簡単にAlexaのスキルを作れるサービスStorylineが、Boost VCがリードするラウンドで77万ドルを調達し、そのスキルビルダーのAPIをさらに充実させようとしている。

Alexaのような、複雑な音声認識ソフトウェアが動くスマートスピーカーとクリエイターの間には、“テクノロジー”という障壁がある。2017年にローンチしたStorylineが目指すのは、その障壁をなくすことだ。CEOで協同ファウンダーのVasili Shynkarenkaによると、チームとインタフェイスを拡充してGoogle HomeのようなAlexa以外のスマートスピーカーにも対応し、またそのインタフェイスには広告や他サービスへのリンクなど収益化の仕組みを導入したい、という。

Alexaとの対話をドラッグ&ドロップで組み立てられるStorylineのユーザーフレンドリーなインタフェイスは、「コマンド」と「応答」という対話的関係をまさに対話的に構築しカスタマイズできる。スキルやフラッシュブリーフィングを作るためのテンプレートも、いくつか用意されている。作ったスキルの音声認識やロジックを、ブラウザー上でテストできる。

これまで、12000名あまりのユーザーが、Alexa Skills Storeに2500のスキルを発表している。それは、このストアにあるスキルの6%に相当する。Alexa Skills Challenge: Kidsでグランプリを取った作品も、Storylineのインタフェイスを利用している。そして老舗のWebマガジンSlateも、Storylineを使っている。

Shynkarenkaによると、スマートフォンのアプリを作ることと、スマートスピーカーのスキルを作ることは、全然違う。

“Alexaを、スマートフォンやWebと同じようなソフトウェアプラットホームだと考える人が多いけど、そうではない”、と彼は言う。“Alexaで人気のスキルは、友だちとチャットできたり、ソーシャルネットワークを閲覧できるアプリではない。人気が高いのは、コンテンツのアプリだ。たとえば、夕食時に家族と楽しめる雑学クイズなんかだね”。

YouTubeにビデオのクリエイターが群がっているように、Shynkarenkaの構想ではStorylineが各種スマートスピーカー向けのコンテンツのホームになってほしい。同社にはすでに2500人のクリエイターのコミュニティがあり、コンテンツの制作や共有を楽しんでいる。

でも、テンプレートなどを使って簡単にスキルを作れるサービスは、ほかにもある。たとえばご本家のAmazonは、テンプレートからスキルを自作できるAmazon Blueprintsを、4月に立ち上げた。

スマートスピーカーも、それらのスキルの制作も、これからますます活発な世界になりそうだから、今のAlexaなどと違って、もっと完全にカスタマイズできる‘あなただけの’スマートスピーカーも、いずれ必ず登場するだろうね。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

iOS上のAmazon Alexaアプリで音声コントロールが可能に

もう2年以上前にも思えるが、AmazonがAlexaのAndroidアプリに音声によるコントロールを持ち込んだのは実はやっと今年の初めだ。これによってサードパーティのモバイルデバイスにも、Amazonが進出していけるか、と思われた。そしてそのときは、同じ機能性を“もうすぐ”iPhoneにも導入する、と発表された。そして、そのもうすぐが今日(米国時間6/26)になった。

iOS上にAmazonのスマートアシスタントをダウンロードした者は今日から、そのアプリに訊いたり頼んだりできるようになる。もちろんそれはネイティブアプリではない(Appleは自分のスマートアシスタントをとても愛しているのだ)。そこで対話は、ボタンをタップしないと始まらない。

そしてそれ以降は、Alexaに質問をしたり、音楽を聴いたり、スキルにアクセスしたり、スマートデバイスをコントロールしたりなど、Alexaの‘芸’を楽しめる。天気予報やスポーツ、カレンダーなどの問い合わせに対しては、ビジュアルな表示も出る。このアップデートは“数日後から”、無料でダウンロードでき、利用できる。

スマートアシスタントの競争でAmazonには不利な一面がある。ビッグスリーの中でAmazonだけは、独自の、そしてメジャーな、モバイルOSを持っていない。MotorolaやHuaweiなどAndroidのハードウェア開発者とパートナーして、なんとか入り込んでいるが、でもGoogleとAppleは彼ら独自のスマートアシスタントのエコシステムを育てる気だ。

今後モバイル市場で何か大きな策を打ち出さないかぎり、Amazonにとってはアプリをできるだけ多くのiOSとAndroidハンドセットに載せていくことが、モバイル進出の最良の手だ。音声コントロールが加わったことによって、モバイル上のAlexaは突然、Echoデバイスをセットアップするだけのアプリではなくなったのだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

AmazonのAlexa Blueprintsで作った自作スキルを家族や友人と共有できる

【抄訳】
この春Amazonは、コードを書けない人でもAlexaのスキルを作れるサービス“Alexa Blueprints”を導入した。今日(米国時間6/13)からはそのスキルを、テキストメッセージやメール、WhatsAppのようなメッセージングアプリ、FacebookやTwitterやPinterestのようなソーシャルメディアでほかの人と共有できるようになる。

友だちや家族が使うスキルは、Amazonが提供しているテンプレートをご自分のコンテンツで満たすだけで作れる。コード(プログラム)を書く必要はない。Amazonは、共有機能はたとえば勉強グループ(や研究グループ)がフラッシュカード的なスキルを作ったり、誕生日を家族で共有するために利用できる、と言っている。後者の場合は、スキルが誕生日プレゼントになるかもしれない。

Blueprintsは今のところ、家でAlexaと遊ぶための楽しい方法だ。たとえば、“いちばんすてきなお母さんは誰のお母さん?”という質問に答えさせたり(もちろん、私の、だ)、家族の好きなジョーク集を作ったり、雑学クイズを作ったりできる。

でも、スキルを自作するユーザーはそんなに多くない。それは、Alexaのユーザーにとって必須ではなく、ちょっとした遊びだから。

スキルを作るのは、簡単だ。Amazonがテンプレートを提供していて、そこにはすでに見本が書かれているが、それを自分のニーズに応じて書き換えればよい。

そして、自分が作ったスキルのリストを見るとき、“Access”のところのステータスを”just me”(自分だけ)から”shared”(共有)に変えれば、そのスキルは共有される。共有をやめたいときは、”revoke”(取り消し)を指定する。

共有によってそのスキルのリンクが作られるから、そのリンクをメールなどで送れる。もらった人がリンクをクリックすると、Alexa Blueprintsのサイトへ行って自分のためにそのスキルを有効にできる。

Blueprintsのスキルは個人利用が前提だから、それをAlexa Skill Storeで一般公開することはできない。でもBlueprintsのサイトでAlexaオーナーのコミュニティを作れるし、また、ほかの人たちのコラボレーションを誘ってもよい。

たとえば、ある特定のテレビ番組の大ファンたちが集まって、その番組の超難度の雑学クイズをコラボで作ると楽しいだろう。近親者や親戚なども含めた大家族の中で、あなたが唯一のテクノロジー通なら、そんなみんなのためのスキル集を作って共有してもよい。

Alexa Blueprintsのサイトは、ここだ 。〔いろんな作例が載っている。〕

【後略】

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Google Home、1度に3つのタスクをこなせるようにーただし英語圏でのみ

Google Homeがマルチタスクをこなせるようになったのは昨年11月のことだ。“multiple queries(マルチな質問)”と呼ぶ機能を追加し、これにより2つのリクエストを組み合わせた音声コマンドを出せるようになったのだ。たとえば、「オーケー、Google。ボリュームを上げて、音楽をかけて」といったコマンドだ。そして今回、Google Homeは1度に3つのタスクをこなせるようになり、さらに賢くなった。

この新機能は、Googleの@madebyGoogleというツイッターアカウントで月曜日に発表された。そのツイートを見たユーザーはすでに気づいているかと思うが、残念ながら今回の3つのタスクをこなす機能は現在のところ、米国、英国、カナダ、オーストラリアといった英語圏のみでの展開となっている。

マルチタスクをこなせるのはあなただけではありません。Google Homeも1度に3つのことをこなせるようになりました。つまり、あなたはもっとたくさんのことができるのです。

pic.twitter.com/7jTd97Evus

-Made by Google(@madebygoogle)2018年6月11日

この機能を使うには、他のリクエストと識別するために、音声コマンドの間に“and”を入れる必要がある。各コマンドはまた、追加の情報や説明などなしにGoogleアシスタントが対応できるようなものでなければならない。

つまり、ただ「目覚ましをセットして」ではダメで、アシスタント側が追加で情報を確認しなくてもいいよう「午前7時に目覚ましをセットして」とリクエストしなければならないということだ。

昨年11月に初めてマルチな質問機能が導入された時も、大々的な宣伝はなかった。

しかしGoogle Homeがマルチタスクをこなすのはこの方法でのみではない。2月に、Googleアシスタントではルーチンワークがこなせるようになっている。このルーチン機能では、音声コマンド1回で複数のアクションを実行できるようにカスタマイズできる。

たとえば、あなたの“I’m home”ルーチンで、家の照明をつけ、室温を調整し、音楽を流すというアクションが実行されるように設定することができる(Alexaでも昨年10月からルーチンが利用できるようになっている)。

一方で、5月に開かれたI/Oデベロッパー会議の場で、Google Home アクションのたくさんのアップグレードとともに、Googleは正式にGoogle Homeのマルチな質問機能を発表した(その後、“マルチプルアクション”と呼ばれるようになった)。ここには、ルーチンサジェスチョンも含まれる。ルーチンサジェスチョンでは、音声アプリデベロッパーが彼らのアプリのアクションをルーチンに加えるようにユーザーを誘導でき、アクションノーティフィケーションでは音声アプリがユーザーに新機能やコンテンツなどについて注意喚起することができる。

Googleはこのマルチな質問機能が非英語圏でいつから使えるようになるかは明らかにしていない。“他の言語をサポートするのを楽しみにしている。しかし、今のところは発表することは何もない”と述べるにとどまっている。

アップデート(2018年6月12日、東部時間午後2時半):もし、なぜ自分のGoogle Homeではこの新機能が使えないのだろうと思っている人のために。Googleのツイッターアカウントは実際の提供開始に先立ってスクープ発表したもようで、新機能は間もなく使えるようになるはずだ。しかし、これについての公式発表はない。

h/t: Voicebot

[原文へ]

(翻訳:Mizoguchi)

Google Homeがミニゴルフの全米ツアーを開催、ファミリーで参加できる、賞品もある

ニューヨークやシカゴ、ロサンゼルス、またはアトランタに住んでる人はもうすぐ、ミニゴルフで遊んで†Google Homeのいろんな製品について学べる。古き良き日の、企業の販促イベントみたいだな。(†原注: パターだけでプレイするゴルフなのでputt-puttという言葉が好きな人もいる。)

このプロジェクトに参加しているGoogle社員が、発表のビデオでこう言っている: “ふつうのリビングルームよりもちょっとエキサイティングな環境で、全国の人にGoogle Homeにできるマジックを感じてほしい”。もう一人のGoogle社員は、“ここでできることは、どれも家でできる。あなたの家をミニゴルフのコースに置いたようなものだ”、と言ってる。

  1. 000

  2. 008

  3. 007

  4. 002

  5. 009

  6. 011

当然ながら、仕掛けの中には、Google Homesがコース全体に配置されていて、障害物を避(よ)けるためにはそれらとお話しなければならない、というのがある。このコンペの“賞品”は、Googleの名入りソックスたくさんと、Home Mini数台だ。そしてもちろん、全体がファミリー向けだ。

ニューヨークのコースは、すでに企業向けにオープンしている。そのほかの都市も、すぐに続くだろう。ティータイムの予約は、ここでする。

ジョークを抜きにしても、Googleは明らかに現在の、Homeをめぐる上げ潮ニュースに乗りたいのだ。その中には、Google Homesの売上がAmazonのEchoデバイスを上回った、というのもある。先月のGoogle I/Oカンファレンスでデモした、ちょっと気味の悪いGoogle Assistant、Duplexについてはまだ一言もないが、なんだったらあなたご自身が、Google HomeのミニゴルフコースでGoogle Homeデバイスにたずねてみるとよい。

おまけ情報: ポートランドに住んでる人は、Twin Pines Country Clubへ行けばよい。市の施設だから、企業の宣伝臭なしでputt-puttを楽しめる。無料で。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

ご用心! Echoが勝手に会話を録音して知人に送信した――Amazonから説明あり

オレゴン州ポートランドの一家がKIROニュースで語ったところによれば、一家のAmazon Echoがプライベートな会話を録音し、登録されていた連絡相手に勝手に送信していたという。 Amazonでは「きわめてまれなケース」だとした(Amazonからのさらに詳しい説明を下にエンベッドしてある)。

ポートランド在住の女性、Danielleは夫の会社の社員から「Alexaのプラグを今すぐ抜いた方がいい。ハックされているかもしれない」という電話を受けた。電話してきた社員はAlexaから夫妻が木のフローリングについて会話している録音を受け取ったという。夫妻は事実そういう会話をしていた。

女性はなんとかAmazonの担当者を捕まえることに成功し、問題を報告した。Amazonのエンジニアが問題のAlexaのログをチェックすると報告のとおりの事態が起きていたと判明した。Amazonは声明を発表し、「問題を精査した結果、きわめてまれなケースだと結論した。われわれは将来同様の事態が再発することを防ぐために対策を準備している」と述べた。

いったい何が起きたのか? 私の推測ではEchoデバイスの音声認識システムが何かを聞き違え、会話を録音するよう命じられたと解釈したのだろう。さらに続けて録音したノートないしメッセージをある宛先に向けて送信するよう命じられたという聞き違いが起きたに違いない。しかもこうした一連の動作をユーザーに報告しなかったことになる。

この家庭には複数のAlexaデバイスがあったという。そこでAlaxaは間違ったデバイスで命令の確認を試みたかもしれない。Alexaは「私はスティーブにメッセージを送りました」とリビングのEchoデバイスに発声させたが、スティーブはそのときキッチンに移動していた。…なにかそんなことが起きていたかもしれない。

もちろんAlexaが勝手に会話の録音を知人に送信するなどとは誰も予期していなかったはずだが、EchoAlexaは電源が入っているかぎりいつも聞き耳をたてており、会話を録音してデータをインターネットにアップし続けていることが確認されたのは重要なポイントだろう。Alexaはますます賢くなっている。つまり「会話を録音して知人に送る」程度ではすまない被害をもたらす可能性があるということだ。

アップデート:私はAmazonに何が起きたのかもっと詳細な情報を明かすよう要請した。するとこの稿を公開した後、Amazonは以下のような説明を行った。内容はおおむね私の推測に近かった。

バックグラウンドにAlexaに似た発声があってEchoが起動されたものと思われる。Echoは会話の続きをメッセージ送信の命令と解釈した。Alexaは十分な音量で「誰に?」と尋ねた。その後の背景の会話の一部がAlexaに登録された連絡相手の名前と解釈され、Alexaは「[人名]ですね?」と確認の発声をしたが、それに続く背景の会話を「はい」の意味に取った。ミスがこのように連続することはきわめてまれなケースと考えられるが、われわわれはこうしたミスが再発する可能性をさらに下げるための方策を検討中だ。

[原文へ]

(翻訳:滑川海彦@Facebook Google+

Microsoft、AIでボットとの会話をさらに自然に――Semantic Machinesを買収

今日(米国時間5/21)、Microsoftはバークレーを本拠とするスタートアップ、Semantic Machinesを買収したと発表した。現在のチャットボットはいかにもボットと分かる話し方をするが、Semantic Machinesは会話合成で最大の難題である「自然な話し方」をAIテクノロジーを利用して実現しようとしている。

Microsoftのブログで、AIと研究部門の最高テクノロジー責任者、David Kuは「MicrosoftはSemantic Machinesの買収でバークレーに優秀なAI会話のセンターを確保した。これにより各種のプロダクトの言語インターフェイスが大きく進歩することになる」と書いている。

われわれのCrunchbaseのエントリーによれば、Semantic Machinesは2014年に創立され、これまでにGeneral Catalyst、Bain Capital Ventures他から2090万ドルのベンチャー資金を調達している。

2016年にTechCrunch記事で同社の共同ファウンダー、チーフ・サイエンティストのDan Kleinは「現在の会話テクノロジーは大部分が個別分析的だ。しかし会話システムはコンテキストの認識ができなければならない。つまり単独では意味をなさないセンテンスであっても前後の文脈から正しく解釈できる必要がある」」と語っている。Semantic Machinesは記憶に重点を置いており、AIテクノロジーにより質問を正しく解釈したり答えたりできるだけでなく、人間の会話にさらに近い自然さを得られるとしている。この自然さはSiri、Googleアシスタント、Alexa、それにMicrosoft自身のCortanaなどのスマートアシスタントが獲得のために苦闘している目標だ。

Semantic Machinesはプロダクトを一般向けに販売するのではなく、エンタープライズにライセンスする道を選んだ。このためSemantic Machinesのテクノロジーは、Microsoftの各種のAI会話プロダクトに適合する。これにはMicrosoft Cognitive Services(ユーザー100万)、Azure Bot Service(ユーザー30万)の他にCortanaや中国語ボットのXiaolceでも利用できる。

画像: Natali_Mis / Getty Images

[原文へ]

(翻訳:滑川海彦@Facebook Google+

Google、Assistantのおなら対応に即興演芸の技を利用

Google I/Oの2日目も後半に入りみんなが少し疲れてきた。午後遅くのAssistantのデザインに関するセッションで、Googleの主任デザイナー、Ryan Germickは、AIの個性を作るために即興演芸のスキルを活用していることを話した。そして、人生でも難しい質問のひとつに答えた。

Assitantが「みんなが思うよりずっと多く」受ける質問のが、「おならした?」だ。まず、おならはいつも笑える。そして、人間の発する様々な臭いの責任を押しつけられなければスマートアシスタントを使う意味はない。

Germickは、Googleが体験した、おなら質問に対する色々な答を紹介した。たとえば、「もちろん私ではありません。私には体がありません」というのはあまり満足のいく答ではない。代りにGoogleは「巧みにはぐらかす」やり方として、improv[即興演芸]の入門コースを受けた人が必ず教えられる(”yes, but”ではなく) “yes, and”話法を採用した。

というわけで、Google Assitantにおならをしたかと聞いてみよう。おそらく「私のせいにしたいなら、すればいいですよ」といった感じの25種類ほどの答が返ってくるだろう。

もうひとつ、アイザック・アシモフのロボット工学第4の原則を忘れてはならない:くさいと言いだした人が、おならをした人だ。

[原文へ]

(翻訳:Nob Takahashi / facebook

IoT会話と、文脈から意を汲み取るということ

modern cityscape and business person, IoT(Internet of Things), ICT(Information Communication Technology), abstract image visual

(日本語版注:本稿を執筆したJim Hunterは、Greenwave Systemsのチーフサイエンティスト兼エヴァンゲリストだ)

数年前、テクノロジーとコミュニケーションをとる方法について書いた。当時、身の回りにあったアプリや電話、車、半自動のコーヒーメーカーといった便利なツールを使うときに体験するちょっとした不都合が、何かしら革新的なものの登場でなくなるだろうというのは明らかだった。そうした接続機器を使うのに、たくさんタイプやスワイプしたり、アプリで管理したりする必要があったからだ。

その革新的なものというのは、ある程度、現実のものとなったといえる。

音声でのやり取りがそれだ。いまスマホの音声アシスタント、家や車と接続するスマートスピーカーを使うとき、音声操作が大きな役割を果たしている。この音声操作技術の進歩は現在進行形だ。それはすごいことではある。しかし、やり取りは会話と呼べるものではない。

というのも、この音声操作のほとんどは、友達や同僚との実のある会話のようなものではなく、むしろ4歳の子に「言われた通りにしなさい」と命令するのに近いからだ。

ツールを使うにあたっての不都合を最小限に抑え、そして音声でテクノロジーを最大限利用できるようにするためには何かが必要だ。それは、「文脈から意を汲み取る」ということだと私は考えている。

文脈から意を汲み取るというのは、会話の中で何を意図しているのかを考えることになる。誰が、何を、どこで、いつ、といったシンプルな質問に答えるのはそう難しいことではないし、IoTは私たちの暮らしに関するあらゆる情報を取り入れるようになっている。私は以前、アメリカの心理学者マズローの欲求段階説のチャートに倣って、IoTデバイスに必要とされることをピラミッド式に描いたことがある。テクノロジーが分析手法を用い、ロジックや予測することを学習し、そしてより複雑なことをできるようになるというものだ。AmazonのAlexa、AppleのHomePodなどで使われている音声操作や自然言語処理の技術は、まさしくIoTデバイスに必要とされることの実現例だ。リアルタイムに情報を収集し、複雑な機能でもって処理するという、予知解析や機械学習を取り込んでいる。

それでもまだ、AlexaやHomePodとのやり取りは会話とは呼べない。役には立っているが、コミュニケーションとしてはまだ初期段階にあり、成長の余地はある。

というのも「どのように」「なぜ」といった掘り下げた質問が、会話の中で重要な意味を持つからだ。真の双方向会話を実現するには、そうした質問に対する答えを複数用意するだけでなく、学習し記憶しなければならない。Googleはそうした手法をいくつかのオンライン検索に取り込んでいる。しかし、自然な会話を実現するためにはまだたくさんの課題がある。

文脈から意を汲む能力の開発、それが接続機器の最終目標

人の会話の多くは要約されている。会話の量がどれだけあろうが、やりとりに分解することができる。名詞や固有名詞を代名詞に置き換えるのがいい例だ。「Daveの休暇について尋ねたところ、Janeは“私が彼を空港に送って行って見送る”と言った」。こうした文章は序の口で、簡略してはダメ、となったら会話はすごく不自然なものになる。毎回、きちんとした名称を使うとなったらやりづらく、スムーズではない。

会話というのをシンプルに定義づけると、それは感情やアイデアのカジュアルなやりとりということになる。それは人々がコミュニケーションをとるために自然に行う。くだけた会話というのは、文脈的な要素が大きく、また凝縮していて包括的なものだ。物語を語るような要素も含まれる。会話はあちこちに飛ぶし、時間軸も動く。新しいことについて情報交換するとき、過去に共有したことをベースに話すこともある。推測を伴うこともあれば、厳密に会話に執着しなくてもいいこともある。こうした会話手法は、IoTに仕込まれたものとは全く正反対のものだ。機械によるコミュニケーションというのは、コードに基づいている。それは二分法であり、供給源に制約があり、杓子定規だ。情報はあるが、文脈というものに乏しい。あまりにもカチッとし過ぎていて、物語を語るにはほど遠い。

IoTを活用するときに私たちが感じる違和感は、こうしたアプローチの違いによるものだ。デバイスを操作するときに新しいアプリをダウンロードし、起動の言葉を設定する。そして別のデバイスのために違う言葉を設定し、アップデートを繰り返す。そんな調子だから、買って2週間後にはデバイスは引き出しへとお蔵入り、ということになるのだ。人が望むようなやりとりではないのだ。

不気味さプライバシー問題はさて置き、私たちの身の回りの情報を絶えず収集するデバイスに関していうと、人間が好む会話ができるよう文脈を読む技術を獲得しつつある。目指すところは、人がいつでも違和感なくデバイスを使えるようになることだ。

今後取り組むべき課題は、マシーンに人間のような会話能力を持たせることだろう。会話が自然なものとなるよう、文脈や推測、そして形式ばらないよう吹き込まなければならない。こうした取り組みをすでに始めているのが国防高等研究計画局であり、AmazonGoogleでもある。実際のところ、テクノロジーを開発するにあたって、もっとも注力されるのはインターフェースの使いにくさをいかに少なくするかという点だ。そうした意味でいうと、会話の質を高めるというのは、使いやすさに直結する。

IoT、拡張現実、アシスタント知能(AIという言葉を私はAssistive Intelligence ととらえている)、さらにはモバイル機器ディスプレイでの小型化や拡張、電気まわりの改善といったものも、全ては質の改善を追求した結果といえる。それらテクノロジーにより、文脈を読み取る、究極的には自然な会話をする機能を開発することができると考えられる。これを活用すれば私たちの暮らしは会話にあふれたものとなる。そして、ひとたびテクノロジーと有意義な会話を経験すれば、夢中になること間違いなしだろう。

[原文へ]

(翻訳:Mizoguchi)

Amazon Alexaの使い勝手、大きく改善へ――過去の会話を記憶、必要なスキルを自動的に起動、会話も自然に

Alexaは近く過去に質問されたことを覚えているようになる。会話も自然になり、コマンドも常にAlexa!と始める必要はなくなるという。また必要とされるスキルを判断し、明示的に命令されなくても自動的にそのスキルを発見し起動する。Amazonではこれを手はじめに、年内に繰り返しAlexaの機能強化を行っていくという。Amazonのスマート・アシスタントはいっそうスマートになり、それぞれのユーザーのニーズにフィットし、さらに役立つようになる。

フランスのリヨンで開催されているWorld Wide Web Conferenceで今朝(米国時間4/26)のキーノートで 、Alexa Brainグループの責任者、Ruhi Sarikayaがこのニュースを発表した

Sarikayaによれば、Alexa Brainグループの目的はAlexaがユーザーとの会話のコンテキストを認識し、記憶できるようするところにある。またすでに4万種類にも上るサードパーティー製のスキルから目的に応じて適切なものを発見し使用できるようにする。こうした改善によりユーザーはAlexaをさらに容易かつ効果的に利用することができるようになる。

当面アメリカのユーザー向けに公開される予定の記憶力の改良ではAlexaは質問された内容をすべて記憶し、必要に応じて後で利用できるようになる。

たとえば「Alexa、ショーンの誕生日は6月20日だということを覚えて」 と命じるとAlexaは「オーケー、ショーンの誕生日は6月20日です」などと答えるはずだ。ユーザーは重要な情報を覚えるという仕事をAlexaに肩代わりさせることができる。

物事を記憶できることはGoogle Assistantでもいちばん役立つ能力だ。そこでAlexaとしてはもどうしてもこの面で追いつく必要があった。

また近くAlexaはいっそう自然に会話できるようになる。Alexaが会話のコンテキストを記憶するコンテキスト・キャリーオーバーと呼ぶ能力を備えると、質問ないしコマンドに続くフォローアップのコマンド、質問をいちいちAlexa!という呼びかけで始めなくてもよくなる。

たとば、「Alexa、シアトルの天気を教えて」と命じてAlexaが答えた直後に「今週の週末は?」と尋ねるとAlexaはそれを理解する。

さらに質問のトピックを変えることもできる。「Alexa、ポートランドの天気を教えて」と命じた後、「そこまでどのくらい時間がかかる?」と尋ねることができる。

Sarikayaによれば、こうした能力は自然言語処理に高度な深層学習モデルを適用したもので、会話内容とそのコンテキストを「ドメインを超えて」維持でする。例のように「天気」と「交通」という異なるドメインの間でもユーザーの意図を一貫して把握できるわけだ。この能力を利用するためにはユーザーはフォローアップ・モードを有効にする必要がある。これによりデバイスは「Alexa!」という起動キーワードなしでも反応できるようになる。

この自然な会話能力がAlexaにやってくるのはアメリカ、イギリス、ドイツが最初となる。ただし「近く」とだけで正確な期日は明らかにされていない。

Alexaに近く導入されるアップデートにはスキルの自動起動がある。Alexaの能力を拡大するために多数のサードパーティー製の音声アプリが開発されている。クレジットカードのアカウント情報を参照する、ラジオでニュースを聞く、Uberに配車を依頼する、ゲームをプレイする等々だ。しかしAlexa Skillsストアには登録されたアプリの数が非常に多くなっているためユーザーが必要なスキルを発見するのが難しくなっている。

これに対応して、向こう数週間以内に、アメリカのユーザーは「Alexa、 [スキル名]をオープン」のように明示的に名称を指定しなくても必要なスキルを起動できるようになる。

AmazonではAlexaのスキルを容易に使用できるようにしようと年来努力を続けてきた。2016年にEchoから音声でAlexaのスキルを起動できるようにアップデートされた。昨年はある種の質問に限定されるものの、Alexaは対応するスキルを推薦できるようになった。今回リリースが予定されている新機能ではAlexaが自ら適切なスキルを探し出し、起動することができる。現在ベータ版がテストされている。

SarikayaはプレゼンでAlexaにシャツについた油のしみ抜き方法を訪ねた例を挙げている。

これに対してAlexaは「Tideという染み抜き製品があります」と答えた。これはProcter & Gambleが開発したスキルによるもので200種類以上の染みに対してそれぞれ対処方法を教える。

これまではユーザーが自分でTideのしみ抜きスキルを探して出してローンチするということは考えにくかった。しかしAlexaが「しみ抜き」というキーワードを理解してTideを発見、起動してくれることになれば利用の可能性ははるかにアップするだろう。

この能力はAmazonに新たな広告モデルを提供する可能性がある。 Googleにキーノート入札による広告システムのようにAlexaのキーワードを競争入札方式で販売することになるかもしれない。もしAlexaに対する質問に対するスキルの答えが特定のブランドやプロダクトを推薦する場合、有力な広告手段となる(もちろんフォローアップ・モードが有効な場合、「他には?」という質問で別の製品が推薦されるかもしれない)。

この新機能についてもローンチ期日は「近々」としか分からない。しかしSarikayaによれば、これらの新機能もAlaxaの強化の第一歩だという。【略】

「スキル発見、コンテキスト・キャリーオーバー、質問の記憶など、今回予定されている3つのアップデートはAmazonの技術陣によるAlexa改良のごく一部だ。われわれはAlexaをフリクションフリーで使えるようよう研究を重ねている。これは人間とコンピューターのインターフェイスを根本的に変革する何年もかかる道のりの一環だ。Amazonはまだ最初の一歩を踏み出したに過ぎない」とSarikayaは述べた。

[原文へ]

(翻訳:滑川海彦@Facebook Google+

AlexaがデジタルアートフレームMeural Canvasを統合、声で次の絵を表示できる

Alexaは、正しい質問を正しく訊けば、何でもやってくれる。そして今日(米国時間4/25)覚えた新しスキルは、デジタルアートを鑑賞するためのフレーム、Meural Canvasの操作だ。

この595ドルのデバイスを使って、新人アーチストたちの作品を閲覧できるだけでなく、一般公開されている古典の名作も鑑賞できる。

この製品のクールな特長のひとつが、ジェスチャーでコントロールできることだ。フレームの前で手を振れば、次の作品が現れる。お客が来ているときや、デバイスが身近な場所に置いてあれば、こんな体感的なコントロールはとても良い。逆に、手の届かない壁にかかっているなら、Meuralが提供しているモバイルやデスクトップのアプリケーションが便利だ。

今回のアップデートで、スマートホームのファンにとってはさらに便利になる。それに、スマートペインティングを買ってる人なら、家中あちこちに音声アシスタントのハブがあるだろう。今それはAlexaだけで、Google AssistantやHomeKitのユーザーは待たなければならないけど、美術作品のスワイプをEchoに命じるだけでできるのだ。

デジタルアートの会員制サービスでは、Meuralはかなり名が知れている。最初は、デジタルフォトフレームの高級機だったけど、やがて同社には、デジタルアートの月額会費制、というアイデアがひらめいた。けっこう難度の高いサービスなので、競合他社は多くない。たとえばElectric Objectsは、昨年そのハードウェア事業を閉鎖して、ソフトウェアやコンテンツの資産をGiphyに買収された。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Amazonの隠れページに‘Fire TV Cube’(Echo+Fire TV)の予告が

数か月前から浮遊している噂によると、AmazonはFire TVのメディアストリーミングとEchoの音声アシスタントを合体した新しいデバイスを発売するらしい。最近現れたそれらしきデバイスのリーク画像(下図)にはキューブ状の製品が写っているので、その未発表のデバイスは勝手に“Fire TV Cube”と呼ばれるようになった。

すると出ました!、Amazon.comの上にひっそり隠れていた公式ページらしきページが、Fire TV Cubeという言葉を使用し、“詳細は近く発表(details coming soon)”とある。

AFTVNewsが見つけたこの間に合わせ的予告ページには、いずれ詳細を発表する、とある。“What is Fire TV Cube?”という大きなタイトルと、詳細情報へ行くサインアップ・ボタンがある。それだけだ。

この、各種ニューズレター申し込みページ(これはamazon.comのアカウント保有者のための情報サービスの一部)にも、“Fire TV Cube”がある。よく探せば。〔上記のサインアップ・ボタンからも〕

そのリーク情報によると、Fire TV CubeにはEchoのスピーカーと、遠距離マイクロフォンとLEDのライトバー、そして4K対応Fire TVの回路基板がある。それをテレビにつなげば、1台2役のデバイスとなる。

つまり、発売の有無や時期はまだ何も発表がないけれども、それらしきものの準備が進められていることは確実なようだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

ソニー「Xperia Ear Duo」4月21日発売決定、LINE Clova対応の遮音しない左右独立イヤホン

eng-logo-2015ソニーモバイルは「Xperia Ear Duo」を4月21日に国内発売します。ソニーストアにおける販売価格は税別2万9880円です。カラバリはブラック・ゴールドの2色展開。

Xperia Ear Duoは、外界の音を遮断しない「デュアルリスニング技術」を搭載した左右独立型スマートイヤホンです。外の音と曲のサウンドの両方がクリアに聞こえるので、ジョギングなどの運動中や仕事中、人と会話をしながらでも、問題なく利用できるといいます。

さらに、ソニー独自の高音質化技術「ClearPhase」も採用。外界の騒音レベルに合わせて、自動的にイヤホン音量を調節する「アダプティブ・ボリューム・コントロール」も搭載します。

●まるで”耳にはめるスマートスピーカー”

Xperia Ear Duoは、いわば耳に装着するスマートスピーカーでもあります。Androidスマートフォンと連携すれば、LINEの音声AI「Clova」や、「Google Assistant」を利用可能。Clovaを使えば声だけでLINEメッセージも送受信したり、LINE Musicの音楽を再生することも可能です。なお、iPhoneと連携した場合、アップルの音声アシスタンス「Siri」のみ利用できます。

マイクは左右に2つづつ、合計4つ搭載。騒がしい環境でも声を拾い、ハンズフリー通話やボイスコントロールも快適に行えるといいます。

連続音楽再生時間は4時間。付属のケースはバッテリーを兼ねており、最大3回分の充電が行なえます。

●法人展開めざしJALと実証実験も

Xperia Ear Duo、およびXperia Earで最大5台までリアルタイムグループ会話できる「Anytime Talk」機能も搭載。ソニーモバイルは同機能の法人展開をめざし、JALと提携。機内での客室業務員のコミュニケーションを補助するデバイスとしての用途について、実証実験を行うとしています。

関連:ソニーの左右独立スマートイヤホン Xperia Ear Duo、遮音性『ほぼゼロ』の開放感が魅力

Engadget 日本版からの転載。

子どもたちを食事に呼ぶためにAmazon Echoを使える…家庭内の増設需要をねらうか?

Amazonが今日、Echoの前から約束していた機能を開始した。そのAlexa Announcementsと呼ばれるスキルは、同社のスマートスピーカーを一方向だけのインターホンにして、家にいる家族に通信できるようにする。

これは基本的には一種の中継システムで、あなたが、“Alexa、ご飯ができたよと言って”(Alexa, announce that dinner is ready)、と言うと、家中のEchoが“ご飯ができたよ”(Dinner is ready)を中継する。これは、世界でいちばん退屈な、電話ゲーム(同じ言葉をリレーしていく…)のようだ。ほかに、“Alexa、みんなに言って…”(Alexa, tell everyone…)や“Alexa、…と放送して”(Alexa, broadcast…)、でもよい。

複数の部屋にEchoのある家庭では、便利な機能だろう。Alexaの既存の通信〜コミュニケーションスキルとしては、ほかにもAlexa CallingやMessaging、 Drop Inなどがあるけど、今度のこれだけは、ホラー映画のように“家(うち)の中から声がする”。また、Echoを一台だけ持ってる家庭の増設需要を、Amazonは期待しているかもしれない。

この機能はまず、アメリカとカナダから始まる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

AmazonがEcho Buttonのゲーム用APIをベータで公開

Echo Buttonsは、AmazonのR&Dから出て来るハードウェアとしては一風変わっている。最新のEcho製品群と一緒に発表されたこの小さなライトのようなデバイスは、Alexa Echoの製品系列の中に対話的なゲームプレーを持ち込むことがねらいだ。

同社はすでにいくつかのゲームを発表しているし、これ用のAPI、Gadgets Skill APIのベータも公開されたから、今後もっと増えるだろう。

デベロッパーはボタンを押すことにいろんなスキルを結びつけて、ライトアップのアニメーションをこのハードウェアに送る。APIのプレビューバージョンは、これを二つ使ういろんな体験の開発例を示している。その中には、キング牧師の“I Have a Dream”スピーチを再生するのとか、HasbroのTrivial Pursuit(雑学クイズ)などがある。それほど多くはないが、いろいろ選べる。

玩具メーカーが発表したゲームもある。それは1980年代の記憶ゲームSimonのEcho Buttonバージョンだ。そのSimon Tapゲームは今ダウンロードできる。するとAlexaが色の名前を次々と言うから、プレーヤーはそれらをマッチさせる。このハードウェアは、Echo, Echo Dot, Echo Show, Echo Plus, Echo Spotなど、ほとんどのEcho製品と一緒に使える。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Alexaから音声でいろんな慈善団体に寄付ができる

2017年の確定申告にはもう遅すぎる、という絶妙のタイミングでAmazonは、ユーザーが音声で寄付ができるスキルをAlexaに加えた。そのコマンドは予想どおりに単純で、“Alexa、全米がん協会に20ドルを寄付して”、と言うだけだ。すると、あなたのアカウントから寄付が行われる。

Alexaは、ユーザーが意図しない買い物をせずにすむために、4桁の音声確認コードを使う。だから寄付も、家族の誰かがあなたの口座からしてしまうおそれはない。でもそれは、くだらない買い物にお金を使うよりは、ましかもしれない。

寄付をするとユーザーの名前やメールアドレスが寄付先の団体と共有されるが、クレジットカードの情報は大丈夫だ。ユーザーには寄付確認のメールが来るし、情報をAmazon Payで調べることもできる。

Alexaから寄付ができるのは40の団体で、そのリストがここにある。“Alexa、寄付をして”だけ言うと、リストから団体を選ばなければならない。Amazon Payの機能が増えたようなものだが、これは今や、100万人あまりの顧客が慈善団体への寄付に利用しているそうだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Alexaが録画指示のスキルをデベロッパーのAPIとして提供、既存サービスによる実装を期待

徐々にそして着実に、Alexaは多機能なビデオアシスタントになりつつある。1月には、AmazonはAlexa用のVideo Skill APIをローンチし、ケーブルや衛星からのアプリをユーザーがコントロールできるようにした。そして今週行われたそのアップデートでは、このスマートアシスタントで番組の録画を指示できるようになった。それは、視聴者にとって、すごく重要な機能だ。

このスキルは、Dish, TiVo, DIRECTV, Verizonなどの大手プロバイダがすでに提供しているファンクションを統合している。これら各社がAlexaのスキルをアップデートして、この新しい機能(録画開始)を持たせるだろう。するとすべてが、ユーザーの期待どおりに動作する。

“Alexa、ニューヨークヤンキースの試合を録画して”、と言うと、そのためのサービスがまさにそれをする。もちろん、どの野球チームでもよい。

また今回のアップデートでは、頻繁に行く場所に直接ジャンプできるようになった。たとえば録画のインタフェイスとか、NetflixやAmazon Primeなどのビデオサービスなど。Amazonはこのトピックに関する記事で、そんな例を挙げている。そして番組が始まったら、Alexaに、「ここでポーズして」、などの指示を出せる。〔コマーシャルのスキップか?〕

このスキルは今、デベロッパーにとって可利用だから、上記のサービスに実装されるのも早いだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa