アマゾンが不動産管理者向けのAlexaサービス「Alexa for Residential」を開始

アマゾンは、不動産管理者にAlexaを提供したいと考えている。米国時間9月3日朝、同社は新サービス「Alexa for Residential」の提供を開始した(Amazonブログ記事)。これは、コンドミニアムや集合住宅などの建物で、不動産管理者がAlexaを使ったスマートホーム体験を簡単に設定・維持できるようにすることを目的としている。米国の大手不動産会社である、IOTAS、STRATIS、Sentient Property Servicesの3社は、開始時にAlexa for Residentialサービスを利用する最初のスマートホームインテグレーターとなる。

Alexa for Residentialは、Amazonのアカウントを持っていない人でもAlexaをスマートホーム管理のためのツールにしようというものだ。新しい居住者は、自分のデバイスを購入したり、何かを設定したりする必要はない。代わりに、住居備え付けのEchoデバイスに話しかけて、彼らの住居で利用可能なさまざまなスマートホーム機能を制御し、基本的なAlexaの機能を使用することができる。

物件管理者は、各住居ごとにAlexaのカスタムスキルを作成して、入居者にメンテナンスの依頼を出したり、アメニティの予約をしたり、Alexaを介して家賃の決済ができる。

居住者が自分のAmazonアカウントを持っている場合、住居備え付けのEchoデバイスにリンクすることも可能だ。一度リンクされると住民は、音楽のプレイリストを聴いたり、Alexaデバイスから友人や家族を呼び出す機能などAlexaのすべての機能を使えるようになる。

居住者が自分のアカウントをリンクさせた場合、不動産管理会社は顧客の個人データにアクセスすることはできなくなる。またAlexa for Residentialでは、入居者の録音した音声は毎日削除される。

しかし、入居者の賃貸契約が終了したり、退去したりした場合には、スマートホーム管理のためのデバイスの既存の設定を中断することなく、不動産管理者がリモートでデバイスをデフォルト設定にリセットして、次の入居者に備えられるようにすることができる。

今回の発売によりアマゾンは、消費者へのEchoデバイスの直接販売を増やさなくても、Alexaの普及を拡大できる市場へのさらなる投資を行うことになる。

アマゾンは以前にもこの分野でパートナーシップを組んでおり、2018年11月には現在PayLeaseの子会社となっているZegoと提携(Business Insider記事)し、3万戸のアパートにAlexaスマートホームデバイスを展開していた。同じく2018年には、RedAwningをパートナーにして不動産管理ツールをローンチした(Property PortalWatch記事)。これはもともとはホテル用だったAlexa for Hospitalityサービスによって実現した。休暇用レンタルサービスも同様の統合を目的にAlexaを利用(Vrmintel記事)している。この分野向けに設計された不動産管理やAlexaのスキルを対象とした、独立したスマートホームテクノロジープラットフォームもある。

もっと広く言えば、アマゾンは他のサービスをロールアウトし、2018年のAlexa for Hospitalityの立ち上げや、Lennarのような住宅建設業者との取引のようにB2B取引を通じて住宅でのAlexa使用を拡大する可能性のあるパートナーシップを発表している。こうした取り組みが成功しているかどうかはまだ判断がつかない。共有デバイスがプライバシーの問題を引き起こすと感じている人(Phys.org記事)もいれば、ほかの設備がうまく配備されていないと感じている人(PhocusWire記事)もいるなど、メリットとデメリットがあるからだ。

しかし、アマゾンはこの最新サービスのアイデアを、不動産管理者が収益を増やすための方法として売り込んでいる。同社は、84%の賃借人がスマートホームのアメニティを備えたアパートを希望しており、61%が音声アシスタントの月額料金を支払うと述べた全米アパート協会のデータを引用している。

とはいえ、このデータは新型コロナウイルスの感染が蔓延している現在の経済を反映していないだろう。現在は失業者が増え、経済に大混乱をもたらしている。 Alexaデバイスとその使用のための追加コストはいまでは必需品ではなく、より贅沢なものとして見られるかもしれない。

画像クレジット:Amazon

原文へ

(翻訳:TechCrunch Japan)

音声AIがスマホカメラに映る映像を解析して質問にズバリ答えられるようにするWorldGaze

音声アシスタントがアホすぎてイラつくのは、誰もが経験すること。音声で機器が操作できるAIは便利この上なしともてはやされているが、実際に使ってみれば、たちまちロボット特有の気の利かなさに泣かされることになる。

命令を実行する前に、もっと情報をくれと聞き返してくる(ときには何度も聞いてくる)スマートスピーカーは、なおさらアホに感じられる。たとえば、自動車修理工場のことを質問したとき、それが今車を停めている目の前にある工場のことだと察してくれなかったり。

カーネギーメロン大学ヒューマン・コンピューター・インタラクション・インスティテュートの研究者たちは、Apple(アップル)の機械学習エンジニアGierad Laput(ジェエラード・ラプット)氏と共同で、音声アシスタント用アドオンのデモソフトを開発した。スマートフォンに内蔵されているAIに手を貸して、というか頭を貸して賢くするというものだ。

このシステムのプロトタイプでは、スマートフォンの前面と背面のカメラを同時に使い、物理空間(具体的には身の回りの環境)のどの位置にユーザーの頭があるかを認識する。それをコンピュータービジョン技術で解析して周囲のものを識別する。

するとユーザーは、自分の頭をポインター代わりにして、何を見て話しているのかをAIにわからせることができる。例えば「あの修理工場」で通じる。言葉で説明することなく、AIの理解の中にできた文脈の切れ間を、研究者たちの言葉を借りれば、より自然に埋めることができるという。

なので、音声アシスタントの利便性を引き出したいとき、こっちがロボットみたいな話し方をする必要はない。もっと、まあ言うなれば、人間的に話せるのだ。こんな聞き方が可能になる。例えば「Siri、そのスタバはいつ閉まる?」とか、買い物では「そのソファ、別の色はないの?」とか、値段の比較も「この椅子と、あっちのやつ」と簡単に質問できる。または、目で見ている照明器具を欲しいものリストに追加させるといったことが可能になるかもしれない。

このシステムでは、家や職場で視界に入っているいろいろな機器の遠隔操作もできる。めちゃくちゃ細かく機器を指定する必要はない。ただスマートTVやエアコンの温度調節器やスピーカーを見て、音量や温度の調整を指示すればいい。

研究チームは、WorldGaze(ワールドゲイズ)と名付けたこのプロトタイプの動作の様子をデモ動画(下)にまとめた。「私たちは、iPhoneの前面カメラで頭を、方向ベクトルとともに、三次元的に追跡しています。前面と背面のカメラの位置関係はわかっているので、頭のベクトルを背面カメラで見えている世界にレイキャスティングすることができます」と彼らは動画の中で解説している。

「これによりユーザーは、その方向に頭を向けて見るだけで、話の対象となるオブジェクトや場所を直感的に指示できます。音声アシスタントがこの文脈情報を採り入れることで、より正確で自然な問い合わせが可能になります」

このプロトタイプを紹介した研究論文では、これは「現在はデバイスを見ながら街を歩いている人たちに象徴されるモバイルAR体験のソーシャル化」にも応用できるとしている。

どのようにこれを拡張するのかと尋ねると、カーネギーメロン大学の研究者であるChris Harrison(クリス・ハリソン)氏は、TechCrunchにこう説明してくれた。「人々は、いつも手元のスマホを覗き込みながら歩いています。それはあまりソーシャルではありません。他の人たちと関わることがなく、周囲の美しい世界を眺めることすらないからです。WorldGazeのようなものがあれば、人々は周囲の世界を見ながら、スマホに目を落とすことなく、レストランの評判を尋ねたり聞いたり、買い物リストにものを追加したリができるようになります。スマホには、それを可能にする能力が備わっています。何か特別なものを買い足す必要はありません」。

彼らの論文には、インタラクティブな目的でユーザーの視線を追跡する研究は息の長いものだと書かれている。しかし、ここでの彼らの主な目的は、「市販されているスマートフォンに備わったハードウェアを使うという制約を課した中での実用的なリアルタイムのプロトタイプ」の開発だった(背面カメラの視界が潜在的な制約になると彼らは話しているが、性能の劣るあらゆるハードウェアを部分的に迂回する提案もされている)。

「WorldGazeは単独のアプリとして発表することもできるが、私たちはWorldGazeをバックグラウンドのサービスとして内蔵し、音声アシスタントを呼び出したときに(例えば「ヘイ、Siri」の呼び掛けで)同時に起動するようにしたいと考えている」と彼らは書いている。「前面と背面のカメラを同時に開きながらコンピュータービジョンの処理を行えば多くの電力が消費されるが、デューティ比(ある期間に占めるその期間で現象が継続される期間)の割合は低く、現代のスマートフォンのバッテリー寿命に大きく影響するほどではない。両方のカメラから画像を1フレーム取り込むだけで済むこともあり、すぐにオフにできる(WorldGazeの起動時間は7秒)。実験装置では、電力消費量はひとつの質問につき最大0.1ミリワット毎時と評価された」。

それでもまだ、人が顔の前にスマホを掲げて、そこに話しかける姿はなんとなく異様に見える。しかし、ソフトウェアは、ARグラスにも簡単に対応するとハリソン氏は強調していた。

「どちらも可能です。スマートフォンを使ったのは、誰でも持っているからです(WorldGazeはソフトウェアのアップデートで実装できる)。ARグラスを持ってる人は(まだ)ほとんどいませんからね。しかし、どこで音声アシスタントをパワーアップしたいかとう前提は、両方に共通しています」とハリソン氏はTechCrunchに話してくれた。

「ARグラスは、センサーを搭載して視線のトラッキングができるようになってきています(例えばMagic Leapは、焦点の調整にそれを採用している)。その場合は、外向きのカメラだけあればよいことになります」と彼は言う。

このようなシステムが、顔認証技術を合体する未来は容易に想像できる。スマートグラスをかけた人間が、ちょっと視線を向けて「あれは誰だ?」と尋ねるような。顔のデータがAIのメモリーバンクに合法的に蓄積されていたと仮定しての話だが。

「連絡先に追加」や「最後に会ったのはいつか」を調べる機能などは、ネットワークの利便性やソーシャル化を高める目的で解放されるかも知れない。だが今の時点では、こうしたシステムを現実世界に解き放つことは、プライバシーの観点からして、工学的技術をつなぎ合わせるよりも、むしろ難しいように思える(たとえば、Appleは規範違反だとしてClearview AIをブロックした事例もある)。

「その方向へ進むには、一定のセキュリティーを保ち、許可を取る必要があります。現時点で私たちが考えていることではありませんが、興味はあります(怖いアイデアですけど)」と、その可能性について尋ねられたハリソン氏は同意した。

研究チームはこの結果をAMCのCHI2020(計算機システムにおけるヒューマンファクターに関する会合)で発表する予定だったが、新型コロナウイルスの影響で会合は中止となった。

[原文へ]

(翻訳:金井哲夫)

スマートスピーカーでの買い物は思ったほど伸びていないとの報告

eMarketerが米国時間2月4日に発表した報告によると、米国の消費者は音声による買い物には予測に反して即座に飛びつかなかったようだ。消費者は、スマートスピーカーを自宅に置いたことには満足しているが、音楽をかけたり情報を聞いたりといった単純な目的で使用するのがほとんどで、なかなか買い物には使われていない。確かに音声で買い物をする人の全体数は増えている。しかし、事前の予測よりも増え方がゆっくりなだけだとアナリストたちは解説している。

今年末までには、自分のスマートスピーカーで買い物をしたことのある人の数は2160万人になるとeMarketerは予測している。これは、2019年第2四半期に予測された数を下回る。当時は2360万人に達するとされていた。

だが重要なのは、スマートスピーカーで買い物をする人の数は増えているということだ。今年は、米国でデジタル機器を購入した人のうち10.8%がスマートスピーカーで買い物をするという、ひとつの目標を達成する可能性もある。

2019年から2021年に米国でスマートスピーカーを買う人の人数と、デジタル機器購入者のうちの割合。黒がスマートスピーカーの購入者(百万単位)、赤がデジタル機器購入者に占める割合。上記の暦年期間にスマートスピーカーで音声による買い物を少なくとも1回行った14歳以上の個人を対象としている(eMarketer 2019年12月)

eMarketerは、予測よりも数の伸びが遅い原因として、セキュリティーに不安を持つ消費者はスマートスピーカーやそのメーカーを完全に信用していないなど、いくつかの要素を挙げている。消費者の多くは、購入を決める前に商品を目で確かめられるよう、画面と組み合わせて使いたいとも考えている。AppleとGoogleは、画面とスピーカーと音声アシスタントを内蔵したスマートホーム・ハブで、その問題に対処した。しかし、すでに古いタイプのEchoやGoogle Homeを持っていて、新しく買い直す気になれないという消費者もいるはずだ。

さらにこの報告で、ユーザーがオーディオを聞く割合(81.1%)と質問をする割合(77.8%)の推定値が引き上げられた。

「出前を注文したり、レシピを調べたり、ゲームをしたり、スマートスピーカー用アプリが数多く存在しますが、その能力を完全に引き出すためには、もうひとつ、特別なステップを踏み出さなければならないことに、多くの消費者は気付いていません」とeMarketer主任アナリストVictoria Petrock(ビクトリア・ペトロック)氏は言う。「むしろ、オーディオを再生したり、天気を調べたり、質問をするといった直接的なコマンドに留まっています。それがデバイスの基本的な機能だからです」。

利用状況ごとの米国のスマートスピーカー利用者、スマートスピーカー所有者のうちの割合。上から、オーディオを聞く人、質問する人、買い物をする人、スマートホームの操作をする人、バイヤーなどの利用も少なくとも月に1回それぞれの目的でスマートスピーカーを利用しているあらゆる年齢層の個人を対象とする(eMarketer 2019年12月)

公正を期するために言えば、こうした予測はスマートスピーカーの利用状況を完全に示すものではない。例えば、商品を買い物リストに加えるようAlexaに命令して、後でインターネットで購入するという消費者も多い。だが、それは音声による買い物には数えられていない。むしろ、スマートスピーカーは、いろいろな命令の聞き役であり、後で買いたいという消費者の意図を受け付けるが、実際の購入行動はとらないというだけだ。

とはいえ特にAmazonは、音声による買い物の可能性をうまく生かしきれていない。音声コマンドとAmazonでの買い物と結びつければ、簡単に実現しそうに思えるが。言葉を聞いただけ勝手に購入してしまう数々の問題に神経質になっているからかも知れないが、Amazonは音声による買い物の機能を率先して開拓してこなかった。音声による買い物を日常化する、または簡単な言葉で1回限りの買い物を定期購買に進めさせる方法は、Amazonならいくつも思いつくはずだ。

Amazonは、Honey(現在はPaypal所有)のような機能群の開発も可能だろう。値引きやセールの有無を常に見張っていて、EchoのオーナーにAlexaの通知プラットフォームを使って伝える。またはAmazonのコンパニオンアプリのスキルを使ってもいい。ユーザーの日々のフラッシュブリーフィングに追加するのもいいだろう。例えば「あなたがウォッチしている商品は50ドル値引きされました。現在の価格は◯◯ドルです。購入しますか?」という具合だ。

コンパニオンは商品の在庫状況を監視して、好きなブランドの商品が入荷されたときに知らせたり、コンパニオンアプリにおすすめとして写真を送ったりもできるだろう。ところが、Alexaの音声による買い物は、まったく退屈なままだ。ここを改善しなければ、買い物機能はいつまでたっても消費者から敬遠され続ける。

eMarketerは2月4日に、スマートスピーカーの利用状況の新たな予測値も発表した。米国のスマートスピーカー利用者数の2020年の予測は、8450万人から8310万人に下方修正されている。普及がやや鈍化するという見通しだ。

[原文へ]

(翻訳:金井哲夫)

BBCが独自の音声アシスタントを開発中:コードネームは“ビープ”

BBC、別名英国放送協会、別名ザ・ビープ、別名アーンティー(おばちゃん)は、音声アシスタントに参戦しようとしている。

ガーディアンは、“ビープ”(Beep)という仮称を与えられた、このアレクサのライバルの開発計画を報じたが、巨大ハイテク企業にくらべてBBCの開発資源が細身であることから、機能的には明らかに軽量級だ。

BBCのニュースサイトによれば、このデジタル音声アシスタントは来年にローンチされる予定だが、これを使うための専用のハードウェアは持たず、「あらゆるスマートスピーカー、テレビ、モバイル」に対応するという。

しかしなぜ、公的資金で運用されているこの放送局が、アマゾンのアレクサ、Googleアシスタント、アップルのSiri、それにサムスンのビクスビーなどなど民間企業の製品がひしめく市場に向けたAI開発に投資することにしたのだろう。その狙いは、「誰かに許可をもらって決められた方法でやるのではなく、新しいプログラム、機能、体験を自分たちで作る実験」だとBBCの広報担当者はBBCニュースで語っていた。

BBCは、職員に参加してもらって音声データを集め、AIをトレーニングし、方言の宝庫であるイギリスの言葉に対応できるようにしたようだ。

「BBC iPlayerのときと同じく、この新しいテクノロジーの恩恵を誰もが受けられるように、そしてエキサイティングな新しいコンテンツ、プログラム、サービスをみんなに届けられるようにしたいのです。それも、信頼できる簡単に使える方法で」と広報担当者は言い加えた。「これは、公的サービスの価値が音声認識機能の中でも保たれることを確かにする、新たな一歩となります」

この動きは一見すると、すでに長年にわたり民間企業との最先端の音声AIの開発に投資をしてきたことへの反動のようでもあり、守りの態勢のようでもあるが、BBCにはライバルの巨大ハイテク企業にはない強みがある。地方の方言に精通していることに加えて、サービスとしての愛される人格を提供できる音声アシスタントのデザインに、ニュースや娯楽の膨大なアーカイブを利用できることだ。

ドクター・フー』を演じたトム・ベイカーの声で(宇宙の)天気を知らせてくれたら、どんな感じだろう。または『ダッズアーミー』の登場人物が今日の予定を話してくれたら、または『アーチャーズ』の最新エピソードの要約を、アンブリッジのお馴染みの住民の声で聞かせてくれたら、どんなだろう。

あるいは、ビープに心地よい、またはドラマチックなサウンド効果を鳴らすよう教えて、子どもたちを喜ばせることができたら?

ある意味、音声AIは最新の配信メカニズムだ。BBCはそこに目を付けている。音声コンテンツに事欠かないことは確かだ。それを再パッケージ化して声による命令でオーディエンスに届け、人を楽しませ喜ばせるパワーを拡張できる。

https://platform.twitter.com/widgets.js
BBCがデジタル音声アシスタントを計画していると知って楽しみにしている。その膨大な音声ライブラリーは、洗練された競争力のあるユーザー体験を作り出すだろう。在来団体の賢い一手だ。

豊富なコンテンツとなれば、音声AIの先駆者である巨大ハイテク企業にも及ばないところだ。

無理矢理ユーモアを突っ込んだり(悪いジョークを吐くAI)や、キャラクターをねじ込んでみたりといった試みがなされたが、ほとんど自爆した。合成音声を本物の人が話しているように偽装するという、倫理的に怪しいものまであった。エンターテイナーではない技術系企業だけに、それらはすべて予想どおりの結果となった。彼らの本分はメディアではなく、あくまで開発なのだ。

BBCが音声アシスタントというコンセプトに辿り着いたのは、意外な方向からだった。BBCの番組をもっとたくさん送り出すための、現代の受話器と彼らは考えたのだ。

そのためビープは、アレクサなどと同じ技術水準の機能で戦おうとはしていない。それでもBBCは、彼らに勝利し人々に影響を与える手を持っていることを巨大ハイテク企業に見せつけることができる。

いちばん少なく見積もっても、彼らは、みんなが切望するクリエイティブな競争力を合成音声に与えてくれるだろう。

ただ、その試作AIに“アーンティー”と命名したとき以上に、ビープが私たちを笑わせてくれなかったのは残念だ。もっとパリッとした2音節のトリガーワードのほうが発音し辛くて面白かったのに……

[原文へ]
(翻訳:金井哲夫)

消費者の41%が音声アシスタントのプライバシーに不安、マイクロソフト調査

Microsoft(マイクロソフト)の新しいレポートによれば、音声アシスタントのユーザーの41%がデバイスが常時聞き取り状態にあることに関連してプライバシーやデータ保護の信頼性に不安を抱いているという。

Google、Amazon、Apple、 Samsung、Microsoftなどの有力企業が揃って消費者向け音声アシスタントデバイスのメインストリーム化に務めている現在、こうしたデバイスのデータ収集方法について懸念を抱くのは正しい態度だ。

しかし多くの消費者がこの点について正しい知識を持っていないように思える。Amazonのエンジニアが世界のユーザーがAlexaに入力した音声コマンドをモニターしているというBloomberg(ブルームバーグ)の最近の報道は消費者に懸念を抱かせた。しかもこうした人工知能を利用したスマートデバイスはメーカーやその外注企業の社員がモニターできるだけなく、入手した個人情報を違法に利用し、刑事事件にまで発展した例さえあった。電源がオンになっているかぎり聞き耳を立ているスマートスピーカーは笑いごとではすまないような重大なプライバシーの侵害を起こす可能性が充分ある。

米国時間4月25日、BloombergはAmazonのAlexaチームによるプライバシー侵害の危険性に関して次のように新たな報道を行った。

レポートによれば、Alexaが聞き取った音声データにアクセス可能なAmazon社員はデバイスの位置情報、場合によっては正確な住所も得られるという。これは音声データに緯度経度の座標が付属しているためだ。音声クリップをGoogleマップにペーストして簡単にデータが得られた場所を知ることができる。 Bloombergは「こうした位置情報を含むデータにアクセスできるAmazon社員の人数は不明」だとしている。

これは歴然たるプライバシーの侵害であり、我々がAmazon Echo、ひいては同種の音声アシスタントに対して抱く不信感を実証するものだ。

音声アシスタントのユーザーはバックエンド処理にどれほど人間が関与している正確に知ることはできない。しかしMicrosoftのレポートを読めば、デジタルアシスタント利用している消費者はデバイスが持つプライバシーの侵害やデータの不正利用などの危険性について強い不安を抱いていることがわかる。

例えば、Microsoftの調査対象の52%は入力された情報のセキュリティーに不安を感じている。24%は情報がどのよう利用されているのかわからないと考え、36%はどんな目的だろうと個人情報を一切利用して欲しくないと考えている。

こうした数字はデジタルアシスタントには個人情報の収集と利用から永続的にオプトアウトできる分かりやすい仕組みが必須だということを示している。 つまり1回クリックするだけで「デバイスが収集した個人情報が外に出ることはなく、かつ人間がアクセスすることはない」ように設定できなくてはいけない。

41%のユーザーは音声アシスタントがユーザーの音声に聞き耳を立て録音していることに不安を感じている。31%は収集された情報にプライバシーは保証されていないと考えている。

さらに14%はプライバシーやセキュリティーの点で音声アシスタント・サービスを信用していない。つまりAmazon、Google、その他の企業はこの点で信用されていないわけだ。Microsoftのレポートはこう警告している。

新しいテクノロジーデバイスに関する消費者からのフィードバックに不安に真剣に対応することはデベロッパーに課せられた責務だ。消費者が安心してデバイスと音声で対話できる未来を実現するために必要な信頼の基礎を今すぐ築き始めねばならない。

調査はプライバシーに関して音声アシスタントに消費者が不信感を抱いているものの、全員が音声アシスタントの利用に拒否反応を持っているわけではないことも示している。たとえばEchoに音声でAmazonの商品を注文する際、商品配送するために役立つなら住所データを利用するのは構わないと考えるユーザーも多い。確実にメリットがあるなら住所以外でも個人情報を提供していいと答えたユーザーも存在する。

消費者は全体としてはキーボードやタッチスクリーンより音声入力を好んでいる。音声アシスタントの普及はま だ初期段階だが、 57%のユーザーが(プライバシーなどの懸念はあるにせよ)、音声をお気に入りの入力方法だとしている。また37%は他の入力方法と併用して音声入力も用いると答えた。

「どちらかといえば」から「大いに」まで程度はさまざまだが、80%のユーザーがデジタルアシスタントに満足しており、「週に1度以上使う」ユーザーは66%、「毎日使う」は19%だった(これには音声以外のスマートアシスタント全般を含む)。

こうした高い満足度をみれば、音声を含むデジタルアシスタントが市場から消えるということは考えにくい。いかしプライバシーの侵害や不正利用の可能性は普及の大きな妨げになるだろうし、あるプロダクトの信頼性が高ければ、信頼性の低いブランドからの乗り換えを促すことも考えられる。

もしAmazonなどが社員が消費者の音声情報にアクセスすることを厳格に制限できず、Appleがリリースした製品がそれと同等の価格でプライバシーが良好に守られるとするなら、ここでもAppleが大きなシェアを得ることになるかもしれない。

音声アシスタントと音声認識テクノロジーのトレンドを含むMicrosoftのレポートの全文はこちら

原文へ

(翻訳:滑川海彦@Facebook

誰でも簡単に音声アプリが作れるVoiceflowが約4億円を調達

音声アプリの市場がオープンになった。AmazonのAlexaだけでも、今年の初めの時点で8万種類のスキルが登場している。それでも、米国内のスマートスピーカーの普及率がクリティカルマスに達した今、成長が鈍化する兆候はほとんど見られない。この流れに乗って、AlexaとGoogleアシスタント用音声アプリの開発を楽にするスタートアップVoiceflowは300万ドル(約3億3550万円)のシードラウンド投資を獲得した。

このラウンドは、True Venturesが主導し、Product Huntの創設者Ryan Hoover氏、Eventbriteの創設者Kevin Hartz氏、InVisionの創設者Clark Valberg氏などが参加している。同社は、プレシードですでに50万ドル(約3355万円)を調達している。

音声アプリ開発のためのこの協働プラットフォームのアイデアは、音声アプリを開発していた体験から直接得られたものだと、VoiceflowのCEOで共同創設者のBraden Ream氏は説明している。

Ream氏の他、Tyler Han氏、Michael Hood氏、Andrew Lawrence氏からなるこのチームは、まずAlexa用に、子ども向けのインタラクティブなお話アプリ『Storyflow』を開発していた。

ところが、この自分で冒険の筋書きを選ぶゲームアプリのための話のライブラリーを構築しようとしたところ、ユーザーベースに対応できる十分な速度でプロセスを拡大できないことが判明した。つまり、すべての枝道を含むストーリーボードを作るのに時間がかかりすぎるのだ。

「ある時点で、ドラッグ・アンド・ドロップで作るというアイデアが浮かびました」とReam氏は話す。「フローチャートとスクリプトと実際のコードが書けたら有り難い。さらにそのすべてをワンステップで行えたらと、私は考えました。そうして、今ではVoiceflowとして知られているものの初期の形が、試行錯誤によって作られていったのです。それは部内用のツールでした」とのこと。「なにせ私たちはナードなもので、そのプラットフォームをもっといいものにしたいと、論理演算や変数を追加し、モジュラー化していきました」

Storyflowのもともとの計画は、誰でも物語が簡単に作れるようになる「声のYouTube」を作ることだった。

しかし、彼らが開発したものをStoryflowを愛するユーザーたちが知ると、それを使って、インタラクティブストーリーだけでなく、その他の音声アプリも自分で作りたいという要望が彼らから湧き上がった。

「そのとき、私たちは閃きました」とReam氏は振り返る。「これは音声アプリ開発の中心的なプラットフォームになれる。子ども向けのインタラクティブ・ストーリーだけのものではないと。方向転換はじつに簡単でした」と彼は言う。「私たちがやったのは、名前をStoryflowからVoiceflowに変えるだけでした」

このプラットフォームが正式に公開されたのは12月だが、すでに7500件あまりの利用者が、このツールで開発した音声アプリを250本ほど発表している。

Voiceflowは、コーディングの知識がない人でも使えるよう、技術的なものを感じさせないデザインになっている。たとえば、基本のブロックのタイプは「speak」(話す)と「choice」(選ぶ)という2つだけだ。画面上でブロックをドラッグ&ドロップでつなぎ合わせれば、アプリの流れが出来上がる。技術に詳しいユーザーなら、高度な開発画面に切り替えれば論理演算や変数を使うこともできる。それでも、完全に視覚化されている。

企業ユーザー向けに、Voiceflowの中にAPIブロックも用意されているため、その企業の独自のAPIを組み込んだ音声アプリの開発も可能だ。

さらに、この製品の面白いところはもうひとつある。協働機能だ。Voiceflowには無料の個人向けモデルと、チームによる音声アプリの開発に重点を置いた商用モデルがある。月額29ドルで利用でき、たとえば言語学者や音声ユーザーインターフェイスのデザイナーと開発者など、多くのスタッフを抱えて音声を使った仕事をしている職場に、みんながひとつのボードで作業でき、プロジェクトが共有でき、アセットのやりとりが簡単に行える環境が提供される。

Voiceflowは、今回のシード投資を使って技術者を増やし、プラットフォームの開発を続ける予定だ。より優れた、より人間的な音声アプリを、このプラットフォームで利用者に開発してもらうことが、彼らの長期的な目標だ。

「当面の問題は、Googleから資料や最良の利用方法が提示されていて、Alexaの側にも同様に用意されているのに、明確な業界標準がないことです。しかも、手に取れる具体的な実例がひとつもありません。または、それを開発に応用する簡単な手段がないのです」とReam氏は説明する。「もし私たちが、新たに1万人の音声ユーザーインターフェイスのデザイナーを生み出すことができれば、彼らをトレーニングしたり、簡単にアクセスできて、みんなで協働できるプラットフォームを提供することができます。会話の質が飛躍的に向上するはずです」。

その観点に立って、Voiceflowでは、Voiceflow Universityというプログラムを立ち上げた。現在はそこでチュートリアル動画を公開しているが、将来は標準化したトレーニングコースを提供する予定だ。

動画の他にVoiceflowには、Facebookを通じたユーザーコミュニティのネットワークがある。そこでは、2500名以上の開発者、言語学者、教育者、デザイナー、起業家などが、音声アプリのデザインや開発方法について活発に論議を交わしている。

こうしたVoiceflowとユーザーベースとの相互関係は、True VenturesのTony Conradに対して重要なセールスポイントとなった。

「ミーティング(ピッチ)に出席した後、私は少しばかり探ってみました。そして大変に感銘を受けたのは、開発者コミュニティの関わりの深さでした。他では見られないことです。このプラットフォームの最大にして唯一の差別化要素は、Bradenのチームと、コミュニティとのエンゲージメントの強さです」とConradは言う。「初期のWordPressを思い起こしました」。

Voiceflowは、最近までもうひとつの視覚化デザインツールInvocableと連携していたが、Voiceflowのプラットフォームへのユーザーの統合を助ける目的で、Invocableはサービスをシャットダウンした。

ここには教訓が含まれているようだ。Invocabeは、ユーザーに別れを告げたブログ記事で、人々はスマートスピーカーを、いつまでも音楽やニュースやリマインダーや単純なコマンドを中心に使い続けていると指摘している。また、自然言語処理と自然言語理解は、高品質な音声アプリを支えるまでには進歩していないとも書いている。その日はいずれやって来るに違いない。だがそれまでの間、一般消費者に広く受容される時期に先んじて、音声アプリ開発市場を支える最適なプラットフォームで勝負に出ようとすれば、そのタイミングを見極める必要がある。

トロントに拠点を置くVoiceflowは、現在12人のチームで運営されている。彼らは拡大を目指している。

[原文へ]

(翻訳:金井哲夫)

音声アシスタントの使用、2023年までに3倍超になるとの予測

英国拠点の調査会社Juniper Researchの予測では、音声アシスタントの使用が今後数年で3倍に増えそうだ。デジタル音声アシスタントの使用は2018年末時点で25億台だったが、2023年までには80億台に増えることが見込まれている。

そうしたアシスタントのほとんどは、GoogleアシスタントやSiriがAndroidやiOSのユーザーに提供しているスマホで使用される。

Googleは実際、同社の音声アシスタントが先月時点でデバイス10億台で使用可能になっている、と発表している。この数字にはAndroid統合が貢献している。一方、主にEchoのようなスマートスピーカーで活用されているAmazonのAlexaは1億台超に達している。

しかしながらJuniperは、今後数年間で最も成長する音声アシスタント活用のカテゴリーはスマートスピーカーではなくスマートTVになると予想している。

Juniperは、スマートTVの音声アシスタントは今後5年間で121.3%成長し、その一方でスマートスピーカーは41.3%の成長にとどまると予測する。ウェアラブルも大きな役割を果たし、40.2%の成長を見込んでいる。

スマートスピーカー分野においてはAlexaがすでにリーダー的存在だが、今後は自前の製品を展開する中国メーカーの攻勢を受けることが予想される、とレポートは指摘している。

なお、レポートでは、スマートスピーカーはコマースで使われていないとする考えに意義を唱えている。その代わり、音声コマースは実質的に成長し、2023年までに年間800億ドル超の規模になると推測している。ただし、ここには意外な要素が含まれている。

この“音声コマース”の数字には送金や、従来の買い物体験での音声コマース使用に伴うデジタル商品の購入が含まれている。さらに、800億ドルの大部分を実際の行動を伴う購入が占めるようになるとは予想していない。

「デジタルアシスタントが真にシームレスなクロスプラットフォーム体験を提供できるようになるまでは、音声コマースの大半はデジタル購入になると我々は考えている」とレポートをまとめたJames Moarは発表文で述べている。「コネクテッドTVとスマートディスプレイは、スマートスピーカーにはないビジュアルコンテキストを提供することができ、音声コマースには欠かせないものだ」。

また、デジタルアシスタントの浸透が世界のモバイルアプリマーケットにネガティブな影響を及ぼすとJuniperが考えているのは記すに値するだろう。特にJuniperは、マルチプラットフォームアシスタントに対する消費者のニーズが増大するにつれ、独立したデベロッパーが開発したスマホやタブレット向けのスタンドアローンアプリは減少する、と指摘している。これは、今日我々がアプリを使うときの単純なインターラクションの多くが音声アシスタントに取って代わられることが見込まれるためだ。その代わり、音声アシスタントを使うようになるとスクリーンタイムが減ることになる。

加えて、他のプラットフォームでの音声アシスタントではそうではないが、スマートスピーカーでの音声アシスタントはユーザーの毎日のルーティンの一部になるという初期兆候も見られる。この傾向は、将来、音声だけのインターラクションの需要増加につながるだろう、とJuniperはみている。

原文へ 翻訳:Mizoguchi)

Google、オンデマンド音声ニュースフィード提供でメディアと提携

私がGoogleアシスタントで最も利用している機能が、朝のニュースだ。Homeに「どんなニュースがある?」と尋ねると、いくつかのメディアから素早く最新のニュースの要約を用意してくれる。

Googleは、オンデマンドのニュースラジオを追加してニュース機能を改善するとずっといっていた。過去1年かそこら、Googleはニュースプレイリストをつくるために、一握りのニュースメディアと協議してきたーここにはAP通信、ハリウッド・リポーター、ウニヴェルソ・オンライン、サウス・チャイナ・モーニング・ポストが含まれる。音声ニュースフィードには、現在のGoogleニュースで使われているものに似ているAIモデルを活用し、時間帯やリスナーの好みを反映させる。

「まずトップニュースの要約と、ユーザーが気にするトピックのアップデートから始め、その後掘り下げたニュースのようなボリュームのあるものへと拡大する」とGoogleはブログに書いている。「朝の起床時、あるいは通勤の途中、もしくはジョギング中など、あなたがニュースを聞きたいと思った時いつでもGoogleアシスタントは最新のニュースや、あなたがすでに聞いたニュースのアップデートを用意している」。

ユーザーは現在同様にGoogleにニュースのスキップや繰り返しをリクエストできる。

現在の提携に加え、Googleはニュースメディアがフィードに流すニュースを録音するためのテンプレートもつくった。また、メディアがより音声ニュースを提供するのをサポートするための、新たなGoogleニュースイニシアチブもある。

オンデマンド音声ニュースフィードの機能は現在、米国のユーザー向けとなっている。

アップデート:Googleは、このプロダクトは初期段階のため、最終バージョンの広域リリースはまだ未定、と追記した。

[原文へ]

(翻訳:Mizoguchi)

国際宇宙ステーション(ISS)の新型ロボットは宇宙を浮遊するAlexaみたいでヤバイな

Cimonをご紹介しよう。3Dプリントで作ったこの浮遊するロボットは、AirbusがGerman Space Agency(ドイツ宇宙局)のために作ったものだ。彼は6月から国際宇宙ステーションのクルーだが、Gizmodoによれば、彼の活躍が一般公開されるのはこれが初めてだ。

実はこの、IBM Watsonで動いている浮遊する顔型ロボットは、宇宙における人間と機械の対話を研究する役目を担う、ものすごく高価なAmazon Echoを思わせる。下のビデオは主に、CimonとEuropean Space Agency(EU宇宙局, ESA)の宇宙飛行士Alexander Gerstとの対話を映している。

Gerstが彼の“好きな曲”をリクエストすると、CimonはKraftwerkの“Man Machine”をかける。すると宇宙飛行士は彼と‘握手’する。そしてロボットに、ビデオを撮るよう要求する。Cimonはそれにも成功するが、明らかに曲の中断にとまどっているようだ。二人の共同作業チームの、ちょっと荒っぽい出会いでした。

“彼の最初の出番には満足している。CimonのデベロッパーとAlexanderは二人とも、Cimonがまた仕事に戻ってくることを期待している”、とESAは言っている。“このHorizonsミッションの現段階では今後のセッションは予定されていないが、宇宙飛行士とロボットアシスタントとのすばらしいコラボレーションの始まりを告げたと言える。人工知能の、宇宙におけるあり方の好例だろう”。

次回は、ものごとがもっとスムーズにいくと良いね。絶対にやってはいけないのは、宇宙ロボットを怒らせることだぞ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

ドメインを限定してより有能な音声対応AIを作ろうとするWluperがシードで$1.3Mを調達

音声アシスタントなどのシステムにその知識を与える、会話型AIを作っているロンドンのWluperが、130万ドルのシード資金を獲得した。ラウンドをリードしたのは“ディープ・テック”専門のVC IQ Capitalで、これにSeedcamp, Aster, Magic Ponyの協同ファウンダーZehan Wang博士らが参加した。

2016年に創業し、最初はJaguar Land RoverのInMotion Venturesが支援していたWluperの“会話型AI(conversational AI)”は、初めはナビゲーション製品を対象にしていた。同社のAI技術は自称“目標指向の対話(goal-driven dialogue)”と呼ばれ、目標を絞ることにより、従来よりも自然な会話でナビゲーションのさまざまなタスクを支援する。

それを可能にする‘秘密のソース’は、ナビのような音声アシスタントを支えるAIは特定の、狭い、専門的分野のエキスパートになった方が良い仕事ができる、というWluper独自の信念だ。

Wluperの協同ファウンダーHami Bahraynianはこう述べる: “AlexaやSiriのようなインテリジェントなアシスタントも、本当に良いなと感じるのは、それらがユーザーの意図を正しく理解しているときだけだ。しかし実際には、理解していない場合がほとんどだ。それは、音声認識そのものの欠陥ではない。それは、フォーカス(対象、主題、テーマの特定化)を欠いていることと、その種のシステムの共通的な欠陥である論理的判断能力(‘推理’)の欠如だ。彼らはみな、いろんなことをそこそこできるけれども、どれ一つ完全ではない”。

AIが“一般的な”会話能力を持つのは15年か20年以上先と思われるが、そこへ向かうための中途的な目標は、Bahraynianによると、目的を絞った“インテリジェント・エージェント”を作ることだ。

“われわれがやっているのは、まさにそれだ”、と彼は言う。“われわれは、ドメインエキスパート(特定分野の専門家)の会話型インテリジェンスを作っている。それは、一つのことしかできないし、理解しない。でも、たとえば、輸送に関することなら何もかも完璧に知っている”。

この分野特定により、WluperのAIは、ユーザーが言ってることに関する明確な…見当はずれでない…想定ができる。そのため、複雑な質問でも自然に理解する。ひとつのクエリに複数の意図が含まれている場合や、前の質問のフォローアップ質問も理解するので、“本当の”会話ができる、とBahraynianは言う。

さらにまたWluperは、NLPパイプラインの“理解能力”の次に来るべきものとして、マシンの“知識取得能力”に関してR&Dを継続している。会話型AIというパズルが完成するための重要な必須のピースがその能力だ、と同社は考えている。

“自然言語で尋ねられたユーザーのクエリを正しく理解したとしても、適切で有益な情報を正しい場所から取り出して提供することは、それよりもさらに難しい。現在多く使われているルールベースのアプローチでは、応用性がゼロなのでまったくスケールしない”、とBahraynianは付言する。

“この問題を解決するためにわれわれは、従来の手作り的な方法に別れを告げて、マシンの知識取得を最適化するための新しい方法を探している。もっと意味のある結果を返せるためには、定型データと非定型データとの正しいバランスを見つける必要がある”。

そしてWluperのシード資金は、エンジニアとリサーチサイエンティストの増員による、同社の研究開発能力の拡張に充てられる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

だめ!

だめ。だめ。だめ。だめ。Alexaをシャワールームに入れないで。だめ。

〔訳注: これは、シャワールームで使えるAlexaデバイスを某社が発売する(Kickstarter資金募集中)、という記事。そのジョーク・スタイル。〕

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Alexa for Businessをサードパーティのデバイスメーカーが自社製品に利用できる

昨年Amazonは、‘企業用のAlexa’、Alexa for Businessを発表した。Amazonの音声アシスタントの技術を、企業がEchoなどのデバイスで利用できるためのシステムだ。そして今日(米国時間10/24)同社は、そのプラットホームを大きくアップグレードして、デバイスのメーカーが独自の企業用Alexaデバイスを作れるようにした。

Amazonによるとそれは、Alexa for Businessをすでに利用している企業からのフィードバックに応えての変化だ。同社によると、今すでに数千もの企業がAmazon Echoをオフィス器具の仲間に加えている。有名企業としては、Express Trucking, Fender, Propel Insuranceなどが挙げられる。

でも彼らによると、既存のデバイスにAlexaを組み込めた方が、管理すべき備品が増えなくてよい、ということだ。

これからは、デバイスメーカーが自由に、Alexa for Businessに登録でき、全社的に共有できるデバイスを作れる。そのためには、Alexa Voice Service(AVS) SDKを使用する。

デバイスの管理機能としては、各種の構成(使用する部屋、場所、デバイスの健康監視など)のほかに、スキルをパブリックかプライベートかのどちらかに指定できる。

もちろん企業が独自のスキルを作ることもできる。たとえば、社員名簿やSalesforceのデータを音声で検索する、企業独自のカレンダー情報を作る、など。

Amazonが最近Alexa for Businessに加えた機能としては、会議室の予約がある。

Amazonは現在すでにPlantronics, iHome, BlackBerryなどと協働して彼らのデバイスにAlexaを組み込もうとしている。また、LinkplayやExtronのようなソリューションプロバイダーとも協働している。Citrixも、AfBの統合に着手した。

Plantronicsの提携マーケティング担当VP Laura Marxが、同社のAlexa内蔵製品に関する声明の中でこう述べている: “Alexa for Businessはそのローンチの時点から利用しており、既存のビデオ会議デバイスPolycomとEchoデバイスをペアにしている。そういう体験をEchoデバイスを使わずにPolycom Trioなどの製品に組み込めれば、ユーザーにとってとても便利で使いやすい製品になるだろう”。

Plantronicsは今年の初めにAlexa体験を顧客に提供し、iHomeは既存のデバイスiAVS16にAlexaを内蔵させた。しかし両社とも、これまではAlexa for Businessを組み込んだ製品の発表はなかった。

Alexaの企業分野への進出が吉か凶か、まだそれを言うのは早すぎる。Echoデバイスは確かに、音楽をかける、ニュースや情報を知る、キッチンタイマーをセットする、ショッピングリストを作る、などなど消費者指向の目的で多く使われるようになっている。しかしAmazonがEchoスピーカーやそのほかのAlexa内蔵ビジネス器具で企業にも浸透できたら、同社の音声製品の市場は一挙に拡大し、スマートホームよりも大きな利益を得ることができるだろう。

Alexaを職場に持ち込むのはだめだ、という意見もある。某ハッカーの説では、デバイスが産業スパイに利用される、という。また、企業秘密のある企業は“聴く能力のあるデバイス”をオフィスに置くべきではない、とも。

それでもAmazonは前進する。この前はMicrosoftのCortanaさえも統合して、Cortanaが持つMicrosoft Office的な機能…カレンダーの管理、その日の予定、顧客からのメール通知…などをAlexaから利用できるようにした。

Alexa for BusinessはAVS Device SDKのエクステンションとして提供され、バージョン1.10をGitHubからダウンロードできる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Amazon Alexaが今度はアメリカの多くのユーザーのところでトラブル

Amazon Alexaの一部のユーザーが現在(日本時間10/24昼ごろ)、この音声アシスタントの利用でトラブっている。コマンドを言っても、“sorry, something went wrong”(すみません、何か具合が悪いです)と答えるだけだ。Amazonはこの問題について、まだ何も言っていない。

いくつかのツイートとDown Detectorによると、Alexaがおかしくなったのは太平洋夏時間午前7時ごろからだ。問題がすぐに直った人もいるが、まだ待機している人の方が多い。

先月はイギリス、スペイン、ドイツ、そしてオーストラリアの一部でやはりAlexaがダウンしてEchoが使えなくなった。しかしDown Detectorが作った事故マップ(下図)によると、今回Alexaがおかしいのはほとんどアメリカのユーザーだ。

Alexaは3月にも、Amazon Web Servicesのネットワーキングの問題でダウンした

本誌TechCrunchは今、Amazonにコメントを求めている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Alexaをささやき声で使えるようになった、夜のムードを壊したくない人に向いている

先月シアトルで行われたAmazonのAlexaイベントで、EchoなどAlexaデバイスの‘ささやきモード’が紹介された。そのとき見たささやきのデモでは、“子守唄をかけて”とささやくと、AlexaがEchoなど音声アシスタントデバイスにそれを命じる。そして今日(米国時間10/18)、そのWhisper Modeが正式に使えるようになった。

ただし今その機能が使えるのは、アメリカのユーザーのみ、そしてアメリカ英語のみだ。

この機能は、もっぱら静かにしていたい夜の時間とか、床(とこ)についてから寝るまでの時間には便利だ。また、寝ている子どもを起こさずにAlexaに命令したいときも。また一般的に、静かな声で対話をしたい人は、一日中このモードを使うかもしれない。

Whisper Modeは、Alexaにもっと状況(コンテキスト)理解力を持たせようとするAmazonの努力の一環だ。たとえば“play Hunger Games”(Hunger Gamesをかけて)とコマンドしたら、それが画面のあるデバイスだったら映画を、そしてEchoスピーカーならオーディオブックを再生してほしいのだ。

また、Amazonの9月のイベントでは、Echoデバイスにスマートホーム機能を持たせる“Alexa Guard.”が紹介された。これは、音や煙や一酸化炭素を検出し、たとえばガラスが割れる音にも反応する。

Alexa GuardもWhisper Modeも共に、“long short-term memory,”(長・短期記憶)と呼ばれる機械学習ネットワークを利用する、とAlexaの研究開発トップRohit Prasadが説明してくれた。〔参考記事(‘LSTM’で検索を)〕

入ってくるオーディオシグナルは、小さな断片に分割され、long short-term memoryのネットワークがそれらを順に処理していく。同社は9月に、そう説明した。そのシステムは、それまでの断片に関する判断も参考にしながら、その新しい断片が囁(ささや)きであるかアラームであるかを判断する。このようにしてそれは、時間上に並ぶオーディオシグナルの各部分間の構造的(〜意味的)な関係を学習できる、とAmazonは言っている。

同社は先月、Alexaの音声対話が“context carryover”(コンテキストの繰越)と呼ばれるものによって、より自然になった、とも言った。たとえば、“今日は雨が降る?”と尋ねたあとに、“明日はどう?”と問うと、「雨降りについての質問」というコンテキストが次へ繰り越されて、正しく明日の雨について答えてくれる。

そして、最近同社が特許を取った技術を使うと、Alexaがユーザーの健康状態を判断して薬を売ろうとする。たとえば咳止めドロップとか。このシステムは、喜び、怒り、悲しみなどの感情も検出する、とAmazonのレポートは言っている。

あなたのAlexaデバイスにWhisper Modeが来ているか知るためには、それを有効にしてみること。

Whisperは、アカウントの設定で有効/無効にするから、Alexa AccountからメニューをたどるとWhispered Responsesに行き着く。あるいは音声で“Alexa, turn on whisper mode”(Alexa、ささやきモードを有効にして)、と言ってもよい。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

新しいカラーのGoogle Home Mini、なぜいまどき画像がリーク?

とっくに聞いたよね。来週はGoogleのビッグイベントがある。そこではビッグな新しいスマートフォンが紹介され、それにもちろん、Google Homeの新製品もあるだろう。ところで、それにはまだ早いけど、こいつはミントの(公式には“アクア”の)*Google Home Miniだ。〔*: ミント(mint)、アクア(aqua)、ここではいずれも色の名前。〕

この新色は、10月29日に発売される。お値段は49ドルで変らない。でも、発売のタイミングとしては、かなり変だ。来週のイベントは、どうなるのだ。きっと、イベントはPixelネタで満杯だから、後回しになったのだろう。

どこかで見た色、と思った方は、Pixel 3のリークの印象が残っているのだ。最近のGoogleのハードウェアは、色を揃えることに固執している。

そもそも今日(米国時間10/2)は、Microsoftがマインドシェアの拡大を目指して頑張る日だ(Surfaceの発表イベント)。Googleは、自分のイベントを忘れられないようにしたい。しかも昨年と違って今年は、来週のイベントでMiniのニュースはあまりなさそうだから。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Microsoft Surfaceファミリーにヘッドホンが加わる

今日の大きな発表の数々が数年来見てきたデバイスの定期的アップデートであることはわかっている。それでもMicrosoftは、今日のイベントに小さなサプライズを忍び込ませた。シンプルに名付けられたSurface Headphonesは、同社のノート、デスクトップ製品ラインを通じておそらく最も異質な新製品だろう。

しかしこのオーバーイヤー型ヘッドホンの鍵がCortanaにあることは明白だ。MicrosoftはこのSiri/Alexa/Assistant競合製品の普及にいくらか問題を抱えているので、こうした次世代ノイズキャンセリングのついたデバイスが伝道の後押しになるのだろう。

350ドルのワイヤレスヘッドホンは、いたる所で目にするBoseのQuietComfortや、Sony、Samsungらの競合製品がライバルになる。もちろん、もしCortanaが主要な差別化要因であるなら、混戦を抜け出すのは困難だろう。

まだ発表されたばかりで、発売時期も(「近日発売」以上には)わかっていないので、おそらくMicrosoftはまだいくつか楽しみを隠し持っているのだろう。

[原文へ]

(翻訳:Nob Takahashi / facebook

AmazonのAlexa Fundが三社の音声アプリ(==Alexaスキル)にシード投資

2015に創設されたAmazonのAlexa Fundは、初期段階の音声アプリスタートアップの立ち上がりを助ける。今週は、三社に対する支援が発表された。

まずBamboo Learningは、AmazonのAlexa Presentation Language(APL)の初期のパートナーだった。同社は音楽教育のAlexaスキルを開発し、音符や楽器、和音(コード)、テンポなどなどの音楽用語について教える。

Endelは、ユーザーがリラックスするためのサウンドスケープを提供する。同社は曰く: “うちのメインのアルゴリズムは、日周期(1日24時間の周期のリズム)と五音音階と音のマスキング利用している。その音は、そのときの時刻や天候、心拍、位置などの条件で異なる”。

ヘルスケアのAivaは、ユーザーをヘルスケアの専門家とコンタクトさせる。AivaとEndelは共にTechstarsの出身だ。三社はAmazonから資金をもらい、AmazonのDemo Nightに出演する。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Amazon Alexaのスキルの中でゲームのポイントやヒントを売ることができる、近くSony Picturesも利用

Amazonの今朝(米国時間9/25)の発表によると、これからは、Alexaのスキルのデベロッパーが、スキルの中で、一回しか使えない“消耗品”を売ることができる。同社によると、アメリカのデベロッパーは今日からこの新しい機能を利用して、Alexaデバイスのオーナーに何かを売ることができる。その‘製品’は、買って使用したらまた購入できる。それらはたとえば、音声ゲームのヒントや、ゲームの続行に必要なポイントなどだ。

これは、昨年11月にデビューして今年5月に広く展開されたAlexaスキルのアプリ内購入機能の拡張機能だ。デベロッパーはスキルを有料会員制にすることもでき、デベロッパーへの支払いはDeveloper Rewards事業から行われる。

Alexaは家庭内音声コンピューティングの市場に先鞭をつけただけでなく、これらのインセンティブによって、今やAlexaスキルの数は5万を超えている

しかし従来のアプリ内購入と違って、これらの“消耗品”は(一回しか使えないので)スキルのユーザーが何度でも繰り返し買うものであり、必ずしも会員登録などをする必要がない。

Amazonによると、すでにかなりの数のデベロッパーがこの機能を採用している。

たとえばゲームのWould You Rather for Familyでは、有料プレミアムバージョンの7日間の試用権を買うことができる。中世ふうのRPG Yes Sireでは、ゲーム続行に必要なポイントを買える。またInnomoreのHypno Therapistでは、同社の70あまりの療法の中から10種類の催眠療法をまとめて購入できる。さらにもっともっと買って買ってユーザーの健康関連のゴールに到達することもできる。

Amazonによると、近くSony Pictures TelevisionがWho Wants to Be a Millionaireをローンチする。このゲームスキルでは、プレイが行き詰まったときにヒントを購入できる。

こういう“消耗品”は、一回かぎりの購入や有料会員制と同じように、Alexa Skills Kit (ASK) Command-Line Interface (CLI)を使って実装できる。そのやり方は、サンプリアプリName The Showに示されている。

さらにAmazonによると、StorylineVoice Appsのようなサードパーティ製のツールを使えば、ビジュアルなインタフェイスでスキルを開発できる。

スキル内の“消耗財”(consumables)購入は、今のところアメリカだけで、国際展開の日程は示されていない。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

AmazonのAlexaは深層学習に基づきユーザーのやりたいことに関して‘勘’を働かせる

Amazonのビッグな ハードウェアイベントは、確かにハードウェア山盛りだったが、それ以外のものもあった。Amazonは、同社のバーチャルアシスタントAlexaを、人間のやることに対して、もっとお利口にし、もっと直観的な理解や判断ができるために何をしているか、を説明した。一家にたくさんのインターネットに接続されたスマートホームデバイスがあるときには、それ〔ユーザーが今何に対して何をしたいのかという直観、勘〕がとくに重要だ。

Amazonは木曜日(米国時間9/20)のイベントで、Alexa Hunchesと呼ばれる機能を発表した。この機能によりバーチャルアシスタントは、ユーザーの振る舞いに関する手がかりを知り、それに基づいて提案をする。そのためにAlexaは、ニューラルネットワークによるディープラーニングを利用して、人間の振る舞いを理解し学習する。〔hunch == ‘勘’〕

Alexaは人間の脳が対応できる判断をしなければならないし、そのためにはデータを必要とする。今のところ“Hunches”は、そんなデータが得やすいという意味で、スマートライトやセキュリティカメラのようなコネクテッドデバイスにフォーカスしている。たとえばユーザーが、“Alexaおやすみ”とか、“Alexa目ざましをセットして”と言ったら、毎日そんなコマンドを聞いているAlexaは、振る舞いに関するデータに基づいて勘を働かせる。そしてAlexaは、“ポーチのライトが点いたままだと思います。私が消しましょうか?”、と答えるかもしれない。

ずっとこの勘機能をテストしてきたAmazonは、機能のローンチを今年の終わりごろと予定している。勘機能は、時間とともに学習し改良されていく。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

AmazonのAlexaがSonyのスマートTVとLenovoのタブレットにやって来る

AmazonはAlexaに、できるだけ多くの人と対話させたいし、できれば彼らに何かを見せたい。そのためには、このバーチャルアシスタントをAmazonの画面付きAlexaデバイス、Echo ShowやFire TVのような、Alexaに声だけでなく顔も与えるデバイスから解放してやる必要がある。

そこで同社は木曜日に行われたビッグなハードウェアイベントで、“smart screen” SDKのリリースを発表した。これを使ってデベロッパーは、Amazon以外のハードウェア製品にEcho Showのような機能を持たせられる。スマートTVでも、最新の冷蔵庫でも、なにしろ画面のあるものなら何でも、Alexaデバイスにしてしまえる。

実際にすでにそれをやった企業が、二社ある。Amazonの発表によると、LenovoとSonyが、このSDKを使ってAlexaを自社製品に統合する。Lenovoは“近日発売”のAndroidタブレット、Smart Tabだ。

一方Sonyは、Alexa対応のテレビ、と呼ばれる製品シリーズの全機種にこのSDKを統合する。最初は、音楽と、スマートホームのカメラのみを年内に。Alexaが画面に何かを見せるという機能は、来年前半に実装される。

このイベントを取り上げた本誌記事(英文原文)の一覧が、ここにある。

画像クレジット: TechCrunch/Devin Coldeway

[原文へ]
(翻訳:iwatani(a.k.a. hiwa