Alexaをささやき声で使えるようになった、夜のムードを壊したくない人に向いている

先月シアトルで行われたAmazonのAlexaイベントで、EchoなどAlexaデバイスの‘ささやきモード’が紹介された。そのとき見たささやきのデモでは、“子守唄をかけて”とささやくと、AlexaがEchoなど音声アシスタントデバイスにそれを命じる。そして今日(米国時間10/18)、そのWhisper Modeが正式に使えるようになった。

ただし今その機能が使えるのは、アメリカのユーザーのみ、そしてアメリカ英語のみだ。

この機能は、もっぱら静かにしていたい夜の時間とか、床(とこ)についてから寝るまでの時間には便利だ。また、寝ている子どもを起こさずにAlexaに命令したいときも。また一般的に、静かな声で対話をしたい人は、一日中このモードを使うかもしれない。

Whisper Modeは、Alexaにもっと状況(コンテキスト)理解力を持たせようとするAmazonの努力の一環だ。たとえば“play Hunger Games”(Hunger Gamesをかけて)とコマンドしたら、それが画面のあるデバイスだったら映画を、そしてEchoスピーカーならオーディオブックを再生してほしいのだ。

また、Amazonの9月のイベントでは、Echoデバイスにスマートホーム機能を持たせる“Alexa Guard.”が紹介された。これは、音や煙や一酸化炭素を検出し、たとえばガラスが割れる音にも反応する。

Alexa GuardもWhisper Modeも共に、“long short-term memory,”(長・短期記憶)と呼ばれる機械学習ネットワークを利用する、とAlexaの研究開発トップRohit Prasadが説明してくれた。〔参考記事(‘LSTM’で検索を)〕

入ってくるオーディオシグナルは、小さな断片に分割され、long short-term memoryのネットワークがそれらを順に処理していく。同社は9月に、そう説明した。そのシステムは、それまでの断片に関する判断も参考にしながら、その新しい断片が囁(ささや)きであるかアラームであるかを判断する。このようにしてそれは、時間上に並ぶオーディオシグナルの各部分間の構造的(〜意味的)な関係を学習できる、とAmazonは言っている。

同社は先月、Alexaの音声対話が“context carryover”(コンテキストの繰越)と呼ばれるものによって、より自然になった、とも言った。たとえば、“今日は雨が降る?”と尋ねたあとに、“明日はどう?”と問うと、「雨降りについての質問」というコンテキストが次へ繰り越されて、正しく明日の雨について答えてくれる。

そして、最近同社が特許を取った技術を使うと、Alexaがユーザーの健康状態を判断して薬を売ろうとする。たとえば咳止めドロップとか。このシステムは、喜び、怒り、悲しみなどの感情も検出する、とAmazonのレポートは言っている。

あなたのAlexaデバイスにWhisper Modeが来ているか知るためには、それを有効にしてみること。

Whisperは、アカウントの設定で有効/無効にするから、Alexa AccountからメニューをたどるとWhispered Responsesに行き着く。あるいは音声で“Alexa, turn on whisper mode”(Alexa、ささやきモードを有効にして)、と言ってもよい。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa