DolphinAttackで使う音は、人間には聞こえず、感知することすらできません。しかし音声認識を行うデバイスはこの「音声」に反応するのです。Siri、Google Now、Samsung S Voice、Huawei HiVoice、Cortana、およびAlexaなど、いずれのプラットフォームで動作することを確認しました。
超音波から生成した音声により、簡単なフレーズ(「OK、Google」)から、やや複雑なコマンド(「unlock the back door」―勝手口の鍵を開けて)などを認識させ動作させることができたとのこと。スマートフォンによって通じやすいフレーズや通じにくいものがあったり、超音波を発する距離によっても実験結果が左右されたとのこと。ただし、5フィート以上の距離から発した超音波ーハーモニクスに反応したデバイスはなかったとのことだ。
Apple TVは、お気に入りのビデオチャンネルにアクセスするために、初めてストリーミングメディアプレイヤーをセットアップすることでより大きな課題を解決しようとしている。また、「シングルサインオン」という機能を導入し、所有者が1度ログインすれば、すべてのネットワークにアクセスできるようになる。この機能は、iOSにも導入されるという。
Dagはモバイル・ビジネスに長い経験がある。VivとSiri以前にはTelenor MobileとMotorolaで幹部を務め、Motorolaでは人工知能インターフェイスを開発するInteractive Media Groupを創立した。VivはAIシステムが新しいタスクを実行するためには自らコードを書く機能、いわゆるプログラム合成テクノロジーの大幅な進歩をベースにしている。
Siriは単独のアプリだが、VivはデベロッパーがAIによる会話的能力をアプリに組み込めるようにするためのインフラ開発を目指している。Dagによれば、現在あらゆるアプリに搭載されている「検索ボタン」と同じくらい、Vivによる会話機能を普遍的なものにしたいという。TechCrunch DisruptではVivプラットフォームを使って開発されたアプリがデモされるというので、プラットフォームの能力の一端が明らかになるだろう(Disrupt NY 5月9日から11日にかけてブルックリンのレッドフックで開催される。チケットはこちら)。
“how many home runs did Babe Ruth have during his career”(ベーブルースは生涯に何本ホームランを打ったか?)のような問に対して、これまでのSiriならたぶん、あのいまいましい”here’s what I found on the web”(Webにはこんなものがありました)を返しただろう。でも今度からは正しい答を返すから、Siriをより一層、人間らしく感じるだろう。
360度全方向スピーカーを内蔵し、ユーザーの端末からBluetooth経由で接続するほかに、Amazon Music Library、Prime Music、TuneIn、およびiHeartRadioの音楽再生機能が標準でサポートされている。さらに、地方ラジオ局やNPR、TuneIn経由のESPNその他の情報源によるニュースや気象情報を聞くこともできる。ユーザーの質問には、Wikipediaから得た基本情報、単語の意味、さらには単位の変換もリアルタイムで答えてくれる。