カーネギーメロン大学の研究者たちによる新技術は、真のコンテキスト認識コンピューティングを実現するために、音と振動の認識を追加する。Ubicousticsと呼ばれるこのシステムは、スマートデバイスのインタラクションにコンテキストの情報を追加し、スマートなスピーカー自身にキッチンにいるかどうかを認識させたり、スマートセンサーに現在トンネルの中にいるのか、あるいは広い路上にいるのかを認識させたりすることができる。
「キッチンのカウンターに置かれたスマートスピーカーは、自分自身がキッチンにいるかどうかを認識することはできませんし、もちろん人間がキッチンで何をしているかを知ることができないのは言うまでもありません」と語るのは、カーネギーメロン大学のHuman-Computer Interaction Institute(HCII)の研究者であるChris Harrison だ。「でも、もしこうしたデバイスがその周りで何が起きているかを理解できたら、もっともっと役に立つかもしれません」。
システムの最初の実装では、内蔵のスピーカーを使用して「音響に基いたアクティビティ認識」を行う。彼らがそれを実現している方法はとても魅力的だ。
「ここでの主要なアイデアは、通常エンターテインメント業界で使用されているプロフェッショナルなサウンドエフェクトライブラリを活用することです」と語るのはPhDの学生であるGierad Laputだ。「それらは、きれいで、きちんと分類されていて、分割されていますし、多様です。さらには、数百の異なるバリエーションに変換して利用することで、ディープラーニングモデルのトレーニングに最適な量のデータを作成することができます」。
リリースより:
Laputは、音を認識して正しい文脈に位置付けることは難しいと語った。しばしば複数の音が存在し、お互いに干渉する可能性があるためだ。彼らのテストでは、Ubicousticsは約80%の正確さを保っていた。これは人間の正確さに匹敵するものだが、ユーザーアプリケーションをサポートするにはまだ十分ではない。マイクロフォンの向上、より高いサンプリングレート、異なるモデルアーキテクチャなどの全てが、今後の研究で認識精度を向上させる役に立つだろう。
他の論文では、HCIIのPh.D学生のYang Zhangは、LaputならびにHarrisonと共に、彼らがVibrosightと呼ぶものについて記述している。これはレーザー振動計を使用して室内の特定の場所で振動を検出できるものだ。これはかつてKGBが、窓などの反射面の表面の振動を検知して会話を聞き取るために使った、光学式のデバイスに似たものだ。
今回のシステムは、低出力レーザーおよび反射器を使用して、ある対象がオンまたはオフなのか、あるいは椅子やテーブルが動いたか否かを検知することができる。センサーは複数のオブジェクトを一度に監視することができ、オブジェクトに貼り付けられたタグは電力を消費しない。これにより1台のレーザー装置が、光が届く限り、ある部屋の中の(場合によっては複数の部屋の中の)複数の物体を監視することが可能となる。
研究はまだ初期段階だが、やがてロボットが、人間が皿洗いをやっているのを聞きつけ、その手際の良さに応じて、黙っていたり手伝いを申し出たりするようになるかもしれない。
[原文へ]
(翻訳:sako)