ChatableAppsが聴覚支援アプリをリリース、ディープラーニングで話し言葉とノイズを区分

ChatableAppsが聴覚支援アプリのiOS版をリリースした。近々Android版もリリースされる予定だ。このアプリは、Mark Cuban(マーク・キューバン)氏が支援し、聴覚神経信号処理に関するAndy Simpson(アンディ・シンプソン)博士の研究成果に基づいて開発されたもので、ほぼリアルタイムで背景雑音を除去し、1対1の会話を聞き取りやすくする。

ChatableAppsによれば、このアプリは市場にある他のソリューションとは異なり、現在のスマートフォンと標準的なイヤフォンで使える。Chatableアプリの初期の「臨床前」テストでは、従来の補聴器と同等、またはそれを上回る性能で、テスト参加者の86%がChatableAppsの「ユニバーサルな補聴器」の機能は既存の補聴器より会話に適していると回答したという。

2020年3月にChatableAppsの資金調達について取り上げた際、共同創業者のBrendan O’Driscoll(ブレンダン・オドリスコル)氏は筆者に対し、同社のテクノロジーとアプローチはノイズフィルタリングや他のDSP技術を使用していないため「かなりユニークだ」と語っていた。同氏は「実際には、話し言葉とノイズを区分する深層学習ニューラルネットアプローチだ。オリジナルの音声にフィルターを適用するのではなく、音を聞き、オリジナルの音から声の部分だけをまったく新しいオーディオストリームとしてほぼリアルタイムで再現する」と説明した。

つまり、不要な音にラベルをつけて除去する方法で背景雑音を取り除く従来のアプローチではなく、「VOXimity」と名付けられたChatableAppsのAIがユーザーにとって聞きたい声を識別し、新たに音声トラックを作る。作られる音声トラックは(多かれ少なかれ)元の音声と同じだが、背景の音が除去されている。この技術は、エンド・ツー・エンドのニューラルスピーチ合成と呼ばれている。

ChatableAppsのCEOのGiles Tongue(ジルス・タング)氏は筆者に対し、できるだけ早い時期にアプリをリリースしようと努めたことを説明した。新型コロナウイルス(COVID-19)感染拡大の影響で耳鼻科に行けなくなったり、みんながマスクをつけるようになって口の動きから話し言葉を読み取ることができなくなったりした人々にとって、このアプリが困っている部分を埋められるだろうと認識したためだ。

タング氏は次のように述べた。「臨床前のテストがうまくいったので、新型コロナウイルスの影響で困っている人々を助けたいという聴覚の専門家からの緊急性の高い需要に応えるために、アプリをすぐにリリースすることにした。マスクで口の動きを読み取れない、あるいは緊急時に耳鼻科に行けない多くの人々に、我々はコミュニケーションを助けるライフラインを提供する」。

このアプリはソーシャルディスタンスの確保にも役立ちそうだ。タング氏は「話している人の横にスマートフォンを置き、あなたはBluetoothイヤフォンを装着すれば、3メートル離れても相手の話は完璧にくっきりと聞こえる」と補足した。

2020年3月のTechCrunchの記事以降、同社ではChatableAppsの価格モデルも再考した。有料サブスクリプションのみで展開する予定だったが、現在は一部の機能が制限された無料版としても利用できる。

同社は「このアプリは無料で利用でき、サブスクリプションに登録すれば高性能の音声増大および背景雑音除去機能をフルアクセスで利用できる」と説明している。サブスクリプション費用は、月額で1400円、年額で8700円だ。

[原文へ]

(翻訳:Kaori Koyama)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。