産業用の音声認識技術やエッジAIデバイスの開発提供を行うフェアリーデバイセズは1月5日、首掛け型ウェアラブルデバイス「THINKLET」(シンクレット)のための高度な指向性集音エッジソフトウェアを、NTTテクノクロスと共同で試作開発したことを発表した。同試作ソフトウェアは「LINKLET(インテリジェントマイク版)」として、1月5日より開催のデジタル技術見本市「CES 2022」に参考出展する。
THINKLETは、スマートフォン同等の処理性能とLTE通信機能を備える現場向けのウェアラブルデバイス。音声や内蔵カメラで撮影した画像などの現場データの収集・学習・自動化・支援を可能にする「コネクテッドワーカーソリューション」だ。広角カメラに加え、高性能なマイクを複数搭載するほか、エッジAI処理や5チャンネル・マイクアレイを活用した指向性集音機能で、工場や作業現場などの雑音の大きい場所で、会話や特定方向の音を聞きやすくするという。「THINKLET Cloud」に接続されていることから、現場の声のテキスト化も可能。
またフェアリーデバイセズは、その応用ソーリューションの1つとして、ZoomやMicrosoft Teams(2022年春頃めどにリリース予定)に対応し、1人称視点での遠隔支援・ライブストリーミングをハンズフリーで実現するウェアラブルプロダクトのLINKLETを展開している。
これまでフェアリーデバイセズは、多チャンネルマイクを利用したフロントエンド音響信号処理、雑音抑制、発話区間抽出、エコーキャンセル、ボイスウェイクアップなどの技術を複合した音声エッジAIライブラリー「mimi XFE」を提供してきたが、そこにNTTテクノクロスのインテリジェントマイク技術を組み合わせることで、高度で柔軟な指向性集音機能が実現されたという。
THINKLETは、すでにその指向性集音機能が評価されているが、今回の共同開発では雑音抑圧性能が大きく向上した。また、指向性を自由に制御できるようになり、装着者の声、目の前にいる人の声、特定方向の機械音などを選択的に聞くことが可能になった。これらにより、熟練作業者による円滑な遠隔作業支援、現場作業の対話記録、音声対話AIによる作業指示、機器の異常音検知などの性能が向上する。
今後は、革新的な音声フロントエンド処理のための技術開発を共同で進め、THINKLETを導入している現場からデータを集め活用することで、「世界中の現場DXに積極的に貢献」すると、フェアリーデバイセズでは話している。