GoogleのProject Euphoniaは発話障がい者の話し言葉の認識を目指す

発話障がいのある人は、AIを活用した音声認識テクノロジーを利用できない。Googleはこの課題に挑んでいる。

5月に開催されたGoogle I/Oで、GoogleはProject Euphoniaを公開した。これは発話障がいのある人などさまざまなタイプの話し言葉をAIによって認識できるようにしようというプロジェクトだ。

GoogleのCEO、Sundar Pichai(サンダー・ピチャイ)氏はGoogle I/Oで次のように語った。「発話障がいのある人や脳卒中の後遺症で発話に影響を受けている人、ALSの人たちをサポートしたいと考えている。Google ARの研究者たちが、一人ひとりに応じたコミュニケーションのモデルに関するアイデアを探っているところだ。そうしたモデルによりさまざまなタイプの話し言葉をもっと認識できるようになるし、AIは話し言葉でコミュニケーションをとることのできない人の助けにもなるだろう」。

Pichai氏は「現在は、発話障がいがあると音声認識のテクノロジーを利用できない。十分な量のデータセットを集めている人がいないからだ」と説明する。Project Euphoniaはこの領域に踏み込んでいく。

Googleは、非営利団体のALS Therapy Development InstituteやALS Residence Initiativeの協力を得て、ALSの神経変性疾患を発症している人の話し言葉を集めている。

「将来、こうした音声認識モデルをGoogle Assistantに取り入れられるよう、我々は懸命に取り組んでいる 」とPichai氏は語る。

しかしそれを実現するには、もっとたくさんのトレーニングデータが必要だ。Pichai氏は、発話が困難な人はここから音声のサンプルを提供してほしいと呼びかけている。

画像:Screenshot

[原文へ]

(翻訳:Kaori Koyama)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。