Googleが最初にYouTubeに自動字幕化機能を導入したのは2009年のことだったが、結果は散々だった。しかしGoogleの音声認識機能は飛躍的進歩を遂げた。YouTubeの字幕化は現在でも多少の間違いは散見するものの、聴覚障害があるユーザーには欠かせない機能となっている。今日(米国時間2/16)、YouTubeチームが発表したところによると、毎日字幕を付加されるビデオは10億本、ユーザーは1500万人に上っているという。
Googleによれば、このサービスはエラー率で人間による文字起こしに日々近づきつつある。この数年の同社のエンジニアリング・チームの努力により、字幕の正確性は50%増加した。YouTubeビデオの内容はとほうもなく広い範囲にわたるので字幕を付けるのは困難な作業だ。同時にGoogleの音声認識テクノロジーにとって非常に有用な訓練データを提供する役割も果たしている。YouTubeのユーザー・コミュニティーは字幕をチェックし、間違いがあればフィードバックする。この情報も機械学習の精度をアップするのに非常に役立っている。
YouTubeの字幕化機能は現在10言語をサポートしている。YouTubeのプログラム・マネージャー、Liat Kaverは「われわれは音声認識の最新の成果をすべての言語に活かしたい」と書いている。
〔日本版〕記事中のスクリーンショットの字幕の中央部にYouTubeとあるが、Googleのブログ記事を見ると、当初は誤ってyouという字幕をつけていた。ブログ記事原文はこちら。サポートされている言語は英語、オランダ語、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、ロシア語、スペイン語。 自動字幕起こし機能の利用法はこちら(日本語)。
元の動画(YouTubeクリエーターアカデミー)を下にエンベッドした。画面下部メニュー欄右側の四角い「字幕」アイコンをクリックすると画面内に字幕(英語)が表示される。YouTubeサイトに移動して「その他」メニューから「文字起こし」を選択すると画面下に別窓が開き、各国語に翻訳された字幕が表示される(画面内に表示される字幕とは別)
[原文へ]
(翻訳:滑川海彦@Facebook Google+)