YouTube、毎日ビデオ10億本を自動字幕化と発表

2017-02-17-youtube-subtitle

Googleが最初にYouTubeに自動字幕化機能を導入したのは2009年のことだったが、結果は散々だった。しかしGoogleの音声認識機能は飛躍的進歩を遂げた。YouTubeの字幕化は現在でも多少の間違いは散見するものの、聴覚障害があるユーザーには欠かせない機能となっている。今日(米国時間2/16)、YouTubeチームが発表したところによると、毎日字幕を付加されるビデオは10億本、ユーザーは1500万人に上っているという。

Googleによれば、このサービスはエラー率で人間による文字起こしに日々近づきつつある。この数年の同社のエンジニアリング・チームの努力により、字幕の正確性は50%増加した。YouTubeビデオの内容はとほうもなく広い範囲にわたるので字幕を付けるのは困難な作業だ。同時にGoogleの音声認識テクノロジーにとって非常に有用な訓練データを提供する役割も果たしている。YouTubeのユーザー・コミュニティーは字幕をチェックし、間違いがあればフィードバックする。この情報も機械学習の精度をアップするのに非常に役立っている。

YouTubeの字幕化機能は現在10言語をサポートしている。YouTubeのプログラム・マネージャー、Liat Kaverは「われわれは音声認識の最新の成果をすべての言語に活かしたい」と書いている。

〔日本版〕記事中のスクリーンショットの字幕の中央部にYouTubeとあるが、Googleのブログ記事を見ると、当初は誤ってyouという字幕をつけていた。ブログ記事原文はこちら。サポートされている言語は英語、オランダ語、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語、ロシア語、スペイン語。 自動字幕起こし機能の利用法はこちら(日本語)。

元の動画(YouTubeクリエーターアカデミー)を下にエンベッドした。画面下部メニュー欄右側の四角い「字幕」アイコンをクリックすると画面内に字幕(英語)が表示される。YouTubeサイトに移動して「その他」メニューから「文字起こし」を選択すると画面下に別窓が開き、各国語に翻訳された字幕が表示される(画面内に表示される字幕とは別)

[原文へ]

(翻訳:滑川海彦@Facebook Google+

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。