ディープラーニングの導入でパワーアップしたGoogle翻訳にサポート言語がさらに増加

昨年の秋にGoogleは、Google Neural Machine Translation(GNMT)と呼ばれる新しい翻訳システムを導入した。それは、語句だけではなく文全体に、多層的ニューラルネットワークを利用するいわゆるディープラーニングを適用することによって、翻訳の質を大幅に上げようとするシステムだ。11月の時点でそれは、8つの言語ペア(後述)に適用されたが、今日からは新たにロシア語とヒンズー語をベトナム語がサポートされる。

Neural Machine Translationが昨年の時点でサポートした言語ペアは、英語とフランス語、ドイツ語、スペイン語、ポルトガル語、中国語、日本語、韓国語、トルコ語だ〔8ペアだが、片方はつねに英語〕。これらが世界の人口の約1/3をカバーし、Google Translateのクェリの35%以上を占める、と当時のGoogleは言っていた。

今日発表された新たな言語は、アメリカ国内だけでも、ベトナム語はネイティブスピーカーが129万2448人、ロシア語は83万6171人、ヒンズー語は58万6173人いる、とGoogleは国勢調査のデータを挙げている。今後数週間で、タイ語など新たな言語がさらに加わる予定だ。

Google Translateは、月間ユーザー数が5億あまり、1日の翻訳量は1400億語に達する、とThe New York Timesの12月の記事が報じている。その記事によると、翻訳システムのAIへの完全移行は今年の年内に完了するそうだ。

hindi_googletranslate_v2b

Neural Translationは機械学習における最新の技術を利用するから、これまでの翻訳システムに比べて大きな進歩であり、翻訳がより正確になるだけでなく、言葉の扱い方が人間のそれに近くなる。つまり従来のように、センテンスの各部分をひとつひとつ訳していくのではなく、まずセンテンス全体の構造や形を見る。それによって翻訳システムは文のコンテキストが分かるようになり、より適切な翻訳が可能になる。そして最後に、出来上がったセンテンスを正しい文法に則って調整し並べ替える。

しかもニューラルネットワークシステムの特性として、時間の経過とともに自分を改良し、長く使えば使うほどより自然な翻訳ができるようになる。

この、ニューラルネットワークを利用するGoogle翻訳は、今日(米国時間3/6)から供用開始される。それはtranslate.google.comにおける翻訳サービスだけでなく、Web上の検索、検索アプリ、そしてiOSとAndroid向けGoogle Translateアプリも含まれる。Google Chromeブラウザーにおけるページの翻訳にも、近日中に適用される。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))