Googleのオンライン翻訳ツールが、10周年の日も近い今日(米国時間2/17)、大きな節目を迎えた。新たに、ハワイ語やクルド語など13の言語を加えたGoogle Translateは、100言語を超えて対応言語数が103になった。
Googleの主張によると、2006年4月に始まったこのサービスは今、世界のオンライン人口の99%をカバーしている。
Google Translateは2004年に企画された。当時協同ファウンダーのSergey Brinは、同社が使用料を払って使っていた翻訳プログラムに、激しく頭にくる体験をした。その翻訳ソフトウェアは、韓国語のメールを、”The sliced raw fish shoes it wishes. Google green onion thing!”、という、めちゃくちゃな英語に翻訳したのだ。
Google Translateは機械学習と人間ボランティアを併用し、後者が翻訳の正しさや、おかしさをチェックしている。ブログGoogle Translate Blogで同社が言っているところによると、新しい言語を加えるためには、その言語で書かれた文の別の言語への翻訳が、大量にネット上に存在しなければならない。それがあれば、機械学習は学習をすることができる。一方、人間ボランティアは300万人いて、翻訳を修正したり、別の訳語を提案したりしている。
今日加わった新しい言語は、Amharic(アムハラ語, エチオピアで使われている); Corsican(コルシカ語); Frisian(フリジア語, オランダとドイツ); Kyrgyz(キルギス語); Hawaiian(ハワイ語); Kurdish(クルド語); Luxembourgish(ルクセンブルク語); Samoan(サモア語); Scots Gaelic(スコットランド高地ゲール語); Shona(ショナ語, ジンバブエ); Sindhi(シンド語, パキスタンとインド); Pashto(パシュトー語, アフガニスタンとパキスタン); Xhosa(コーサ語, 南アフリカ)。