Google Translateの言語が100を超え、世界のオンライン人口の99%をカバー

shutterstock_348701531

Googleのオンライン翻訳ツールが、10周年の日も近い今日(米国時間2/17)、大きな節目を迎えた。新たに、ハワイ語やクルド語など13の言語を加えたGoogle Translateは、100言語を超えて対応言語数が103になった。

Googleの主張によると、2006年4月に始まったこのサービスは今、世界のオンライン人口の99%をカバーしている。

Google Translateは2004年に企画された。当時協同ファウンダーのSergey Brinは、同社が使用料を払って使っていた翻訳プログラムに、激しく頭にくる体験をした。その翻訳ソフトウェアは、韓国語のメールを、”The sliced raw fish shoes it wishes. Google green onion thing!”、という、めちゃくちゃな英語に翻訳したのだ。

Google Translateは機械学習と人間ボランティアを併用し、後者が翻訳の正しさや、おかしさをチェックしている。ブログGoogle Translate Blogで同社が言っているところによると、新しい言語を加えるためには、その言語で書かれた文の別の言語への翻訳が、大量にネット上に存在しなければならない。それがあれば、機械学習は学習をすることができる。一方、人間ボランティアは300万人いて、翻訳を修正したり、別の訳語を提案したりしている。

今日加わった新しい言語は、Amharic(アムハラ語, エチオピアで使われている); Corsican(コルシカ語); Frisian(フリジア語, オランダとドイツ); Kyrgyz(キルギス語); Hawaiian(ハワイ語); Kurdish(クルド語); Luxembourgish(ルクセンブルク語); Samoan(サモア語); Scots Gaelic(スコットランド高地ゲール語); Shona(ショナ語, ジンバブエ); Sindhi(シンド語, パキスタンとインド); Pashto(パシュトー語, アフガニスタンとパキスタン); Xhosa(コーサ語, 南アフリカ)。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。