Google Translateが一部のジェンダーバイアスを克服、女性形にも訳します

ジェンダーの問題に関してGoogleは決して完璧ではないが、でも努力はしている。そのGoogleが最近、同社のTranslateツールにちょっとした重要な変更を行った…ジェンダーに関してニュートラルな語の翻訳に女性形と男性形の両方を使って、ジェンダーバイアスを抑えたのだ。それまでGoogleは、ジェンダーニュートラルな語はデフォルトで男性形に訳していた。

それまでGoogleは、翻訳やオートコンプリート(自動補完)におけるバイアスを強く非難されていた。2月にはForbes誌が、ソーシャルメディアで報告されたTranslateのジェンダーバイアスの例を記事で取り上げた。

Google TranslateのプロダクトマネージャーJames Kuczmarskiが同社のブログにこう書いている: “いくつかの実在する文例を学習した機械学習のモデルがひとつの翻訳を作りだすときは、すでにあったジェンダーバイアスをそのまま再現していた。たとえば‘strong’や‘doctor’のような語は訳語が男性形に偏り、‘nurse’や‘beautiful’などは女性形に偏っていた”。

gender specific translation

今度からGoogle Translateは、英語をフランス語やイタリア語、ポルトガル語、スペイン語などに翻訳するときや、トルコ語を英語に翻訳するときは、女性形と男性形の両方を出力する。男/女という単純な二分法が通用しないジェンダーについても、今後対応していく予定だ。また今回はWebアプリケーションのみだが、いずれはiOSとAndroidのアプリもそのようにする。そしてオートコンプリートにおけるジェンダーバイアスにも対応する。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Googleの翻訳結果が‘字義通りだけど無意味’なので警官の捜索が憲法違反に

外国語の機械翻訳がとても便利であることは確かだが、どこかへの行き方やおすすめのランチ以上の話題になると、その浅さが現実的な障害になる。そしてそれが、法律や基本的人権の問題になると、“まあまあの翻訳”では役に立たない、とある判事が裁定した。

その判決(PDF)にそれほど重大な意味があるわけではないが、翻訳アプリは今や法曹の世界でも使われ始めているので、その今後の正しい進化のためにも、気にする必要があるだろう。今は幸いにも多言語社会になっているが、しかし現在および短期的な未来においては、異なる言語間の橋渡しがどうしても必要だろう。

その裁判では、Omar Cruz-Zamoraという名前のメキシコ人がカンサス州で警官に、道路脇への停車を命じられた。警官たちが彼の同意のもとに車の中を調べると、大量の覚醒剤やコカインが見つかり、当然ながら彼は逮捕された。

でも、ここからが問題だ。Cruz-Zamoraは英語が話せなかったので、車の中を捜索する同意はGoogle Translateを介する会話によって得られた。法廷は、その会話が十分に正確ではないので、“当事者の自発的かつ了解のもとに”得られた同意を構成しない、と見なした。

アメリカの憲法修正第4条は、不合理な捜索や押収を禁じている。そして正当な理由がない場合公務員は、Cruz-Zamoraが、車内の捜索を断ってもよいことを理解していることを必要とする。会話からは、その理解が明確でなく、一貫して両者は、相手の言っていることの正しい理解に失敗している。

それだけでなく、アプリが提供した翻訳は、質問を十分に正しく伝えていない。たとえば警官は英語から翻訳されたスペイン語で“¿Puedo buscar el auto?”、と質問している。その文字通りの意味は、“車を見つけてもよいですか”に近く、“車を捜索してもよいですか”にはならない。Cruz-Zamoraがその“字義通りだが無意味な”(←裁判長の言葉)翻訳結果から、車の捜索に同意するかという本当の質問を類推できた、という証拠はない。彼自身に選択の権利があることすら、理解しなかったかもしれない。

同意が無効なので車の捜索は憲法違反となり、Cruz-Zamoraの告訴は取り下げられた。

Google Translateなどのアプリでは同意が不可能、という意味ではない。たとえばCruz-Zamoraが自分でトランクやドアを開けて捜索をさせたら、それはたぶん同意を構成しただろう。しかし、アプリを使った対話が正確でないことは、明らかである。これは、英語の話せない人を助けたり調べるためにパトロールしている警官だけの問題ではなく、法廷の問題でもある。

機械翻訳サービスのプロバイダーは、その翻訳がほとんどの場合に正確だ、数年後にはとても難しい場合をのぞき人間翻訳者をリプレースする、とわれわれに信じさせようとしているかもしれない。しかし今回の例が示すのは、機械翻訳がもっともベーシックなテストに失敗することもありえる、ということだ。その可能性があるかぎり、私たちは健全な懐疑主義を持ち続けるべきだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

GoogleのTranslateアプリがインターネット版と同じく機械学習の使用へ(全59言語)

GoogleのTranslateアプリは、iOSでもAndroidでも、現状ではインターネットにアクセスした方がオフラインで使うより結果が断然よろしい。その理由は、オフラインの翻訳は機械翻訳の古いテクニックであるフレーズ(語句)ベースの翻訳であるのに対し、オンラインでは最新の機械学習によるシステムを利用しているからだ。しかしそれが今日(米国時間6/12)から変わり、TranslateアプリではオフラインのNeural Machine Translation(NMT)が59の言語をサポートする。

今日はまだ、少数のユーザーがそのアップデートを体験できるだけだが、数週間以内に全ユーザーに展開される予定だ。

サポートされる言語はとても多くて、自分の好きなのだけ挙げてもしょうがないから、ここではそのすべてをご紹介しよう:

Afrikaans, Albanian, Arabic, Belarusian, Bengali, Bulgarian, Catalan, Chinese, Croatian, Czech, Danish, Dutch, English, Esperanto, Estonian, Filipino, Finnish, French, Galician, Georgian, German, Greek, Gujarati, Haitian, Creole, Hebrew, Hindi, Hungarian, Icelandic, Indonesian, Irish, Italian, Japanese, Kannada, Korean, Latvian, Lithuanian, Macedonian, Malay, Maltese, Marathi, Norwegian, Persian, Polish, Portuguese, Romanian, Russian, Slovak, Slovenian, Spanish, Swahili, Swedish, Tamil, Telugu, Thai, Turkish, Ukrainian, Urdu, Vietnamese and Welsh(アフリカーンス語、アルバニア語、アラビア語、ベラルーシ語、ベンガル語、ブルガリア語、カタルーニャ語、中国語。クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エスペラント語、エストニア語、フィリピン語、フィンランド語、フランス語、ガリシア語、ジョージア語、ドイツ語、ギリシャ語、グジャラート語、ハイチ語、クレオール語、ヘブライ語、ヒンズー語、ハンガリア語、アイスランド語、インドネシア語、アイルランド語 、イタリア語、日本語、カンナダ語、韓国語(朝鮮語)、ラトビア語、リトアニア語、マケドニア語、マレー語、マルタ語、マラーティー語、ノルウェー語、ペルシャ語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、スロバキア語、スロベニア語、スペイン語、スワヒリ語、スウェーデン語、タミール語、テルグ語、タイ語、トルコ語、ウクライナ語、ウルドゥー語、ベトナム語、ウェールズ語)。

これまでは、ハードウェアの能力の限界などにより、スマートフォンの上でディープラーニングのモデルを動かすことはできなかった。しかし最近のハードウェアとソフトウェアの進歩により、その問題は克服され、またGoogleやMicrosoftなどはモデルを小さく圧縮して使う方法を見つけた。Googleの場合、それは一言語につき30から40メガバイトになる。

なおMicrosoftも今年の初めに、同社のTranslatorアプリに同種の機能を発表した。ただし当面それは、対象言語が1ダースぐらいだ。

画像クレジット: TechCrunch

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

ディープラーニングの導入でパワーアップしたGoogle翻訳にサポート言語がさらに増加

昨年の秋にGoogleは、Google Neural Machine Translation(GNMT)と呼ばれる新しい翻訳システムを導入した。それは、語句だけではなく文全体に、多層的ニューラルネットワークを利用するいわゆるディープラーニングを適用することによって、翻訳の質を大幅に上げようとするシステムだ。11月の時点でそれは、8つの言語ペア(後述)に適用されたが、今日からは新たにロシア語とヒンズー語をベトナム語がサポートされる。

Neural Machine Translationが昨年の時点でサポートした言語ペアは、英語とフランス語、ドイツ語、スペイン語、ポルトガル語、中国語、日本語、韓国語、トルコ語だ〔8ペアだが、片方はつねに英語〕。これらが世界の人口の約1/3をカバーし、Google Translateのクェリの35%以上を占める、と当時のGoogleは言っていた。

今日発表された新たな言語は、アメリカ国内だけでも、ベトナム語はネイティブスピーカーが129万2448人、ロシア語は83万6171人、ヒンズー語は58万6173人いる、とGoogleは国勢調査のデータを挙げている。今後数週間で、タイ語など新たな言語がさらに加わる予定だ。

Google Translateは、月間ユーザー数が5億あまり、1日の翻訳量は1400億語に達する、とThe New York Timesの12月の記事が報じている。その記事によると、翻訳システムのAIへの完全移行は今年の年内に完了するそうだ。

hindi_googletranslate_v2b

Neural Translationは機械学習における最新の技術を利用するから、これまでの翻訳システムに比べて大きな進歩であり、翻訳がより正確になるだけでなく、言葉の扱い方が人間のそれに近くなる。つまり従来のように、センテンスの各部分をひとつひとつ訳していくのではなく、まずセンテンス全体の構造や形を見る。それによって翻訳システムは文のコンテキストが分かるようになり、より適切な翻訳が可能になる。そして最後に、出来上がったセンテンスを正しい文法に則って調整し並べ替える。

しかもニューラルネットワークシステムの特性として、時間の経過とともに自分を改良し、長く使えば使うほどより自然な翻訳ができるようになる。

この、ニューラルネットワークを利用するGoogle翻訳は、今日(米国時間3/6)から供用開始される。それはtranslate.google.comにおける翻訳サービスだけでなく、Web上の検索、検索アプリ、そしてiOSとAndroid向けGoogle Translateアプリも含まれる。Google Chromeブラウザーにおけるページの翻訳にも、近日中に適用される。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

Google翻訳、リアルタイム翻訳機能を日本語でも提供開始

translate_-_cash_only-width-1023

Google翻訳はすでに日本語に対応しており、撮影した写真に含まれる文字を英語に翻訳することができた。しかしさらにワンステップ上のことができるのをご存知だろうか。カメラを標識やメニューなど日本語の書かれたものに向けるだけで、ただちに英語に翻訳してくれるようになっているのだ(逆もできる)。iOS版およびAndroid版のGoogle翻訳に搭載さGoogleのリアルタイム翻訳、日本語にも対応開始れているWord Lens機能が日本語に対応したわけだ。

リアルタイム翻訳を使ったことのない人は、どれだけ便利になったのかがよくわからないかもしれない。しかし日本語がほとんど使えずに日本に滞在することになってしまった人にとって、大変に便利なものであるのは間違いない。たとえば私の友人は、洗濯用の漂白剤だと思って別用途のものを買ってしまった。その漂白剤を使って洗濯したところ、一部分だけ色抜けしてしまい、残りの滞在期間をその服で過ごすはめになってしまった。手軽に翻訳することができれば、そのような失敗も減るに違いない。

Word Lensは、Googleが2014年に買収したQuest Visualにより開発されたものだ。以後、GoogleはWord Lensの機能をGoogle翻訳アプリケーション内で成長させつつある。2015年に最初に対応したのはスペイン語だった。最近になってGoogleは翻訳アプリケーションにAIによる機能強化を加えつつあるところだ。これにより、翻訳制度やスピードを大幅に改善しつつある。それもあり、今後はますますWord Lens対応言語が増えていくことは間違いない。

原文へ

(翻訳:Maeda, H

GoogleのAI翻訳ツールは独自の内部的言語を発明したようだ、そうとしか言えない不思議な現象が

terminat-visio2-620x340

まあ、パニックになる必要もないけど、今やコンピューターが自分たちの秘密の言語を作って、たぶんまさに今、われわれについて話しているんだ。ちょっと話を単純化しすぎたし、最後の部分はまったくのフィクションだけど、GoogleのAI研究者たちが最近、おもしろそうで、しかも人間にとって脅威になるかもしれない、事態の進展に、遭遇しているんだ。

憶えておられると思うが、Googleは9月に、同社のNeural Machine Translation(ニューラルネットワークによる機械翻訳)システムが稼働を開始したと発表した。それは、ディープラーニングを利用して複数の言語間の翻訳を改良し、より自然な翻訳にする、というものだ。そのこと自体はクールだが…。

これの成功のあと、その翻訳システムの作者たちは、あることが気になった。翻訳システムに、英語と韓国語双方向と、英語と日本語双方向の翻訳を教育したら、それは韓国語を日本語へ、あいだに英語を介さずに翻訳できるのではないか? 下のGIF画像を見ていただきたい。彼らはこのような翻訳方式を、“zero-shot translation”(ゼロショット翻訳、分枝のない翻訳)と呼んだ(オレンジ色のライン):

image01

そして — その結果は!、明示的なリンクのない二つの言語でありながら、まあまあの(“reasonable”)翻訳を作り出したのだ。つまり、英語はまったく使っていない。

しかしこれは、第二の疑問を喚起した。形の上では互いにリンクのない複数の概念や語のあいだの結びつきをコンピューターが作れるのなら、それは、それら複数の語で共有される意味、という概念をコンピューターが作ったからではないのか? 一つの語や句が他のそれらと同じ、という単純なレベルではなく、もっと深いレベルで。

言い換えると、コンピューターは、言語間の翻訳に自分が用いる概念(共有される意味概念)を表現する独自の内部的言語を開発したのではないのか? ニューラルネットワークの記憶空間の中では、さまざまなセンテンスがお互いに関連し合っているのだから、その関連の様相から見て、言語とAIを専門とするGoogleの研究者たちは、そうだ、と結論した。

A visualization of the translation system's memory when translating a single sentence in multiple directions.

翻訳システムの記憶の視覚化: 一つのセンテンスを複数方向へ翻訳している

この中間言語(“interlingua”)は、日・韓・英の三言語の文や語の類似性を表している表現の、ずっと深いレベルに存在しているようだ。複雑なニューラルネットワークの内部的処理を説明することはおそろしく難しいから、今これ以上のことを言うのは困難だ。

非常に高度なことをやってるのかもしれないし、あるいは、すごく単純なことかもしれない。でも、それがとにもかくにもある、という事実…システムが独自に作ったものを補助具として使って、まだ理解を訓練されていない概念を理解しようとしている…もしもそうなら、哲学的に言ってもそれは、すごく強力な‘才能’だ。

その研究論文は、Arxivで読める(効率的な複数言語翻訳に関する論文だが、謎のような中間言語にも触れている)。システムが本当にディープな概念を作ってそれを利用しているのか?、この疑問への答は今後の調査研究の課題だ。それまでは、最悪を想定していよう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

Google翻訳、アプリの切り替えなしに翻訳できる機能(Android)や、オフラインモード(iOS)を実装

google-translate-tap-to-translate-animated

Googleが提供している翻訳アプリケーションのアップデートを行った。iOS版およびAndroid版の双方が新しくなっている(訳注:訳者のところではまだアップデートが確認できていません。「next few days」のうちにアップデートされるそうです)。

今回のアップデートには、3つの重要なポイントがある。ひとつはiOS版でのオフライン翻訳のサポートだ。またAndroid版ではTap To Translate機能が実装された。さらに双方の環境のWord Lens機能において、中国語をサポートした。

オフラインモードは、実際に旅行先で用いる場合などに便利だろう。住み慣れた地元と異なり、思わないタイミングでネットワークから切り離されてしまうこともあるだろうからだ。ちなみにAndroid版では、以前からオフラインモードがサポートされている。Googleによれば、言語パッケージおサイズを最大で90%も軽量化したのだとのこと。おかげで今ではわずか25MBにおさめているのだそうだ。ダウンロード可能な言語パッケージは、現在のところ52言語分が用意されている。

Google Translate - Tap to Translate

Android版の利用者にとっては、Tap to Translateが嬉しい新機能だろう。Google翻訳アプリケーションに、翻訳したい内容をコピー&ペーストするのではなく、ただ単に知りたい単語をコピーすると翻訳を表示させることができるのだ。ちなみに翻訳は、アプリケーションを切り替える必要なくオーバーレイ形式で表示される。

なかには「その機能は前からあったはず」と感じる人もいるかもしれない。確かに、昨年からこのTap to Translate機能を一部で実装してはいるのだ。ただし、いぜんのものはWhatsAppやTripAdvisorなど、限られたアプリケーションでしか動作しないものだった。

Google Translate - Word Lens for Chinese

さらに。Word Lensの対応言語が増えたのが嬉しい(訳注:日本語は未対応ですので、Word Lensのすごさを感じてみたい方は、翻訳言語を英語とドイツ語ないしフランス語などにしてみると良いでしょう)。Word Lensはカメラで捉えた単語をリアルタイムで翻訳するものだ。今回のアップデートで簡体字および繁体字の双方に対応した。これでサポート言語は29言語となった。

Googleのスポークスパーソンが言うところでは、インドやインドネシアなどで新たにスマートフォンを入手した人などに話をきいて、今もっとも必要な機能を実装しようと考えたのだとのことだ。

原文へ

(翻訳:Maeda, H

Google Translateの言語が100を超え、世界のオンライン人口の99%をカバー

shutterstock_348701531

Googleのオンライン翻訳ツールが、10周年の日も近い今日(米国時間2/17)、大きな節目を迎えた。新たに、ハワイ語やクルド語など13の言語を加えたGoogle Translateは、100言語を超えて対応言語数が103になった。

Googleの主張によると、2006年4月に始まったこのサービスは今、世界のオンライン人口の99%をカバーしている。

Google Translateは2004年に企画された。当時協同ファウンダーのSergey Brinは、同社が使用料を払って使っていた翻訳プログラムに、激しく頭にくる体験をした。その翻訳ソフトウェアは、韓国語のメールを、”The sliced raw fish shoes it wishes. Google green onion thing!”、という、めちゃくちゃな英語に翻訳したのだ。

Google Translateは機械学習と人間ボランティアを併用し、後者が翻訳の正しさや、おかしさをチェックしている。ブログGoogle Translate Blogで同社が言っているところによると、新しい言語を加えるためには、その言語で書かれた文の別の言語への翻訳が、大量にネット上に存在しなければならない。それがあれば、機械学習は学習をすることができる。一方、人間ボランティアは300万人いて、翻訳を修正したり、別の訳語を提案したりしている。

今日加わった新しい言語は、Amharic(アムハラ語, エチオピアで使われている); Corsican(コルシカ語); Frisian(フリジア語, オランダとドイツ); Kyrgyz(キルギス語); Hawaiian(ハワイ語); Kurdish(クルド語); Luxembourgish(ルクセンブルク語); Samoan(サモア語); Scots Gaelic(スコットランド高地ゲール語); Shona(ショナ語, ジンバブエ); Sindhi(シンド語, パキスタンとインド); Pashto(パシュトー語, アフガニスタンとパキスタン); Xhosa(コーサ語, 南アフリカ)。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

標識などを瞬時に訳してくれるGoogle Translateが、対応言語を27ヵ国語に拡大

google_translate_hindi-2

自国語の通じない国を旅行したことはおありだろうか。最近ではそうした際に利用できるツールがいろいろと登場してきている。しかしそんな中でも、Google Translateが、No.1ツールとしての地位を獲得しているのではなかろうか。

手軽さでいってもナンバーワンで、6ヶ月前からはインスタント翻訳の機能も備えるようになった。これは、買収したWord Lensの機能を利用したもので、標識などにカメラを向けると、直ちに(かつ驚くほど正確に)内容を翻訳してくれるというものだ。

その機能はこれまで7ヵ国語で利用できるものだったが、このたび27ヵ国語に拡大されたのだ。これにより利用可能な言語は英語、フランス語、ドイツ語、イタリア語、ポルトガル語、ロシア語、スペイン語、ブルガリア語、カタロニア語、クロアチア語、チェコ語、デンマーク語、オランダ語、フィリピン語、フィンランド語、ハンガリー語、インドネシア語、リトアニア語、ノルウェイ語、ポーランド語、ルーマニア語、スロバキア語、スウェーデン語、トルコ語、そしてウクライナ語となった。iPad版およびAndroid版の双方で、アップデートの提供を開始したところだ。

インスタント翻訳および音声翻訳のスピードはニューラルネットワークを活用することで実現しているのだそうだ。仕組みについてはGoogle TranslateのソフトウェアエンジニアであるOtavio Goodがブログで説明している。なかなか難しい内容だが、テクノロジーに興味のある人には面白い内容だろう。

個人的には、ついには他言語を学ぶことなく、テクノロジーの力により理解できる時代になってきたのかと感慨深く思う。これはたとえばGPSに似ているだろうか。そちらの方も仕組みはよくわからないものの、手放せないツールとなっている。ついには外国語も「理解せずとも使える」段階になりつつあるのかもしれない。

(訳注:原文にはこの後、Google TranslateのプロダクトマネージャーであるJulie Cattiauへのインタビューが掲載されています)

原文へ

(翻訳:Maeda, H

Google Translateのモバイルアプリにリアルタイムの音声/街路標識翻訳が加わる

Google Translateは今すでに、海外で生活している人や、よく旅をする人にとって、たいへん便利なアプリケーションだが、今日(米国時間1/13)はそのモバイルアプリがさらにお利口になった。AndroidとiOSアプリの今回のアップデートでは、二つの気の利いた機能: リアルタイムの音声翻訳と街路標識の翻訳が加わったのだ。

街路標識(下図)については、GTには画像からの翻訳機能が前からあったが、今回のはリアルタイムで遅れがないし、オフラインでも使えるから旅行者にはとくに便利だ。

このビジュアルな翻訳は、GTアプリの中でモバイルデバイスのカメラをセレクトすると有効になる。そしてカメラを標識に向けると、その翻訳がすぐに画面に現れる。ただし、表示板の全体をカメラに写さないと、翻訳はできない。


リアルタイムの音声翻訳も、すごい。それぞれ相手の国語が分からない二人がいたら、このアプリは両者間の通訳を演ずることができる。

アプリ内のマイクをタップしてから、まず自分の国語で話す。その言語が認識されたら、マイクをもう一度タップすると、二人の会話を開始できる。リアルタイムでテキスト翻訳も併用するから、より優秀な通訳機能になる。

AndroidのGTアプリには前から音声翻訳の機能があったが、今やそれがiOSにもやってきた。ただしGoogleによると、Androidの方が“より速くてよりナチュラル”だそうだ。


なお、この‘瞬間的翻訳機能’には、まだ制限がある。今のところ対応言語は、英語⇔仏語|独語|伊語|葡萄牙語|露語|西班牙語のみ、である。仏語⇔独語、などはまだない。Googleは、徐々に言語は拡張する、と言っている。

Googleがついでに発表したGTの利用者データによると、毎月5億人が利用し、一日に10億件あまりの翻訳を行っているそうだ。

これらの数字もまたすごいが、iOSとAndroidアプリの両方に二つのとっても便利な機能が加わったのはありがたい。GTは今後さらに、巨大な怪物のようなアプリに育っていくのだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


Google翻訳に新たに10の言語が加わる、ビルマ語やインドのローカル言語など

Googleの翻訳ツールは対応言語がコンスタントに増えているが、今回のアップデートではミャンマー(ビルマ)の公用語であるビルマ語と、インドの地方言語の一つであるマラヤーラム語が加わったことが重要だ。後者はインドの6つの古典言語の一つで、3800万人が使っている。

Googleは今、同社のサービスを人口の多いインドで普及しようと努力しているから、マラヤーラム語への対応もうなづける。

今月初めにGoogleは、Indian Language Internet Allianceを立ち上げ、各種サービスのヒンズー語対応と、ヒンズー語による音声検索に力を入れていく意思を示した。そのときGoogle Indiaの専務取締役Rajan Anandanが記者会見の席で、“5億人のインド人全員が2017年までにインターネットを利用できるようにするためには、インターネットを英語のできない人でもアクセスできるようにしなければならない”、と述べた。Googleが対応するインドの言語は、今後もっともっと増えていく予定だが、今日のマラヤーラム語のGoogle Translateへの参加は、その重要な一歩でもある。

インドの公用語はヒンズー語と英語だが、インド政府はそのほかに約20種の地方言語も認めている。しかし最近の調査によると、インド全国で話されている言語の数は780種類、内1万人以上が使っているのは122だそうだ。

Googleによると、インドのインターネットユーザは約2億人で、毎月500万ずつ増えている。だから数年後にはインドのインターネットユーザ数は合衆国よりも多くなる。インドで英語ができる人は2億人弱と言われているので、Googleがインド市場を重視するかぎり、いろんな言語への対応を目指さなければならない。

一方、ミャンマー(ビルマ)に関してはGoogleの執行会長Eric Schmidtが昨年同国を訪れたとき、言論の自由の重要性を訴え、政府はインターネットを規制するな、と述べた。“粗悪な言論は規制によっては解消しない。粗悪な言論を淘汰するものは、より多くの自由な言論である。より多くのコミュニケーションである。より多くの人びとの声である。指導的立場にある政治家は、つねに、国民が何を考えているかをよく知っていなければ、優れた政治家であることはできない”、と彼は檄を飛ばした。

Googleのサービスの中ではとくに、検索と翻訳と地図のアクセス性を良くしたい、とSchmidtはそのとき述べた。

Googleによると今回のアップデートでGoogle Translateの対応言語は90になり、新たに2億人がこのツールを利用できるようになった。また同社のブログ記事では、Google Translateの翻訳の精度は各言語の翻訳コミュニティ(Translate Community)のメンバー次第であり、翻訳を修正したり、複雑なフレーズを翻訳したりして、ツールのアルゴリズムの欠陥を補う、と言っている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


Google翻訳、クラウドソーシングを活用して翻訳精度の向上を目指す

メジャーな言語について、Google Translateは徐々に(相対的な意味でだが)良い翻訳成果を提供できるようになりつつある。もちろん完璧というには程遠く、Googleも現状に満足しているわけではない。そのような中、利用者の協力に基づいて翻訳精度を高めるために、新たなTranslate Comuunityの設立がアナウンスされた。

Google Translate Communityには誰でも参加することができ、2ヵ国語以上に精通している人々に、翻訳語を入力してもらったり、あるいは既存訳語の修正をしてもらうことを目的としている。Googleによれば訳語の比較検討も行えるようになるらしいが、少なくとも当方ではその機能をまだ確認できていない。

Translate Communityにてメンバーが入力した翻訳はGogole翻訳のアルゴリズムに影響を及ぼすことになっているはずだ。「あなたの助力が多くの人の助けとなります」というようなことも記されている。「頂いた修正案などを使って、翻訳精度を高めていきたいと考えています」とも書いてある。

今のところ、表示されるフレーズに対する訳語を入力しても、何の反応も見られない。ただ単にデータがデータセンターに送られるだけだ。しかしそのうちに、こうした入力作業が具体的にどのような影響を与えるのかということも知覚できる仕組みになるらしい。

尚Googleは、コミュニティ以外の場所でも翻訳精度改善に向けての動きを見せている。Google Translateでの翻訳結果をみて、おかしなところを見つけたらそれを修正投稿する機能ができたのだ。これまでも翻訳の精度を評価する仕組みは提供してきていたが、新たに具体的な修正案を投稿できるようにもなったわけだ。

原文へ

(翻訳:Maeda, H


Googleの即席通訳機能が完成すれば言語バリアはすべて解消

Googleは、データを集めるためのものを作るのが好きだ。そのデータを使って消費者や企業の意思など、ありとあらゆる利益目的を判断していく。でもその池にある最大の魚はBabel fish、Douglas Adamsが彼のHitchhiker’s Guide to the Galaxyシリーズの中で発明した即席翻訳機だ。あらゆる言語間の翻訳/通訳を瞬時にして行い、シームレスなコミュニケーションを可能にする。Googleは、そのBabel fishを作ることによって、旅行時などの便宜を提供するだけでなく、集めたデータの採掘価値を増幅しようとしている。言うまでもなく翻訳/通訳によって、データの利用価値や受益者数が増加するからだ。

今日のThe Times紙の記事によると、GoogleのAndroidプロダクト管理担当VP Hugo BarraがThe Times紙に、単純な会話においてリアルタイムの通訳をするデバイスをGoogleは企画している、と話した*。人びとのあいだの言語バリアを取り除くその製品は、一部の言語に関してはすでに“ほぼ完成”していて、まわりにノイズのない環境では十分実用になるそうだ。〔*: THE TIMESのその記事では、通訳専用機ではなく携帯のアプリのようだ。〕

Googleには前からGoogle Translateというサービスがあり、テキストを翻訳する。Webページ全体の翻訳もする。しかし今回の目標は、受け答え関係のある二者間における日常の実用通訳だ。地球上の主な言語すべてに対応する製品の完成には数年を要するという、ほどんどSF的な話のようだが。

しかしすでにGoogleにはGoogle Nowというものがあり、パーソナルアシスタントや自動化デジタルプランナーもある。だから、これらの仲間に即席通訳機能が加わるのは自然だ。しかも、一部の言語と条件に関してはすでに完成しているというから、すごい。どこの誰とでも会話ができる超汎用通訳機能の完成は何年も先らしいが、そのときわれわれは、気づかない可能性もある。おそらく、それほど自然にさりげなく、Googleの全製品に搭載されるのだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


Google翻訳、カメラ入力(写真に撮って翻訳)対応言語をさらに拡大(日本語縦書にも対応済)

Android版Google翻訳の面白いところは、翻訳したい単語の写真を撮って、それを翻訳させることができる点にあると思う。Googleのアナウンスによると、この機能で新たに16言語がサポートされたのだそうだ。16言語とはブルガリア語、カタロニア語、デンマーク語、エストニア語、フィンランド語、クロアチア語、ハンガリー語、インドネシア語、アイスランド語、リトアニア語、ラトビア語、ノルウェー語、ルーマニア語、スロバキア語、スロベニア語、そしてスウェーデン語だ(訳注:日本語には縦書きも含め対応済)。

写真に撮ることで翻訳してしまう機能では、最初のリリースからチェコ語、オランダ語、英語、フランス語、ドイツ語、イタリア語、ポーランド語、ポルトガル語、ロシア語、スペイン語、そしてトルコ語など多様な言語をサポートしている。画像認識技術と機械翻訳技術を組み合わせて、このように膨大な言語群の翻訳機能を提供しているのだ。

尚、Google翻訳では最近フレーズブックが利用できるようになっている。よく使うフレーズを登録しておいて、後の必要なときに再利用するためのものだ。フレーズブックに記載した内容を何度も繰り返し利用すれば、記載した内容をGoogle翻訳が覚えこむことにも繋がる。

フレーズブックはGoogle翻訳アプリケーション内の星メニューをクリックすることで利用できる。星マークは通常「お気に入り」登録などのために利用されるが、Google翻訳アプリケーションではフレーズブックへの登録に利用されている。またGoogleにログインして利用している場合は、自動的にアカウント内での同期が行われ、Google翻訳のデスクトップ版にも、モバイルでの操作内容が反映されることとなる。

「よく使うフレーズをいろいろなデバイスで利用することで、何度か利用したはずの言葉の意味を見失ってしまうようなことがなくなります」とGoogleは言っている。

尚、今のところiOS版では写真から翻訳する機能は提供されていない。

原文へ

(翻訳:Maeda, H)


Android版Google翻訳がオフライン・モードに対応、日中韓の縦書文字認識、サポート言語は50ヶ国語に

Google翻訳は外国を旅行するときたいへん便利なツールだが、残念ながら1つ大きな欠点があった。外国を旅行しているときには往々にしてインターネット接続が確保できない。もちろん翻訳ツールは他に無数に出ているが、Android版の最新のGoogle翻訳(2.3+)50ヶ国語のオフライン言語パッケージをダウンロードできる機能が付加されたのはAndroid携帯とGoogle翻訳のユーザーにとって朗報だろう。

ユーザーはアプリのメニューから[オフラインの言語] を開き、サポートされている言語から翻訳元と翻訳先の言語をそれぞれタップしてダウンロードする。Googleによればオフライン版はオンライン版に比べていくらか簡略化されているというが、それでもオフラインでは使えないよりずっとましだ。

GoogleはiOS版の翻訳アプリも提供しているが、オフライン・モードが今後サポートされるのかどうかは明らかにされていない。

今回のアップデートの目玉はオフライン機能だが、それ以外にもこのバージョンだは日本語、中国語、韓国語の縦書のカメラによる文字認識がサポートされた。Googleは昨年8月にカメラによる文字認識のサポートを開始し、昨年12月には日本語、中国語、韓国語の横書きの認識ができるようになった。

翻訳は近く製造が開始されるGoogle Glassにとってキラー・アプリの1つになる可能性がある。Google翻訳チームは間違いなくすでにGlass対応の準備を進めていることだろう。Google翻訳チームのJosh EstelleはGlassユーザーで、GoogleのGlassプロモーション・ビデオに一瞬写る

[原文へ]

(翻訳:滑川海彦 Facebook Google+


Google翻訳でユーザが頻用する翻訳パターンを登録再利用できるようになった

Google Translate(Google翻訳)で、個人的なフレーズブック(語句覚え書き帳)を作れるようになった。そこにフレーズやセンテンスをメモしておくと、今後の翻訳時にそれが優先的に使われるようになる。Google Translateのチームは今日の発表声明で、“翻訳結果を記憶させておくことにより、ユーザがよく使うフレーズを保存しておき、後日、必要に応じて呼び出すことができる”、と言っている。

Googleによると、それらのフレーズが何度も再利用されることによって、その翻訳がGoogle Translateの“永続的な知識”になる(あなたが昔ラテン語のクラスで反復練習による丸暗記を強いられたように)。

フレーズブック機能はデフォルトでonになっている。画面右隅にある小さな本のようなアイコンをクリックすると、それにアクセスできる。フレーズを保存するときは、翻訳の下にある星印のアイコンを押す。

フレーズブックの内容は、左に原文、右に翻訳結果、という単純な構成だ。Google Translateのほかの機能と同じく、対象言語別にフィルタできる。また、各フレーズを音声で聞くことも可能だ。

〔下の図では「Thank you.」と「ありがとう。」のペアをこれから保存する。図の右は、保存後のフレーズブックの内容。〕

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))