GoogleのTranslateアプリは、iOSでもAndroidでも、現状ではインターネットにアクセスした方がオフラインで使うより結果が断然よろしい。その理由は、オフラインの翻訳は機械翻訳の古いテクニックであるフレーズ(語句)ベースの翻訳であるのに対し、オンラインでは最新の機械学習によるシステムを利用しているからだ。しかしそれが今日(米国時間6/12)から変わり、TranslateアプリではオフラインのNeural Machine Translation(NMT)が59の言語をサポートする。
今日はまだ、少数のユーザーがそのアップデートを体験できるだけだが、数週間以内に全ユーザーに展開される予定だ。
サポートされる言語はとても多くて、自分の好きなのだけ挙げてもしょうがないから、ここではそのすべてをご紹介しよう:
Afrikaans, Albanian, Arabic, Belarusian, Bengali, Bulgarian, Catalan, Chinese, Croatian, Czech, Danish, Dutch, English, Esperanto, Estonian, Filipino, Finnish, French, Galician, Georgian, German, Greek, Gujarati, Haitian, Creole, Hebrew, Hindi, Hungarian, Icelandic, Indonesian, Irish, Italian, Japanese, Kannada, Korean, Latvian, Lithuanian, Macedonian, Malay, Maltese, Marathi, Norwegian, Persian, Polish, Portuguese, Romanian, Russian, Slovak, Slovenian, Spanish, Swahili, Swedish, Tamil, Telugu, Thai, Turkish, Ukrainian, Urdu, Vietnamese and Welsh(アフリカーンス語、アルバニア語、アラビア語、ベラルーシ語、ベンガル語、ブルガリア語、カタルーニャ語、中国語。クロアチア語、チェコ語、デンマーク語、オランダ語、英語、エスペラント語、エストニア語、フィリピン語、フィンランド語、フランス語、ガリシア語、ジョージア語、ドイツ語、ギリシャ語、グジャラート語、ハイチ語、クレオール語、ヘブライ語、ヒンズー語、ハンガリア語、アイスランド語、インドネシア語、アイルランド語 、イタリア語、日本語、カンナダ語、韓国語(朝鮮語)、ラトビア語、リトアニア語、マケドニア語、マレー語、マルタ語、マラーティー語、ノルウェー語、ペルシャ語、ポーランド語、ポルトガル語、ルーマニア語、ロシア語、スロバキア語、スロベニア語、スペイン語、スワヒリ語、スウェーデン語、タミール語、テルグ語、タイ語、トルコ語、ウクライナ語、ウルドゥー語、ベトナム語、ウェールズ語)。
これまでは、ハードウェアの能力の限界などにより、スマートフォンの上でディープラーニングのモデルを動かすことはできなかった。しかし最近のハードウェアとソフトウェアの進歩により、その問題は克服され、またGoogleやMicrosoftなどはモデルを小さく圧縮して使う方法を見つけた。Googleの場合、それは一言語につき30から40メガバイトになる。
なおMicrosoftも今年の初めに、同社のTranslatorアプリに同種の機能を発表した。ただし当面それは、対象言語が1ダースぐらいだ。
画像クレジット: TechCrunch