ユニバーサルトランスレーター(多国語同時翻訳機)を解剖する

View of the 'Warp Core,' the engine of the USS Enterprise, in a scene from an episode of the television series 'Star Trek: The Next Generation' entitled 'Force of Nature,' California, November 15, 1993. (Photo by CBS Photo Archive/Getty Images)

【編集部注】著者のVadim BermanはAspect Softwareのエンジニアリングディレクターである。
2015年のLinguaSysの買収に伴いAspectに入社した。2010年にLinguaSysを共同創業し、最高技術責任者(CTO)を務めていた。彼は最近オーストラリアのメルボルンからマサチューセッツ州に移住した。

映画評論家たちは、異星人の言葉を解読しようとするある言語学者の努力に焦点を当てた、ドゥニ・ヴィルヌーヴのSFドラマであるArrivalを称賛し続けている。スタートレックは最近50周年を迎えた。言語のオタク兼SFファンとして、私はスターシップエンタープライズの乗組員が使用するユニバーサルトランスレーター(多国語同時翻訳機)の実現可能性を調べることは論理的だと感じた。

先にお断りしておくが、これは機械翻訳技術についての新たな記事ではない。そこでは、既に様々なアプローチ新しい有望な開発が現実のものとなっている。人間の翻訳エキスパートのレベルには達していないものの、機械翻訳は既に複数のシナリオで利用可能だ。(既知の言語の翻訳は、もちろん、スタートレックのユニバーサルトランスレーターの一部でもあり、スタートレックの言語学者たちは、言語的な内部構造を手動で調整する必要に迫られることもある)。

この記事では、未知の言語の解読に用いられる装置のデコードモジュールに焦点を当てる。

現実世界における解読

どんなに洗練されていたとしても、すべての解読技術は同じコアを持っている:未知の言語を既知の知識にペアリングすることだ。古典的なロゼッタストーンは、最も有名な例である:古代エジプトの象形文字、古代ギリシア語、そしてまた別のエジプト語(デモティック)による碑文を持つ石版が、長い間失われていた言語を理解するための出発点として使用された。

今日では、対応テキストを「仮想ロゼッタストーン」として利用することで、統計的機械翻訳エンジンも同様の方法で生成される。しかし、対応テキストが存在しない場合には、解読は密接に関連した言語や、なんであれ適用可能な手掛かりに依存することになる。

おそらく、解読に関する最も劇的なエピソードは、冷戦の緊張によって増幅された2つの相反する視点を含む、マヤ文字に関するものだろう。最近では、MITのRegina Barzilayが、既知の言語との類似性を仮定して、機械学習を使用することにより、長い間忘れられていた言語を解読した

しかし、ロゼッタストーンや類似言語が存在しないときにはどうすれば良いだろう?対面でのやり取りでは、Arrivalで描かれたシナリオのように、ジェスチャー、物理的なオブジェクト、そして表情を使って語彙を構築する。こうした方法は、新世界を探索した船乗りたちによって使用され、今日ではアマゾンのピダハン族(Pirahã)の人々と数十年を過ごしたDaniel Everettのような人類学者や言語学者によって採用されることがある。

現実が空想を模倣する:汎用言語(lingua universalis)

しかし、対面でのやりとりが不可能なときには、どうすべきだろうか?

何十年もの間SETIの研究者たちは地球外知性の兆候を探して、空をスキャンして来た。そのうちの何人かは、特に以下のような問いに集中している「私たちが信号を受信したらどうなるのか?」そして「どうすれば受信したものがノイズではなく信号だと知ることができるのだろうか?」。

これらの問題に取り組んでいる最も注目すべきSETIの人びとがLaurance DoyleJohn Elliottの2人だ。Doyleの研究は、コミュニケーションシステムがその複雑さにおいて人間のコミュニケーションと似ているかどうかを判断するために、クロード・シャノンの情報理論の応用に焦点を当てている。Doyleは、有名な動物行動・コミュニケーション研究者Brenda McCowanと共に、様々な動物コミュニケーションデータを分析し、その情報理論の特徴を人間の言語の特徴と比較した。

どんなに洗練されていたとしても、すべての解読技術は同じコアを持っている:未知の言語を既知の知識にペアリングすることだ。

John Elliottの仕事は、未知のコミュニケーションシステムに特化している;出版しているトピックは、伝達が言語的なものかを検出することから、言語の構造を評価することまで、そして最後に、彼が「検出後解読マトリックス(post-detection decipherment matrix)」と呼ぶものを構築するところにまで及ぶ。Elliott自身の言葉によれば、このマトリックスは「『全人類の発話』全体を表すコーパス」を使用して、教師なし学習ツールを適用し、そして最近の仕事では他のコミュニケーションシステム(例えば動物のコミュニケーション)なども取り込んでいる。Elliottの仮説的システムは、概念のオントロジーを「普遍的な意味論的メタ言語」に依存している(ちょうどスワデシュ・リストが共通の基本概念を集めているのと同様に)。

興味深いことに、空想の産物であるユニバーサル・トランスレーターと現実の科学者が問題に取り組む方法との間には、ある種の類似点がある。カーク船長(スタートレックの登場人物)の説明によれば 、「特定の普遍的なアイデアと概念」は「すべての知的な生命体に対して共通」なので、トランスレーターは「脳波パターン」の周波数を比較し、認識したアイデアを選び出し、必要な文法を提供する。

いろいろな仮説上の神経中心が、認識可能な活動パターン(脳波であるか否かに関わらず)を生成し、そのコミュニケーションが神経中心の特定領域を活性化する刺激を生成すると仮定すると、このアプローチにはメリットがあるだろう — こうした変動を検出することが十分に可能なハードウェアが提供されるとすればだが。周波数解析はElliottとDoyleの仕事全体に渡って言及されているジップの法則にも沿ったものである。

その他のスタートレックシリーズでは、翻訳を容易にするために使用される翻訳マトリックスが、曖昧ながらも繰り返し言及されている。芸術的表現や過剰技術表現はさておくとして、「マトリックス」という言葉と膨大な翻訳対の組み合わせが、実世界の中間言語(interlingua)モデルに対応している。その中間言語は知識を抽象的で特定の言語からは独立した形で表現する。

スタートレックの中では、ユニバーサルトランスレータが動作しないときの最後の手段として使用されるlinguacode(初期接触に用いられる特別なマトリックス)についても言及されることがある。このlinguacodeの現実世界における相当品として、lincosというものが存在している。Lincosとその派生言語は共に、普遍的な数学的概念を使用して、他の種とコミュニケートするように設計された人工言語だ。

エンジンルームからの眺め

言語に依存しないセマンティック(意味)エンジンについて10年以上仕事をしてきた者として、セマンティック分析の前提条件としてElliottによって記述されたシステムとオントロジが、私が構築したものに非常に近いことに気づいたとき、私は非常に興奮した。すべての言語を「全人類の発話」に束ねてしまうと、システムを目標とするコミュニケーションシステムからあまりにも遠すぎる「ワンサイズフィッツオール」(1つで何にでも間に合わせること)へ向かわせてしまうことがある。

そのようにする必要はないのだ。 (限定されたエンティティのセットだけでなく)シンタックス構造とセマンティクスの両方をマッピングできるシステムでは、相互作用シナリオの普遍性に依拠した、より正確に順序付けられた統計モデルを構築することを可能にする「シナリオのコーパス」を作りだすことが可能である。

例えば:

  • 対話の一部であることが意図されている殆どのメッセージは、大部分の言語で、挨拶で始まる。
  • ほとんどの技術文書は数字を含む。
  • すべての請求は依頼を含み、多くの場合脅迫も含む。
  • ニュースアカウントは1つの事象を参照する。
  • 大部分の長い文書は章に分割され、またそれらの章の間には章番号か章名が挟まっている。
  • 参考記事は独立した実体を記述する。

こうしたものは特定の言語構造とは無関係であり、一般に、尊重すべき最少労力の原則、あるいはグループ内での効率的なコミュニケーションの必要性から生じる。

セマンティクス上で操作を行うシステムを使用することで、表面的な表現に依存せず、語意を記録することなしに、コーパスを構築することが可能になり、純粋に意味的で真に汎用的なコーパスを得ることができる。意味論的にグループ化された構文構造を持つことにより、より多くの可能性が開かれる。

ロゼッタストーンの代わりに、このシステムはハイテク版「ロゼッタルービックキューブ」として機能し、最高のマッチングコンビネーションが見つかるまで、膨大な数の組み合わせが試される。

言葉を超えて

地球外知性からの仮説的なコミュニケーションよりもアクセスしやすい何かを用いて、「ユニバーサルトランスレーター」ソフトウェアをテストすることは可能だろうか?多くの研究者は可能だと信じている。鯨類のコミュニケーションが人間の言語のすべての特徴を持つことは証明されていないが、それが可能であることを強く示唆する証拠はある。

例えばイルカは、人間の名前と同等であるように見える、いわゆる個人署名ホイッスルを使用する。とりわけ、署名ホイッスルは個体を特定するために使用され、したがって、コミュニケーションシステムが言語と見なされるための要件の1つである超越性(displacement)を満たす。 Louis Hermanの実験の過程では、イルカたちは変形版の米国手話をなんとか学んで「右」や「左」のような抽象的な概念を理解することができた。なんといっても、イルカの複雑な社会生活には、効率的かつ同様に複雑なコミュニケーションによってのみ実現される活動の調整が必要なのだ。

しばしば引用される鯨類に加えて、他の種にも複雑なコミュニケーションシステムを持つ証拠がある。一連の実験では、蟻のコミュニケーションは無限であり(すなわち、人間の言語のような無限の組み合わせを持つ)、おそらくコンテンツを効率的に「圧縮」していることが示されている(例えば、 「左回り、左回り、左回り、左回り」と言う代わりに「左回り4回」と言う)。

DoyleとElliottは鯨類のコミュニケーションを情報理論が提供する様々なツールで研究した。Elliottは、人間の言語、鳥の歌、イルカのコミュニケーション、ホワイトノイズや音楽などの非言語的なソースのエントロピーを計算した。

コミュニケーションシステムは共通の「対称A型振幅」(symmetric A-like amplitude)形状を持っていて、人間とイルカの対称性はより高く、鳥の対称性はより低い。Doyleはザトウクジラの声で同様の測定を行い、同様の結論に達した。

以上がいくつかの動物コミュニケーション団体が、SETIと協力している理由である。真に普遍的な解読のフレームワークは、複雑な動物コミュニケーションシステムを取り込んで学ぶ能力がなければ、不完全なものとなるだろう。

[ 原文へ ]
(翻訳:Sako)

FEATURED IMAGE: CBS PHOTO ARCHIVE/GETTY IMAGES

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。