10ドル足らずの費用でAIに国連総会の偽スピーチを書かせることができる

国連の研究員たちが、わずか8ドル足らずの費用とMLモデルの13時間の訓練により、国連総会のスピーチのそっくりさんを作るプログラムを開発した。

MITのTechnology Reviewに載ったその研究は、これもまた、今がディープフェイク(deepfake)の時代であることを示唆する例の一つであり、テキストの贋作がビデオの贋作に劣らぬ脅威でありうることを示している。簡単安価に作れるから、ビデオよりも始末に負えないかもしれない。

偽の国連スピーチを作り出すために使ったAI実験の結果

研究員のJoseph BullockとMiguel Luengo-Orozは、1970年から2015年までの間に国連総会で行われた政治家たちのスピーチの、英語による書き起こしを使って、機械学習のアルゴリズムのためのタクソノミー(分類集)を作った。

その目標は、気候変動やテロなどさまざまな話題に関するスピーチの形をしたテキストを生成できる、言語モデルを訓練することだった。

彼らのソフトウェアは、タイトルとなる話題のあるセンテンスを一つか二つ与えるだけで、一つの話題につき50から100ワードのテキストを生成できた。

目標は、一般的な話題でも、あるいは国連事務総長が行った特定の声明でも、それらをもとに本物そっくりのスピーチを作れることを示すこと。そして最終的には、そのソフトウェアが政治的に微妙な話題に関してはスピーチに脱線(主題からの逸脱)を含めることができるか、確認することだった。

やや安心できるのは、一般的で抽象的な主題ほど、アルゴリズムは良い仕事をしたことだ。総試行回数のおよそ90%は、プログラムが国連総会のスピーカーの一般的な政治的話題に関する本物の演説草稿と見紛う、もしくは特定の問題に関する事務総長のスピーチとそっくりな、テキストを生成できた。移民や人種差別などのきわどい話題に関しては、ソフトウェアは脱線をうまく扱えなかった。それは、データがその種のスピーチ発話を実効的に模倣できなかったからだ。

そして、これらの結果すべてを作り出すためにソフトウェアが要した時間は13時間、所要費用は7ドル80セントだった。(訳注: レポート原文より…The language model was trained in under 13 hours on NVIDIA K80 GPUs, costing as little as$7.80 on AWS spot instances. AWSのGPUインスタンスをスポットで使ってモデルを訓練している。)

このソフトウェアの作者たちは、テキストのディープフェイクが現実の政治に及ぼしうる影響について次のように述べている:

AI技術の普及と偏在化により、それがもたらす問題も一層複雑になっている。しかも往々にして、それらがあまりにも複雑で理解も容易でないため、そのもたらしうる危険な影響に対して多くの人びとが無関心になっている。しかしながら私たちは、普通の人間のレベルでこれらのリスクの重大性が確実に認められるよう、努めなければならない。AIに対する法と規制が緊急に必要であり、それによりリスクと危害の可能性を制限しなければならない。このことを念頭に置きつつ、この研究の意図は、AIによるテキスト生成が平和と政治的安定にもたらしうる危険性に関して、認識と意識を喚起することであり、科学と政治の両分野における、これらの問題への今後の取り組みを示唆し推奨することである。

画像クレジット: Damien Meyer/AFP/Getty Images

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。