Facebookの判別コンペはディープフェイク抑止に有望な第一歩

深層学習を利用して生成されたフェイク動画であるディープフェイクはますます勢いを増しており、巨大プラットフォームをもつサービスは、ディープフェイクをいち早く見抜く必要に迫られている。

これがFacebookがディープフェイクを見抜くコンテスト、Deepfake Detection Challengeを昨年スタートさせた理由だ。数カ月のコンペを経て優勝者が決定された。その結果はといえば、完全というには遠い。しかし当てずっぽうよりはましだ。ともかく我々はどこからか始めねばならない。

登場したのはここ1、2年だが、ディープフェイクはAIカンファレンスのデモ用のニッチなおもちゃから、政治家やセレブのフェイクビデオを誰でも作れるソフトに進化した。そうしたフェイクビデオは本物と見分けがつけにくく、制作するソフトは誰でもイ簡単にダウンロードできる。

FacebookのCTO（最高技術責任者）であるMike Schroepfer（マイク・シュロープファー）氏はこのコンペについての電話記者会見でこう述べた。「クリックするだけでダウンロードでき、Windowsマシンで動くディープフェイク生成ソフトを私は手に入れている。本物と判別する方法はない」。

今年は米国大統領選挙がある。悪事を企む連中がディープフェイクを使って候補者に言ってもいなないことをしゃべらせ、有権者を誤った方向に誘導しようとする最初の大統領選になるに違いない。このところ一部から非難を浴びているFacebookとしてはディープフェイク対策は極めて重要だ。

去年このコンテストがスタートしたとき、ディープフェイク動画のデータベースも登場した。従来は研究者が利用できるディープフェイクの大型データベースがなかった。ある程度のサイズの偽動画のコレクションはいくつかあったが、このデータベースのようにコンピュータビジョンのアルゴリズムを改良するのに役立つような本格的なデータセットはまったく存在しなかった。

Facebookは3500人の俳優にギャラを払って数千のビデオを製作した。それぞれオリジナル版とディープフェイク版が用意された。ディープフェイク以外にも「雑音」として他の手法による改変も行われた。これはアルゴリズムに偽物を見破ろうために決定的な部分、つまり顔にに注意を集中させようとするためだった。

Facebookのコンペには世界中の研究者が参加し、ビデオがディープフェイクかどうかを判断するシステムが何千も提案された。下に6種類のビデオをエンベッドしたが、そのうち3つはディープフェイクだ。どれがそうなのか読者は判別できるだろうか（正解は記事末）？

画像：Facebook

こうしたアルゴリズムの精度は当初は偶然より高くなかった。しかし繰り返巧妙なチューニングを施した結果、フェイクを識別する精度が80%以上に達するまでに改善された。残念ながら、システムの製作者に予め提供されていなかったディープフェイク動画でテストした結果は最高で65%程度にとどまった。

つまりコインを弾いて裏表で判断するよりはましだが、その差はあまり大きくはない。しかしこれは最初から予期されていたことであり、今後の改良を考えれば非常に有望な結果といってよい。人工知能の研究で最も難しいのは、ゼロから何かを生み出す部分だ。その後は猛烈なスピードで改良が進む。ともあれAIで生成されたディープフェイクを判別するという課題がAI自身によって解決可能だということが判明しただけで大きなだ一歩だ。これが実証できた点がFacebookのコンペの最大の成果だろう。

オリジナルと各種の改変を受けたビデオの例（画像： Facebook）

重要な注意点は、Facebookが生成したディープフェイクのセットは単にサイズが大きいだけではなく、さまざまな手法を包括的し、ディープフェイクの最前線を代表するようなものになるよう意図されている点だ。

結局のところ、AIの有効性は入力されるデータ次第だ。AIシステムのバイアスはデータセットのバイアスが原因であることが多い。

シュロープファーCTOは「もしAIのトレーニングセットに現実の人々が遭遇するディープフェイクを代表するようなバリエーションを持っていなければ生成されたモデルも現実のディープフェイクを充分に理解できない。われわれが苦心したのはこのデータセットができるかぎり代表的なものであるようにすることだった」と述べている。

私はシュロープファー氏に「ディープフェイクを判別しにくい顔や状況のタイプがあるか？」と質問したが、この点ははっきりしなかった。この点に関するチームからのコメントは以下のとおりだ。

このチャレンジで利用するためのデータセットを製作するにあたっては自称する年齢、性別、民族等、多数の要因を考慮した。判別テクノロジーはどんな対象であっても有効に機能する必要があるため、データが代表的な例を網羅することが重要だった。

業界の競争を促すため、コンペで優勝したAIモデルはオープンソース化される。Facebook自身も独自のディープフェイク検出システムの構築に取り組んでいるが、シュロープファー氏によれば、これは公開されないだろうという。マルウェア対策同様、この問題は本質的に敵対的だ。「悪い連中」は対策者のシステムから学び、自分たちのアプローチを改良する。つまり何をしているかすべて公開することはディープフェイクを抑止するために逆効果となる可能性がある。

（ディープフェイク画像判定問題の正解：1、4、6は本物。2、3、5がディープフェイク）

画像：Facebook

【Japan編集部追記】上のビデオはダートマス大学で開催されたディープフェイクとメディアについてのフォーラム。右端がTechCruchのDevin Coldeway記者。ビデオでは俳優がオバマ大統領ビデオに合わせてアフレコで別のことを言わせるビデオが紹介されている。

［原文へ］

（翻訳：滑川海彦@Facebook）

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。 TechCrunch Japan の投稿をすべて表示