一般に「ディープフェイク」と呼ばれるディープラーニングを利用してデジタル画像、動画を捏造するテクノロジーは我々の社会に対しすでに深刻な脅威となっている。こうした捏造を退治するためには我々自身が捏造を見破る能力を保たねばならない。火をもって火と戦うというわけだ。
Facebook(フェイスブック)、Microsoft(マイクロソフト)などのトップテクノロジー企業は共同で、デープフェイクを識別する機械学習システムを開発中だ。こうした努力の一環としてFacebookが興味深いプロジェクトを立ち上げた。
ディープフェイクは比較的新しいテクノロジーだが、我々はすでに捏造力と識別力の軍拡競争に投げ込まれている。毎日新たな、ますます真に迫ったディープフェイクが登場している。大部分は無害なものだが、誰かの映像を細工して極めて不都合な場面を捏造することが可能だ。そしてリベンジポルノのように悪用するものがいる。政治家、俳優を含めて多くの著名人がすでにディープフェイクの被害にあっている。
FacebookはMicrosoft、オックスフォード大学、カリフォルニア大学バークレー校、マサチューセッツ工科大学などで構成されるAIパートナーシップに参加している。Facebookはその一環としてディープフェイク識別テクノロジーの改善のために大型プロジェクトを立ち上げた。Facebookの最高技術責任者であるMike Schroepfer(マイク・シュレーファー)氏は米国時間9月4日の電話記者会見で次のように述べた。
最近のAIテクノロジーの進歩に関連して興味ある点はAIの達成レベルを計測するためにベンチマークとなるデータセットが用意されるようになったことだ。画像認識テクノロジーをテストするためには数百万件の画像のセットが用意され、音声テキスト化のためにも異なった音声のサンプルが何時間分もデータセットとして利用できる。しかしディープフェイク識別の場合はそのようなデータセットが存在しない。
今年初めに開催されたロボティクスとAIについてのTechchCrunchセッションで我々はすでにこの問題を取り上げている。下のビデオでは私(Coldeway)がバークレーのAlexei Efros(アレクセイ・エフロス)教授、ダートマスのHany Farid(ハニー・ファリド)教授にインタビューしている。
ビデオの冒頭でディープフェイクのサンプルとしてバラク・オバマ大統領のビデオを加工して「言っていないことを言わせる」ビデオが流される。ディープフェイクが民主主義に与える脅威が容易に想像できるだろう。
こうした脅威に対抗するため、Facebookは1000万ドルのリソースを投入してディープフェイク識別コンテストを開催する。FacebookはAIパートナーシップのメンバーと協力してまず大量のディープフェイクのサンプルを作ることにしたという。上の電話記者会見でSchroepfer氏は次のようにその背景を説明した。
ディープフェイクを識別するためのベンチマークとなるデータベースを作るのは非常に困難な事業となる。その理由のひとつはディープフェイクのターゲットなった人物がデータベース化に同意している必要があるからだ。そうでないとベンチマークに使われたことに抗議される可能性がある。現実にインターネットに拡散されたディープフェイクの場合、被害者になんらの同意も求めていないのが普通だ。このため少なくともアカデミックな研究に用いることはできない。
まず必要になるのはディープフェイクのソースとなるビデオ素材だ。次にその画像に重ねる人物の各種の特徴を記録したデータでベースだ。そこからディープフェイクの実行となる。ここでは最新、最強のディープフェイク技術をして現実には存在しなかったビデオや音声を作り上げる。
ではFacebookはその素材をどこから入手するのかと疑問を持つ読者も多いだろうが、安心していい。素材には報酬を支払ってプロの俳優を起用している。
ディープフェイクのデータセットはディープフェイク識別テクノロジーを進歩させる能力、意思のあるグループに提供される。結果はリーダーボード形式で共有される。識別力に応じて賞金が提供されるというが、詳細はまだ発表されていない。賞金の額によっては大学や各種組織の研究者の間に健全な競争を巻き起こすかもしれない。
メリーランド大学のRama Chellappa(ラマ・チェラッパ)教授はプレスリリースでこう述べている。
マルチメディアの捏造という深刻な脅威に対抗し識別力を高めるためには研究者コミュニティの全面的な協力が必須だ。ディープフェイクについての知見を深め発見のためのシステムを構築するためのオープンな環境とシステムが求められる。特に必要なのは現実の素材とそれを加工した素材の大規模なコーパスだ。(Facebookから)発表されたチャレンジは研究者コミュニティにエキサイティングな刺激を与え、一丸となってこの脅威に立ち向かうきっかけを与えるに違いない。
ディープフェイク識別のためのデータセットは、まず10月に予定されているコンピュータビジョンに関するカンファレンス、ICCV(International Conference on Computer Vision)で発表される。さらに12月に予定されているニューラル・コンピューティングのカンファレンス、NeurIPSでさらに詳しい発表があるはずだ。
[原文へ]
(翻訳:滑川海彦@Facebook)