MyHeritageはディープフェイク技で古い家族写真をアニメーションさせる

家系図サービスのMyHeritage(マイヘリテージ)は、本物らしい表情の操作や利用者の個人データ収集に、AI駆動の合成メディアを使い始めている。同社は、Deep Nostalgia(ディープ・ノスタルジア)という新機能をローンチした。人の写真をアップロードすると、アルゴリズムによってその顔をアニメーション化してくれるというものだ。

亡くなって久しい親戚や過去の偉人が合成近似化処理によって生き返り、どうしてこんな役立たずのデジタルフォトフレームの中に閉じ込められているのだと、目を動かし顔を傾ける様子には、ドラマ『ブラック・ミラー』ばりの引きがあるが、昨日(米国時間2月26日)に家族歴に関するカンファレンスで公開されると、当然のことながらソーシャルメディアで拡散された。

Dr Adam Rutherford「甦ったロザリンド・フランクリン」

Nathan Dylan Goodwin「MyHeritageのDeep Nostalgiaで動く曾祖母ルイザ・ロークス(1871〜1942)」

Mike Quackenbush「曾祖母のキャサリン。私が2歳のときに亡くなったがずっと身近に感じてきた。Deep Nostalgiaで祖母が動くのを見て私の目に涙が溢れた。この写真撮影のためにポーズをとっているように見える。すごい!」

このディープフェイク的なMyHeritageのバーチャルマーケティングのシナリオは、難しいものではない。人々の琴線に触れて、個人情報を取得し、有料サービスへの契約につなげようというものだ(同社の主軸事業はDNA検査の販売)。
MyHeritageのサイトではDeep Nostalgiaを無料で試せるが、少なくとも電子メールを1回送り(当然、動かしたい写真を添付して送らないといけない)、利用規約とプライバシーに関するポリシーに同意する必要がある。だがそのどちらも、長年にわたり数々の問題を起こしてきた。

たとえば昨年、ノルウェーの消費者委員会は、国家消費者保護庁とデータ規制当局に対して、MyHeritageの利用規約を法的に審査したところ、同社が消費者に署名を求めている内容が「理解不能」と判断されたことを報告している。

また2018年には、MyHeritageは大量のデータ漏洩を引き起こしている。後に、漏洩したデータは、アカウントのハッキングによって引き出された大量のキャッシュ情報と共に、ダークウェブで売買されていたことも判明している。

今週初めにTechCrunchでもお伝えしたとおり、同社はアメリカの非公開企業に最大6億ドル(約640億円)で買収されようとしているが、個人データの引き渡しと利用規約への同意に不安を抱える人たちを、その故人を懐かしむ気持ちで惹きつけ安心させる狙いがあることは間違いない。

亡くなって久しい故人を不気味の谷に誘い込むよう人々に促し、それをDNA検査の抱き合わせ販売(この手の個人情報を一民間企業の保管に任せることにはプライバシー上の大きな問題をはらんでいるが)に利用するという倫理的な問題はさておき、同社の顔のアニメーション化技術には目を見張るものがある。

私の曾祖母の好奇心に溢れる表情を見るにつけ、これをどう思うだろうかと想像せずにはいられない。

顔のアニメーション機能には、TechCrunch Disruptのバトルフィールドにも参加したイスラエルのD-IDという企業の技術が使われている。この企業はそもそも、顔認証アルゴリズムで個人が特定されないようする保護画像を念頭に、顔のデジタル匿名化技術の開発からスタートしている。

彼らは昨年、写真をアニメーション化する新技術のデモ動画を発表した。この技術は「ドライバービデオ」を使って写真を動かすようになっている。写真の顔の特徴を「ドライバー」、つまりモデルになる顔の動画にマッピングすることで、D-IDがLive Portraite (生きたポートレート)と呼ぶ映像が作り出される。

「Live Portraitソリューションは、静止画に命を吹き込みます。写真はドライバー動画にマッピングすることでアニメーション化され、ドライバー動画の動きに沿って、対象画像の頭の動きや表情が動きます」とD-IDはプレスリリースで説明している。「この技術には、歴史教育機関、博物館、教育プログラムなどで著名な人物をアニメーションさせるといった利用法が考えられます」

同社はLive Portraitを、多目的なAI Face(エーアイ・フェイス)プラットフォームで提供している。第三者がアクセスでき、深層学習、コンピュータービジョン、画像処理などの技術が利用できるというものだ。D-IDではこのプラットフォームを、合成動画制作の「ワンストップ・ショップ」と称している。

その他、動画の中の人物の顔を他人の顔と入れ替える「顔匿名化機能」(ドキュメンタリー制作で内部告発者の身元を隠すときなどに使える)や「トーキングヘッズ」機能などもある。これはリップシンクを行うためのものだが、ギャラが発生する役者の動画を拝借して、口の動きをぴったり合わせて宣伝文句を言わせるといったことも可能になる。

合成メディアが奇妙な時代を招くるのは、避けられそうにない。

関連記事:Sentinelがディープフェイク検出の戦いに約1.4億円を投じる

画像クレジット:Screengrab: Natasha Lomas/TechCrunch

[原文へ]
(文:Natasha Lomas、翻訳:金井哲夫)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。