D-IDが写真を独自のフォトリアルな動画に変換する「Speaking Portrait」の提供を開始

古い家族写真を生き生きとした動きのある肖像画に変えた、 センセーショナルなMyHeritage(マイヘリテージ)アプリへの技術提供を行った会社が、新しい応用を引っさげて再登場した。静止画を超リアルな動画に変換し、好きなことをしゃべらせることができるようにする技術だ。

D-ID(ディーアイディー)のSpeaking Portraits(スピーキング・ポートレイト)は、ここ数年話題になっていた悪名高い「ディープフェイク」に似ているようにみえるかもしれないが、基盤技術はまったく異なっており、基本的な機能の提供のためのトレーニングは不要だ。

関連記事:MyHeritageが古い家族写真をディープフェイク技術でアニメーション化

かつて2018年のTechCrunch Battlefieldではまったく異なる技術(顔認識技術への対抗技術)でデビューしたD-IDが、今回のTechCrunch Disrupt 2021では新しいSpeaking Portraits製品をライブで披露した。同社はこの技術を使って、さまざまな感情を表現できる多言語テレビキャスターの作成、カスタマーサポート用のバーチャルチャットボットのペルソナ作成、プロフェッショナル育成用のトレーニングコースの開発、インタラクティブな会話型ビデオ広告キオスクの作成など、さまざまなユースケースを紹介した。

この新製品やMyHeritageとの提携は、明らかにD-IDの当初の方向性からは大きく異なっている(MyHeritageのアプリは一時的にAppleのApp Storeのチャートでトップになった)。2020年の5月頃までは、D-IDは従来のやりかたで資金調達を行っていたが、2021年の2月にはMyHeritageとの提携を開始し、その後GoodTrust(グッドトラスト)との提携を経て、Hugh Jackman(ヒュー・ジャックマン)監督の映画「Reminiscence(レミニセンス)」では、ワーナー・ブラザースとの提携により、ファンが予告編に自分の姿を入れることができるようになるといった派手な展開を見せた。

こうしたD-IDの方向転換はこれ以上なく劇的なものに見えるかもしれない、しかし技術的な観点から見ると、写真に命を吹き込むことに焦点を当てた新しい方向性は、同社がもともと開発してきた画像匿名化(de-identification)ソフトウェアとそれほど大きな違いはない。D-IDのCEOで共同創業者であるGil Perry(ギル・ペリー)氏は、この種のアプリケーションに関して、アプローチ可能な非常に大きな市場があることが明らかになったので、新しい方向性を選択したと話している。

関連記事:動画中の顔をぼかして本人同定を不可能にするプライバシー技術のD-IDが14.5億円を調達

ワーナー・ブラザースのようなビッグネームのクライアントや、比較的無名のブランドからApp Storeを席巻するアプリが出たことは、この評価を裏づけるものと言えそうだ。だがSpeaking Portraitsが狙うのは、さまざまな規模のクライアントだ。誰もがソース画像からフルHDビデオを作成し、録音された音声や、字幕を加えることができる。D-IDは英語、スペイン語、日本語に対応した製品をローンチするが、将来的には顧客の要望に応じて他の言語も追加していく予定だ。

Speaking Portraitsでは2種類の基本カテゴリーが提供される。そのうちの1つである「Single Portrait」(シングルポートレート)オプションは、頭は動くが他の部分は動かない映像を1枚の写真だけで作ることができる。こちらは、既存の背景を使っても動作する。

さらなるリアリティを追求したい場合には「Trained Character(トレインド・キャラクター)」というオプションがある。このオプションでは、希望するキャラクターの10分間のトレーニングビデオを、同社のガイドラインに沿って提出する必要がある。これには、独自の交換可能な背景を使うことができるという利点があり、キャラクターの体や手にいくつかのプリセットされた動作を加えるオプションもある。

Trained Characterを用いて作成されたSpeaking Portraitニュースキャスターの例を以下に示すので、そのリアルさがどのようなものかを見て欲しい。

今回のDisruptでペリー氏がライブで見せてくれたデモは、子どもの頃の自分の静止画から作られたものだった。この写真は、人形遣い役の人物が演じる顔の表情にマッピングされている。またこの人形遣い役は、ギル氏が現在の自分と若い自分が交わす対話の中で、Speaking Portrait版が話すスクリプトの声も担当していた。話し手の表情がどのようにアニメーションとして反映されるかは以下の動画でみることができる。

もちろん、たった1枚の写真から、どんなセリフも説得力を持って伝えることができるフォトリアリスティックな動画を作ることができるということは、ちょっと身の毛もよだつような話であることはいうまでもない。すでに、ディープフェイクの倫理性についてさまざまな議論が交わされているなかで、AIが現実的ではあるが人工的な結果を生み出した場合に、それを特定できるようにしようとする業界の取り組みも見られる。

Disruptでペリー氏は、D-IDは「この技術が悪いことではなく、良いことに使われるようにしたいと熱望しています」と述べ、その実現に向けて10月末にはパートナー企業とともに、Speaking Portraitsのような技術を使用する際の「透明性と同意」へのコミットメントをまとめた誓約書を発行する予定だと述べた。このコミットメントの目的は「ユーザーが自分の見ているものについて混乱することなく、同意を行う機会が与えられること」を保証することだ。

D-IDは、この種の技術の悪用について、利用規約や公式見解で保証したいと考えているが、ペリー氏はそれを「単独ではできない」という。同じエコシステムの他の企業にも、悪用を避けるための努力に参加するよう呼びかけているのはそれが理由だ。

画像クレジット:D-ID

原文へ

(文:Darrell Etherington、翻訳:sako)

TikTokが米国ユーザーの「顔写真や声紋」を含む生体情報の収集を表明

米国時間6月2日水曜日に発表されたTikTok(ティックトック)の米国におけるプライバシーポリシーの変更では、同社のソーシャルビデオアプリがユーザーのコンテンツから「生体識別子および生体情報を収集する場合がある」という項目が新たに追加された。これには「フェイスプリント(顔写真)やボイスプリント(声紋)」などが含まれると説明されている。TikTokにコメントを求めたところ、製品開発におけるどのような理由でユーザーから自動的に収集する情報に生体情報を加える必要が生じたのかは確認できなかった。しかし、そういったデータ収集活動を始める場合には、ユーザーに同意を求めると述べている。

生体情報収集の詳細については、同ポリシーの「自動的に収集する情報」の下に新たに追加された「画像および音声情報」セクションの項目として記述されている。

これは、TikTokのプライバシーポリシーの中で、アプリがユーザーから収集するデータの種類を列挙している部分であり、すでにかなり広範囲にわたっている。

新しいセクションの最初の部分では、TikTokがユーザーのコンテンツに含まれる画像や音声に関する情報を収集する場合があるとし「ユーザーコンテンツに含まれる物体や風景の識別、顔や体の特徴と属性の画像内の有無や位置、音声の特徴、テキスト化した会話内容など」と説明している。

気味が悪いと思うかもしれないが、他のソーシャルネットワークでは、アクセシビリティ(例えば、Instagramの写真の中に何が写っているかを説明する機能)の強化やターゲティング広告のために、アップロードされた画像の物体認識を行っている。また、AR(拡張現実)効果の演出のためには、人物や風景の位置を認識する必要があり、TikTokの自動キャプションは話し言葉をテキスト化することで実現している。

関連記事:TikTokが耳が悪い人のための自動キャプション機能導入、まずは英語と日本語で

また、このポリシーでは、新たなデータ収集は「映像の特殊効果、コンテンツモデレーション、人口統計学的分類、コンテンツや広告のリコメンデーション、個人を特定しないその他の処理」を可能にするためとも述べている。

新しい項目の中でも特に気になるのは、生体情報の収集計画の部分だ。

そこには次のように書かれている。

当社は、お客様のユーザーコンテンツから、フェイスプリントやボイスプリントなど、米国の法律で定義されている生体識別子および生体情報を収集することがあります。法律で要求される場合、当社は、そのような収集を行う前に、お客様に必要な許可を求めます。

この声明自体は、連邦法、州法、またはその両方を対象としているのかどうかを明確にしていないため、曖昧なものとなっている。また、他の項目と同様に、TikTokがなぜこのデータを必要とするのか説明しておらず「フェイスプリント」や「ボイスプリント」という言葉の定義さえもない。加えて、どのようにしてユーザーから「必要な許可」を得るのか、同意を得るプロセスは州法や連邦法を参考にするのかについても言及はない。

これは憂慮すべきことだ。というのも、現在のところ、生体認証情報プライバシー法を制定しているのはイリノイ州、ワシントン州、カリフォルニア州、テキサス州、ニューヨーク州など、ほんのひと握りの州にすぎないからだ。TikTokが「法律で要求される場合」にのみ同意を求めるのであれば、他の州のユーザーはデータ収集について知らされる必要がないということになりかねない。

TikTokの広報担当者は、生体情報の収集における同社の計画や、現在または将来の製品にどのように関わるかについて、詳細は明らかにしていない。

「透明性に対する継続的なコミットメントの一環として、当社が収集する可能性のある情報をより明確にするために、今回プライバシーポリシーを更新した」と同担当者は述べる。

そして、同社のデータセキュリティへの取り組みに関する記事、最新の透明性レポート、アプリ上でのプライバシーの選択についての理解を深めることを目的として最近立ち上げたプライバシーとセキュリティのページを紹介した。

画像クレジット:NOAH SEELAM/AFP via Getty Images

今回の生体情報に関する開示は、TikTokが一部の米国ユーザーの信頼回復に取り組んでいる時期と重なる。

Trump(トランプ)政権時、連邦政府は、TikTokが中国企業に所有されていることから国家安全保障上の脅威であるとして、米国内での運営を全面的に禁止しようとした。TikTokは、この禁止令への対抗として、TikTokの米国ユーザーのデータは、米国内のデータセンターとシンガポールにのみ保存していることを公表した。

関連記事
TikTokは来たるべき禁止令をめぐって米国政府を提訴する
TikTokがトランプ大統領に抵抗、禁止命令に対して差止めを申し立て

同社はまた、北京を拠点とするByteDance(バイトダンス)が所有しているにもかかわらず、TikTokのユーザーデータを中国政府と共有したことも、コンテンツを検閲したこともないと述べている。また、頼まれても絶対にしないとしている。

TikTokの禁止令は当初、裁判所で却下されたものの、連邦政府はその判決を不服として控訴した。しかし、Biden(バイデン)大統領が就任すると、同政権はトランプ政権の措置を再検討するため、控訴プロセスを保留した。そして、6月4日現在、バイデン大統領は、監視技術に関連する中国企業への米国の投資を制限する大統領令に署名しているが、同政権のTikTokに対する立場は不明のままだ。

関連記事
トランプ政権のTikTok禁止措置に対する米連邦判事の2度目の判決、米政府の制限一時差し止め
TikTok米国事業のオラクルへの強制売却が棚上げ

しかし、今回の生体情報収集に関する新たな開示は、ソーシャルメディアアプリがイリノイ州の生体認証情報プライバシー法に違反したとして、2020年5月に提起されたTikTokに対する集団訴訟における9200万ドル(約100億円)の和解を受けたものであることは注目に値する。この集団訴訟は、TikTokがユーザーの同意なしに個人情報や生体情報を収集・共有したことをめぐる、同社に対する20件以上の個別訴訟とも併合されていた。具体的には、特殊効果を狙ったフェイスフィルター技術への使用に関するものだ。

そういった状況のため、TikTokの法務部門は、アプリによる個人の生体情報収集に係る条項を追加することで、将来の訴訟に対する予防策を手早く講じたかったのかもしれない。

今回の開示は、米国向けのプライバシーポリシーにのみ追加されたものだ。EUなど他の市場では、より厳しいデータ保護法やプライバシー保護法があることも忘れてはならない。

この新しいセクションは、TikTokのプライバシーポリシーの広範な更新の一部であり、他にも旧版のタイプミスの修正から、セクションの改訂や新規追加まで、大小さまざまな変更が加えられている。しかし、これらの調整や変更のほとんどは、簡単に説明できる。例えば、TikTokのeコマースへの意欲を明確に示す新しいセクションや、ターゲティング広告に関するApple(アップル)の「App Tracking Transparency(アプリのトラッキングの透明性)」に対応する調整などが挙げられる。

関連記事:ついにアップルが導入開始した「アプリのトラッキングの透明性」について知っておくべきこと

大局的に見れば、TikTokは、たとえ生体情報がなくても、ユーザーやコンテンツ、デバイスに関するデータをふんだんに持っている。

例えば、TikTokのポリシーには、ユーザーのデバイスに関する情報を自動的に収集するとすでに記載されている。その情報には、SIMカード・IPアドレス・GPSに基づく位置データ、TikTok自体の利用状況、ユーザーが作成・アップロードしたすべてのコンテンツ、アプリから送信したメッセージのデータ、アップロードしたコンテンツのメタデータ、クッキー、デバイス上のアプリやファイル名、バッテリーの状態、さらにはキーストロークのパターンやリズムなどが含まれている。

これは、ユーザーが登録したり、TikTokに連絡したり、コンテンツをアップロードしたりしたときに送られる「ユーザーが提供することを選択した情報」とは別だ。この場合、TikTokは、ユーザーの登録情報(ユーザー名、年齢、言語など)、プロフィール情報(名前、写真、ソーシャルメディアアカウント)、プラットフォーム上でユーザーが作成したすべてのコンテンツ、電話やソーシャルネットワークの連絡先、支払い情報、加えてデバイスのクリップボードにあるテキスト、画像、動画を収集する(Apple iOS 14の警告機能により、TikTokや他のアプリがiOSのクリップボードのコンテンツにアクセスしていることが発覚したことはご記憶にあるだろう。今回のポリシーでは、TikTokは「ユーザーの許可を得て」クリップボードのデータを「収集する場合がある」としている)。

プライバシーポリシーの内容自体は、一部のTikTokユーザーにとっては、すぐに気がかりになるものではなく、むしろ、バグだらけのロールアウトに関心が集まった。

一部のユーザーは、プライバシーポリシーの更新を知らせるポップアップメッセージが表示されたものの、そのページを読もうとしても読めなかったと報告している。また、ポップアップが繰り返し表示されるという報告もあった。この問題は全ユーザーに共通ではないようだ。TechCrunchによるテストでは、このポップアップに関する問題は発生しなかった。

【追加レポート】Zack Whittaker(ザック・ウィッタカー)

カテゴリー:ネットサービス
タグ:TikTok生体情報アメリカSNS個人情報プライバシーフェイスプリントボイスプリント透明性中国

画像クレジット:SOPA Images / Getty Images

原文へ

(文:Sarah Perez、翻訳:Dragonfly)