顔交換も簡単にできる中国のマシン動画生成スタートアップSurrealが創業3カ月で資金調達

もし動画を作るためのカメラが不要になり、数行のコーディングで動画を生成できるようになったとしたらどうだろう?

機械学習の進歩が、そのアイデアを現実のものにしつつある。私たちも、ディープフェイク技術が家族写真で顔を入れ替えたり、自撮りを有名なビデオクリップに変えたりする例を見てきた。現在、AI研究のバックグラウンドを持つ起業家たちが、アルゴリズムを使って超リアルな写真や音声、動画を生成するためのツールを考案している最中だ。

関連記事
MyHeritageが古い家族写真をディープフェイク技術でアニメーション化
口コミで大流行の顔交換ビデオアプリRefaceにa16zなどの有名投資会社が約6億円を出資

こうした技術を開発しているスタートアップの1つが、中国に拠点を置くSurreal(サーリアル)だ。同社は設立からわずか3カ月しか経っていないが、Sequoia ChinaとZhenFundという2つの著名な投資家からすでに、シードラウンドで200万~300万ドル(約2億1000万〜3億2000万円)の資金を調達している。創業者でCEOのXu Zhuo(シュウ・チョウ)氏はTechCrunchに対して、Surrealは今回のラウンドで10件近くの投資オファーを受けたと語っている。

Surrealを創業する前、シュウ氏はSnap(スナップ)に6年間在籍していて、同アプリの広告レコメンデーションシステム、機械学習プラットフォーム、AIカメラ技術の開発に携わっていた。この経験はシュウ氏に、合成メディアが主流になると確信させた。なぜならそのツールは「コンテンツ制作のコストを大幅に下げることができる」からだと、シュウ氏は、深圳(シンセン)にある Surreal社の十数人規模のオフィスで行われたインタビューで語っている。

とはいえ、Surrealには、人間のクリエイターやアーティストを置き換えようという意図はない。実際、シュウ氏は、今後数十年の間に機械が人間の創造性を超えることはないと考えているのだ。この信念を体現しているのが、同社の中国名である「诗云」(シーユン、詩雲)だ。これは、SF作家の劉慈欣(リュウ・ジキン)氏の小説のタイトルから取られたもので、その小説は技術が古代中国の詩人李白に勝てないという物語だ。

「私たちの方程式は『視覚的なストーリーテリングは、創造性プラス制作力に等しい』というものです」とシュウ氏は目を輝かせながら語る。「私たちはその『制作力』の部分に注力しているのです」。

ある意味、マシン動画生成とは、Douyin(抖音、ドウイン、中国版TikTok)やKuaishou(快手、カイショウ)を人気の高いものにしたビデオフィルターを、ステップアップしたような強化版ビデオツールなのだ。既存のショートビデオアプリはプロ並みの動画を作るための障壁を大幅に下げてくれるものの、それでもカメラは必要だ。

「ショートビデオのキモは、決してショートビデオの形式そのものではありません。肝心な点はより良いカメラ技術を手に入れることができるかどうかです。これによってビデオ制作コストが下がります」とシュウ氏は語る。彼はSurrealを、TikTokの親会社ByteDance(バイトダンス)のベテランであるWang Liang(ワン・リエン)氏とともに設立した。

ディープフェイクの商品化

Google(グーグル)、Facebook(フェイスブック)、Tencent(テンセント)、ByteDanceなどの世界最大のテック企業の中にも、GAN(敵対的生成ネットワーク)に取り組んでいる研究チームがある。シュウ氏の戦略は、大型契約へと向かっている重量級のアプリとは直接対決しないことだ。むしろ、Surrealは中小の顧客を狙っている。

eコマース販売者向けのSurrealの顔交換ソフト

Surrealのソフトウェアは現在のところ企業顧客にのみ提供されていて、顧客はアップロードされたコンテンツの顔を変更したり、まったく新しい画像や動画を生成したりするために使用することができる。シュウ氏はSurrealを「動画用Google翻訳」と呼んでいる、なぜならそのソフトウェアは人間の顔を交換するだけでなく、登場人物が話す言語を同時に翻訳し、声と唇を一致させることができるからだ。

ユーザーは動画や画像ごとに課金される。今後、Surrealは顔だけでなく、人の服や動きをアニメーション化することも目指している。Surrealは財務状況の公表を拒んだが、シュウ氏によれば、同社は約1000万件の写真と動画の注文を受け付けたという。

現在、多くの需要があるのは、中国のeコマース輸出企業だ。彼らはマーケティング素材に西洋人のモデルを登場させるためにSurrealを使っている。本物の外国人モデルを雇うのはコストがかかるが、アジア人モデルを採用しても効果があるかどうかはわからない。Surrealの「モデル」を使用することで、一部の顧客は2倍の投資収益率(ROI)を達成することができたとシュウ氏はいう。数百万ドル(数億円)のシード資金を手にした Surreal は、アルゴリズムの改善のために大量のデータを収集できるように、オンライン教育などのより多くのユースケースを模索することを計画している。

未知の領域

Surrealを支えている技術は、敵対的生成ネットワーク(GAN)と呼ばれる比較的新しい技術だ。機械学習研究者の Ian Goodfellow(イアン・グッドフェロー)氏が2014年に発表したGANは、画像を生成する「ジェネレーター」と、画像が偽物(フェイク)か本物(リアル)かを判別する「ディスクリミネーター」のペアで構成されている。このペアは、ジェネレーターが満足のいく結果を出せるようになるまで、敵対的な役割として訓練を行う。

GANが悪意ある者の手に渡った場合には、詐欺やポルノなどの違法行為に利用される可能性がある。Surrealが個人ユーザーの利用ではなく、エンタープライズでの利用から始めている理由の一部はその点にある。

Surrealのような企業はまた、新たな法的課題を提起している。機械が生成した画像や動画の所有者は誰なのだろう?著作権を侵害しないようにするために、Surrealでは顧客に対して、アップロードするコンテンツに対して権利を持つことを求めている。誤用を追跡し防止するために、Surrealは生成したコンテンツの各部に暗号化された目に見えない透かしを追加し、所有権を主張する。Surreal が作成した「人物」がたまたま実在の人物と一致する可能性もあるため、同社は生成したすべての顔とオンラインで見つけた写真を照合するためのアルゴリズムを実行している。

「倫理問題に対してはSurreal自身が解決することはできないと思っていますが、私たちはこの問題を探求していきたいと思っています」とシュウ氏は語っている。「根本的に、(合成メディアは)ディスラプティブなインフラを提供すると思っています。それは生産性を高めます。生産性がこのような応用にとっての重要な決定要因となっているのですから、マクロレベルでは避けて通ることはできません」。

カテゴリー:人工知能・AI
タグ:SurrealGAN中国機械学習資金調達ディープフェイク

画像クレジット:Surreal

原文へ

(文:Rita Liao、翻訳:sako)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。