実在しているような合成アバターがしゃべるプレゼン動画を簡単に作れるSynthesiaの技術

AIを利用して合成ビデオを作成するスタートアップ企業のSynthesia(シンセシア)は、不気味さとすばらしさの微妙な境界線をうまく渡り歩いている。

同社は米国時間12月8日、Kleiner Perkins(クライナー・パーキンス)が主導するシリーズBラウンドを5000万ドル(約56億8000万円)でクローズしたと発表した。このラウンドには、GVおよび既存投資家のFirstmark Capital(ファーストマーク・キャピタル)、LDV Capital(LDVキャピタル)、Seedcamp(シードキャンプ)、MMC Ventures(MMCベンチャーズ)も参加した。

Synthesiaは、単なるテキストやスライドを使ったプレゼンテーションを、しゃべるアバター付きのビデオに変えることができる。ユーザーは俳優の演技から作られたすでに用意されているアバターを利用することもできるし、動画をアップロードして数分で自分自身のアバターを作ることもできる。また、ユーザーは録音した自分の声をアップロードすることもでき、その声を使って何でも言えるように変換させることができる。

このスタートアップ企業は、インターネット上の強力なツールのほとんどが悪用可能であるという事実を認識しているので、誰でもこのプラットフォームを利用できるようにするのではなく、企業顧客のみに限定している。同社の顧客は、主にトレーニング用ビデオにこのツールを使用しているというが、その他にもチームへの月例報告や、通常は電子メールで送られてくる情報の配信などにSynthesiaを使っているという。

おもしろいことに、創業者のVictor Riparbelli(ビクター・リパルベリ)氏は、ユーザーの行動は必ずしも当初の予想とは一致しなかったと述べている。ビデオ制作部門で多く利用されるというよりも、むしろ組織内の他の部門の人々がこのツールのパワーユーザーになっているのだ。

「Synthesiaを導入する以前は、PowerPoint(パワーポイント)でスライドデッキを作成したり、Word(ワード)で文書を書いたりしていた人が、今では実際に、動画コンテンツを制作することができるようになっています」と、リパルベリ氏はいう。「これこそが、AIの観点から私たちを急速に成長させている重要な点ではないかと思います」。

4月に1250万ドル(約14億2000万円)のシリーズA資金調達を実施して以来、Synthesiaはユーザーが独自のアニメーション話者の作成をさらに容易にする機能を追加しており、現在は1000種類のカスタムアバターがこのプラットフォーム上で使われている。リパルベリ氏は、顧客の一例としてErnst & Young(アーンスト・アンド・ヤング)を挙げた。この企業では、35人のパートナーがそれぞれのアバターを持ち、社内コミュニケーションと顧客とのコミュニケーションの両方に向けてビデオを作成しているという。

この「誰でもビデオを作ることができる」というコンセプトは、Canva(キャンバ)に似た雰囲気を強く感じさせる。評価額が400億ドル(約4兆5000億円)を超えたオーストラリアのスタートアップ企業であるCanvaは、デザイン部門以外の組織に、何でもデザインできる能力を解放した後、ロケットのように急成長した。Canvaは最近、独自のビデオ製品も発表しており、既存のデザインやスライドデッキをアニメーション化し、生き生きとしたビデオに変えることに力を入れている。

Synthesiaはさらに一歩進んで、無名の俳優や自分の会社のCEOなど、まるで実在の人物のように見えるアバターを使ったビデオを作成することができる。

このような難問に取り組んでいる企業はSynthesiaだけではない。イスラエルのD-IDという会社は、Disrupt 2021(ディスラプト2021)で実際にデモを行い、人物の静止画を動画コンテンツに変換する方法を披露した。

つまり、いくつかの意味で競争が始まっているのだ。AIやアバターを使って動画作成を容易にしようとする企業は、リアリティを高めたり、感情表現に順応性を持たせるといったことで競うだけでなく、ユーザーの安全性や自社プラットフォームの信頼性を確保することにも力を入れなければならない。

この種のツールが、多くの人々に誤解を与えたり、危害を加えたりするために使われる可能性があることは明白であり、このようなツールを作成する企業は、それが公正に使用されるということを保証する責任がある。

Synthesiaでは、明確な同意なしに誰かを合成することはないと明言している。また、この技術には同社が完全にコントロールしているオンレール体験を通してのみアクセスできる。

それはともかく、近い将来、あなたの部署の責任者やCEOのように見えるけれど実際は本人が出演していないビデオを見ても驚いてはいけない、ということだ。

画像クレジット:Synthesia

原文へ

(文:Jordan Crook、翻訳:Hirokazu Kusakabe)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。