実在しているような合成アバターがしゃべるプレゼン動画を簡単に作れるSynthesiaの技術

AIを利用して合成ビデオを作成するスタートアップ企業のSynthesia(シンセシア)は、不気味さとすばらしさの微妙な境界線をうまく渡り歩いている。

同社は米国時間12月8日、Kleiner Perkins(クライナー・パーキンス)が主導するシリーズBラウンドを5000万ドル(約56億8000万円)でクローズしたと発表した。このラウンドには、GVおよび既存投資家のFirstmark Capital(ファーストマーク・キャピタル)、LDV Capital(LDVキャピタル)、Seedcamp(シードキャンプ)、MMC Ventures(MMCベンチャーズ)も参加した。

Synthesiaは、単なるテキストやスライドを使ったプレゼンテーションを、しゃべるアバター付きのビデオに変えることができる。ユーザーは俳優の演技から作られたすでに用意されているアバターを利用することもできるし、動画をアップロードして数分で自分自身のアバターを作ることもできる。また、ユーザーは録音した自分の声をアップロードすることもでき、その声を使って何でも言えるように変換させることができる。

このスタートアップ企業は、インターネット上の強力なツールのほとんどが悪用可能であるという事実を認識しているので、誰でもこのプラットフォームを利用できるようにするのではなく、企業顧客のみに限定している。同社の顧客は、主にトレーニング用ビデオにこのツールを使用しているというが、その他にもチームへの月例報告や、通常は電子メールで送られてくる情報の配信などにSynthesiaを使っているという。

おもしろいことに、創業者のVictor Riparbelli(ビクター・リパルベリ)氏は、ユーザーの行動は必ずしも当初の予想とは一致しなかったと述べている。ビデオ制作部門で多く利用されるというよりも、むしろ組織内の他の部門の人々がこのツールのパワーユーザーになっているのだ。

「Synthesiaを導入する以前は、PowerPoint(パワーポイント)でスライドデッキを作成したり、Word(ワード)で文書を書いたりしていた人が、今では実際に、動画コンテンツを制作することができるようになっています」と、リパルベリ氏はいう。「これこそが、AIの観点から私たちを急速に成長させている重要な点ではないかと思います」。

4月に1250万ドル(約14億2000万円)のシリーズA資金調達を実施して以来、Synthesiaはユーザーが独自のアニメーション話者の作成をさらに容易にする機能を追加しており、現在は1000種類のカスタムアバターがこのプラットフォーム上で使われている。リパルベリ氏は、顧客の一例としてErnst & Young(アーンスト・アンド・ヤング)を挙げた。この企業では、35人のパートナーがそれぞれのアバターを持ち、社内コミュニケーションと顧客とのコミュニケーションの両方に向けてビデオを作成しているという。

この「誰でもビデオを作ることができる」というコンセプトは、Canva(キャンバ)に似た雰囲気を強く感じさせる。評価額が400億ドル(約4兆5000億円)を超えたオーストラリアのスタートアップ企業であるCanvaは、デザイン部門以外の組織に、何でもデザインできる能力を解放した後、ロケットのように急成長した。Canvaは最近、独自のビデオ製品も発表しており、既存のデザインやスライドデッキをアニメーション化し、生き生きとしたビデオに変えることに力を入れている。

Synthesiaはさらに一歩進んで、無名の俳優や自分の会社のCEOなど、まるで実在の人物のように見えるアバターを使ったビデオを作成することができる。

このような難問に取り組んでいる企業はSynthesiaだけではない。イスラエルのD-IDという会社は、Disrupt 2021(ディスラプト2021)で実際にデモを行い、人物の静止画を動画コンテンツに変換する方法を披露した。

つまり、いくつかの意味で競争が始まっているのだ。AIやアバターを使って動画作成を容易にしようとする企業は、リアリティを高めたり、感情表現に順応性を持たせるといったことで競うだけでなく、ユーザーの安全性や自社プラットフォームの信頼性を確保することにも力を入れなければならない。

この種のツールが、多くの人々に誤解を与えたり、危害を加えたりするために使われる可能性があることは明白であり、このようなツールを作成する企業は、それが公正に使用されるということを保証する責任がある。

Synthesiaでは、明確な同意なしに誰かを合成することはないと明言している。また、この技術には同社が完全にコントロールしているオンレール体験を通してのみアクセスできる。

それはともかく、近い将来、あなたの部署の責任者やCEOのように見えるけれど実際は本人が出演していないビデオを見ても驚いてはいけない、ということだ。

画像クレジット:Synthesia

原文へ

(文:Jordan Crook、翻訳:Hirokazu Kusakabe)

組織や企業の教育コンテンツに特化したAIビデオ生成プラットフォームSynthesiaが13.5億円調達

Alが進歩し、テクノロジーを活用して私たちにできることは急激に増えている(良くも悪くも)。Alビデオ生成プラットフォームのSynthesiaは、動画コンテンツ制作をできるだけシンプルに効率良くすることを目指している。そしてFirstMark Capitalは、Synthesiaが世の中を悪くするのではなく良くすることに賭けている。

SynthesiaはFirstMark Capitalが主導したシリーズAを1250万ドル(約13億5000万円)で完了したと発表した。このラウンドにはNetlifyのCEOであるChristian Bach(クリスチャン・バッハ)氏やTwilioのVPでコミュニケーション担当のMichael Buckley(マイケル・バックリー)氏といったエンジェル投資家、そしてこれまでにも投資してきたLDV CapitalMMC VenturesSeedcamp、Mark Cuban(マーク・キューバン)氏、Taavet Hinrikus(ターベット・ヒンリクス)氏、Martin Varsavsky(マーティン・バルサフスキー)氏、TinyVCも参加した。

Synthesiaのテクノロジーには多くの使い道があるが、同社は今のところ組織や企業の教育コンテンツに特化している。トレーニングビデオや、企業や部署の最新情報を伝えるビデオを制作するようなケースだ。

使い方はこんな感じだ。ユーザーは、用意されている俳優から登場人物を選んだり(俳優には登場するビデオに応じてギャラが支払われる)、自身のビデオをアップロードしてアバターを作ったりする。ユーザー自身の声やアバターを使うにはどのようなビデオやオーディオを送信すればいいか、ユーザーに対して手順が示される。

その後、ユーザーは台本を入力し、テキストや画像、図形などのコンポーネントを追加する。すると最終的にはビデオ制作や編集のスキルをまったく使わずに、ビデオが生成される。ビデオのアップデートや編集も従来のようなビデオ編集の作業をする必要はなく、とても簡単だ。

Synthesiaはこのプラットフォームが悪用されかねないことを十分に承知した上で、セキュリティと認証のレイヤーを複数組み込み、自分のアバターがビデオ内でどのように使われるのかをユーザーが確認し、生成や公開の前に台本やビデオをチェックできるようにしている。

このプラットフォームは企業が毎年提供するトレーニングや教育用のビデオに使うだけでなく、もっとクリエイティブな用途で使うこともできる。一般に、ビデオコンテンツはテキストやその他のコンテンツよりも説得力と魅力がある。そこで、上司やCEOから最新情報を知らせる毎週のメールがビデオのかたちで送られてくるとしたらどうだろうか。Synthesiaを使えば、そのようなビデオをとても簡単に安いコストで迅速に制作することができる。

Synthesiaには1シートで1カ月30ドル(約3200円)のエントリーレベルプランがあり、1カ月に10分間のビデオを作ることができる。1カ月500ドル(約5万4000円)からのエンタープライズレベルプランも用意され、もっと長時間のビデオを作ることができて追加の機能もある。

同社は調達した資金で顧客獲得と製品開発を加速させる計画だ。

Synthesiaはエンタープライズビデオプラットフォームからさらに拡張して、組織がSynthesiaのテクノロジーを自社のシステムに組み込み、さらにビデオの配布もできるようにするAPIも開発している。共同創業者でCEOのVictor Riparbelli(ビクター・リパーベル)氏は、ユーザーが株式の銘柄を選択して自分の電話番号を関連づけると、自動で毎日の株価情報を示すビデオが作られて指定した電話番号に送られるという例を示した。

エンタープライズ向け製品のSTUDIOは2020年夏にパブリックベータが公開され、それ以降1000社を超える企業に使用されている。

カテゴリー:人工知能・AI
タグ:Synthesia動画制作資金調達

画像クレジット:Synthesia

原文へ

(文:Jordan Crook、翻訳:Kaori Koyama)