ゲームやそのほかのエンターテインメントの人工音声を「人間らしく」するイギリスのスタートアップであるSonanticが、230万ユーロ(約2億7680万円)の資金を調達した。
EQT Venturesがこのラウンドをリードし、前からの投資家であるEntrepreneur First(EF)とAME Cloud Ventures、そしてHorizons VenturesのBart Swanson(
バート・スワンソン)氏が参加した。なお、Twitchの共同創業者Kevin Lee(
ケビン・リー)氏も、初期の投資家の1人だ。
2018年にCEOのZeena Qureshi(ジーナ・クレシ)氏とCTOのJohn Flynn(
ジョン・フリン)氏は、ロンドンで行われたEFのインキュベーター事業に参加して同社を創業した。以前はSpeak Aiという社名だったSonanticは、世界のゲームとエンターテインメントの音声技術に革新をもたらしたいと考えている。同社は開発した人工音声技術を、ゲームスタジオがオンデマンドで使える「表情豊かでリアルな演技音声」と呼んでいる。すでにAAA(トリプルエー)のゲームスタジオ10社あまりとの研究開発パートナーシップを進めている。
Sonanticが解決する問題について尋ねると、クレシ氏は次のように答えている。「ゲームに会話を入れる工程は時間がかかり、高価で労働集約的な作業だ。この工程はキャスティング、スタジオの予約、契約、スケジューリング、編集、監督などなど、大量の調整作業を要する。音声つきのビデオゲームは、頻繁に変わるゲームデザインに付き合わされて1本のゲームが完成するまでに10年かかることもある。そのたびにゲームデベロッパーは、同じような繰り返し作業を強いられる。しかも途中で予算オーバーになったり、ゲームのリリースが遅れたりすることもある」
こういった問題を解決するためにSonanticは、クレシ氏が「オンデマンドで動的な演技音声」と呼ぶ技術を提供する。この技術は、キャラクターに求められる性別や個性、アクセントの特徴、声色、感情などに基づいて正しいタイプの声を作り出す。同社の人間の声に近いテキスト音声変換システムはAPIで提供され、ユーザーはGUIのツールで合成声優を編集し、変化させ、まるで人間の俳優に行うように監督(演技指導)する。
そのためにSonanticは、俳優たちといっしょに彼らの声を合成し、その際の演技指導も行う。「さらにその声のデジタルバージョンを提供することで、彼らの受動的収入源になり、俳優たちの助けにもなる」とSonanticのCEOは説明する。
経費を下げ、すぐに利用可能な音声モデルを用意していることで、Sonaticはゲームスタジオが短期間で繰り返しの作業が安価でできるようにしている。同社のSaaSとAPIによりいろんな音声演技を作って試すことも簡単で、ストーリーの細かい変更や編集、そして監督も楽にできるようになる。
一方でSonanticは怒り、悲しみ、喜びなどさまざまな感情のこもった音声を作り出す同社の技術をいずれ一般公開したいと考えている。同社によるとそれは、本当に有能な本物の俳優や声優にしかできない技能だそうだ。
[原文へ]
(翻訳:iwatani、a.k.a. hiwa)