東京工業大学発のAI音声合成スタートアップYellstone(エールストン)は9月7日、人の声をフォント化して音声合成を行うプラットフォーム「CoeFont Cloud」(コエフォント・クラウド)を利用し、小学館と協働でAI音声合成オーディブックの試聴版を作成したと発表した。
第1弾は、「鬼滅の刃」産屋敷耀哉(うぶやしきかがや)役やトム・クルーズの吹き替えで知られる声優・森川智之さんの合成音声によるオーディオブック「なぜ”ブブカ”はスポーツでもビジネスでも成功し続けるのか」(小学館:セルゲイ・ブブカ著)。特設ページにおいて、期間限定で一部を無料公開している。
CoeFont Cloudは、最短15分の収録で、その人の声を音声合成用の「フォント」に変換し、それを使ってテキストの読み上げが行えるというサービスを行っている。今回は、森川智之さんが約2時間かけて収録した音声からAI音声合成を行い、「なぜ”ブブカ”はスポーツでもビジネスでも成功し続けるのか」の第1章のオーディオブック試聴版(約31分)を完成させた。
Yellstoneは、2021年4月に、デジタルキャラクターや著名人の声でテキストの読み上げができる「CoeFont Studio」をリリースした。リリース3日目にして5万人のユーザー数を獲得した。CoeFont Cloudはそれを発展させて、自分の声のフォントを作って読み上げができるようにしたサービスだ。
森川智之さんは、今回の試みについて「……この技術革新が不安な影も落とすのではと感じる方も多いのではないでしょうか。人工知能は黙っていても学習していきます。技術の進歩は日進月歩です。それならば、誰もが参加でき、その進歩の礎となり、みんなが見守りながらオープンスタイルで育てていくAIの音声合成」というYellstonの考え方に賛同したとのこと。
さらに、「私の音声サンプルによるAI音声合成は、まだまだ発展途上、点数を付ければ45点。細部にわたる表現力が課題で、100点には遠く及びません。しかし、これに皆さんが参加することによって、AIが学習を重ねていけば、より理想とする表現に近づくことは間違いありません」と述べている。