声を失った声帯摘出者のCoeFont CLOUD利用が無料に、自分のAI音声による会話を支援

声を失った声帯摘出者のCoeFont CLOUD利用が無料に、自分のAI音声による会話を支援

東京工業大学発のAI音声合成スタートアップYellstone(エールストン)は9月9日、自分の声を取り込んで音声合成が行えるサービス「CoeFont CLOUD」を、声帯摘出によって声を失った人たちに無料提供すると発表した。これを利用すれば、スマホやパソコンで文章を入力するだけで、自分の声で会話ができるようになる。

申し込みは、「CoeFont CLOUD 声帯摘出者向けプラン申請フォーム」から行える。

AI音声合成プラットフォーム「CoeFont CLOUD」では、自分の声を収録すれば、それが音声合成用の声のフォント「CoeFont」(コエフォント)に変換され、自分の合成音声でテキストの読み上げが行えるようになる。自分の「CoeFont」はクラウド上で公開でき、他のユーザーがそれを利用すれば作成者に収益が還元される仕組みもある。APIを使ってアプリやウェブサイトに組み込むことも可能。

Yellsotneでは、CoeFont CLOUDの場合これまで料金500円・最短15分の収録としていたが、今後は、声帯摘出を行った人は無料で使えるようになる。

テレビのニュース番組では、声帯摘出を行い「CoeFont CLOUD」利用している人のインタビューが放送された。その人は「CoeFontに出会えて、本当に救われました。今まで全く縁のなかったAI技術の進歩と素晴らしさに本当に驚いています」と話していたという。

実は、こうした使われ方は当初は想定していなかった。Yellstone創業者で代表取締役の早川尚吾氏は、こう話す。

「声帯摘出者の方が利用するという、自分が考えていなかった使われ方に最初は驚きました。実際に会話で使っていただいている動画を見ると、自分が作ったものが人の役に立っているということがこんなにも嬉しいのかと思いました」

「CoeFont Cloud」と小学館が協働し声優・森川智之さんの音声フォントを採用したAI音声合成オーディブックの試聴版公開

「CoeFont Cloud」と小学館が協働し声優・森川智之さんの音声フォントを採用したAI音声合成オーディブックの試聴版公開

東京工業大学発のAI音声合成スタートアップYellstone(エールストン)は9月7日、人の声をフォント化して音声合成を行うプラットフォーム「CoeFont Cloud」(コエフォント・クラウド)を利用し、小学館と協働でAI音声合成オーディブックの試聴版を作成したと発表した。

第1弾は、「鬼滅の刃」産屋敷耀哉(うぶやしきかがや)役やトム・クルーズの吹き替えで知られる声優・森川智之さんの合成音声によるオーディオブック「なぜ”ブブカ”はスポーツでもビジネスでも成功し続けるのか」(小学館:セルゲイ・ブブカ著)。特設ページにおいて、期間限定で一部を無料公開している。「CoeFont Cloud」と小学館が協働し声優・森川智之さんの音声フォントを採用したAI音声合成オーディブックの試聴版公開

CoeFont Cloudは、最短15分の収録で、その人の声を音声合成用の「フォント」に変換し、それを使ってテキストの読み上げが行えるというサービスを行っている。今回は、森川智之さんが約2時間かけて収録した音声からAI音声合成を行い、「なぜ”ブブカ”はスポーツでもビジネスでも成功し続けるのか」の第1章のオーディオブック試聴版(約31分)を完成させた。

Yellstoneは、2021年4月に、デジタルキャラクターや著名人の声でテキストの読み上げができる「CoeFont Studio」をリリースした。リリース3日目にして5万人のユーザー数を獲得した。CoeFont Cloudはそれを発展させて、自分の声のフォントを作って読み上げができるようにしたサービスだ。

森川智之さんは、今回の試みについて「……この技術革新が不安な影も落とすのではと感じる方も多いのではないでしょうか。人工知能は黙っていても学習していきます。技術の進歩は日進月歩です。それならば、誰もが参加でき、その進歩の礎となり、みんなが見守りながらオープンスタイルで育てていくAIの音声合成」というYellstonの考え方に賛同したとのこと。

さらに、「私の音声サンプルによるAI音声合成は、まだまだ発展途上、点数を付ければ45点。細部にわたる表現力が課題で、100点には遠く及びません。しかし、これに皆さんが参加することによって、AIが学習を重ねていけば、より理想とする表現に近づくことは間違いありません」と述べている。

500円・約15分間の収録で自分の声によるAI音声合成を可能にする「CoeFont CLOUD」が先行公開を開始

500円・約15分間の収録で自分の声によるAI音声合成を可能にする「CoeFont CLOUD」が先行公開を開始

東京工業大学2年生で19歳の早川尚吾氏が設立し、社長を務めるAI音声合成スタートアップYellston(エールストン)は7月19日、1回の料金500円で約15分間の収録を行えば、AIが自分の声を音声合成用の声のフォント「CoeFont」(コエフォント)に変換してくれるサービス「CoeFont CLOUD」の先行リリース開始を発表した。

2020年11月設立のYellstonは、「CoeFont Studio」(コエフォントスタジオ)を2021年4月にリリースした。デジタルキャラクターや著名人の声でテキストの読み上げをさせることができるサービスだ。リリースから3日で5万人のユーザー数を獲得、月間ユーザー数は20万人に達したという。凪白みとのイラストで、浅木ゆめみが声を提供しているAllial(アリアル)とMillial(ミリアル)という双子キャラクターの声は無料で試すことができ、すでに二次創作などに多く利用されているそうだ。

CoeFont Cloudは、それを自分の声で行えるというもの。自分の声のフォントを公開できるが、「CoeFont Official」を利用すれば、気象予報士の森田正光、野球解説の藪恵壹などの著名人や声優の声フォントを自分の作品に使うこともできる。公開された声は、利用された場合に文字数に応じて本人に料金が支払われる。

このサービスの特徴は、文脈からアクセントを予測し、深層学習で自然な音声合成を行うところにある。ウェブサービスなので利用環境を選ばず、アクセントや速度の編集などすべてがウェブ上で行える。公開範囲は設定によって限定が可能。テキストを読み上げた音声はダウンロードして、オーディオブックや動画のナレーションなどに利用できる。さらに、APIが提供されるので、アプリに組み込んでコメントを読み上げるなどの活用が可能になる。自分の声が悪用される心配があるが、放送禁止用語や汚い言葉は合成できないように配慮されている。

音声作品の制作のみならず、声帯の切除手術を予定しているガン患者が、事前に自分のCoeFontを作っておき、後にそれを使って会話をするという利用法も、すでに実施されているという。

「CoeFont Cloud」は現在、先行体験期間中。先行利用には「CoeFont CLOUD先行利用申請」での申請が必要で、Yellstonが利用できる人を選考する仕組みになっている。

今後も、より自然に、精度の高い音声合成を目指して、これからも研究を重ねてゆくとのことだ。

関連記事
Twitterが音声ツイートに自動文字起こし機能追加、社内にアクセシビリティ専門チームを用意し取り組む
人と間違えるほど自然な合成音声を高速で作成するツールをWellSaid Labsが開発
質と量で世界初、工学院大学が約6360手話単語と10テーマ10件の対話を収録した高精度3D日本手話データベースを提供開始
生命保険の約款や学校教材における漢字の誤読を低減、正確なイントネーションで音声合成を自動生成するAIシステム
AIチャットボット「りんな」のrinnaとUneeQを日本展開するデジタルヒューマンが協業、顔・声・視聴覚を持つ雑談AI実現
日本語音声合成向けに東京式アクセントを自動推定する自然言語処理ソフト「tdmelodic」がオープンソース化

カテゴリー:ネットサービス
タグ:Yellston(企業)音読(用語)合成音声(用語)ディープラーニング / 深層学習(用語)東京工業大学(組織)日本(国・地域)