日本語音声合成向けに東京式アクセントを自動推定する自然言語処理ソフト「tdmelodic」がオープンソース化

日本語音声合成向けに東京式アクセントを自動推定する自然言語処理ソフト「tdmelodic」がオープンソース化

PKSHA Technology(パークシャテクノロジー)は9月18日、自然言語処理ソフトウェア「tdmelodic」(Tokyo Dialect MELOdic accent DICtionary generator:東京方言高低アクセント辞書ジェネレーター)をオープンソースソフトウェア(OSS)としてGithub上で公開したと発表した。ライセンスは修正BSDライセンス(三条項BSDライセンス)。また特許出願中という。

tdmelodicを使用すると、様々な単語の東京式アクセントを推定でき、それにより大語彙アクセント辞書の自動生成が可能となる。この辞書は、より自然に感じられる日本語音声合成などの用途に利用できる。「日本語の単語の表層形と読みを入力とし、その単語の東京式アクセントを出力する機能」、「既存の日本語形態素解析用辞書UniDicとNEologdをベースとして、日本語文章の分析機能を有するMeCab用の大語彙アクセント辞書を自動生成する機能」を提供する。

PKSHA Technologyは、日本語音声合成技術の社会実装の加速を目的として、日本語音声合成で実用上必要となるような幅広い語彙を網羅した大規模アクセント辞書を自動生成するためのモジュールとして、単語の東京式アクセントを自動推定するソフトウェアtdmelodicを開発・公開。同ソフトウェアは、単語の表層形(漢字など、単語が文章中で現れる形)と読み(フリガナ)から、その単語のアクセントを深層学習に基づく技術により推定する。

同ソフトウェアを、既存OSSの大規模日本語辞書のひとつ「NEologd」などに適用すると、語彙サイズ数百万単語規模の大規模なMeCab用アクセント辞書を一括で自動生成できる。tdmelodicの活用法の一例として、音声合成システム開発者はまずtdmelodicとNEologdによる自動生成辞書をベースラインとして開発を始め、必要に応じて辞書中の誤りを適宜修正しながら文章読み上げの性能を向上させていくといった開発プロセスへの活用などが考えられるという。

近年、深層学習を活用した音声合成技術の登場により、合成音声の音質は飛躍的が向上し、店舗接客ロボットやスマートスピーカーなどにおいて音声合成システムが活用され始めて普及しつつある。しかし日本語の音声合成においては、いわゆる「イントネーションに若干の違和感がある」傾向にあり、依然として技術的課題となっているという。この問題は、音声合成システムの前処理において、各単語にアクセント情報を付与する際に、必ずしも正しい情報を付与できていないことが原因のひとつと考えられるとされる。

日本語の多くの方言の話し言葉において、単語のアクセント情報は重要な役割を担っており、そのひとつが同音異義語の識別のための役割(弁別機能)となっている。例えば、「富士」と「藤」は平仮名で書くと同じふりがな(ふじ)になる単語だが、アクセントが異なることによって識別でき、同様のケースが多数ある。

また、もうひとつの重要な役割が、文章中のフレーズの意味的まとまりや、文章の構造を理解しやすくするための役割(統語機能)という。例えば東京方言では、複数の単語が連結して複合語になった際に、複合語のアクセントと、個々の単語を単純に連結したアクセントとが、まったく異なったものになることがある。例えば「機械学習」は、「機械」(き\かい)「学習」(が/くしゅう)を単純に連結した「き\かいが/くしゅう」ではなく、「き/かいが\くしゅう」と発音する(\は下降気味に発音。/は上昇気味。東京方言の場合)。このように発音することで、「機械学習」が意味的にひとつの塊であって、単に「機械」と「学習」を並べた以上の特別な意味を持つ複合語であるということが分かりやすくなる。

日本語音声合成においてより自然な結果を得るためには、読み上げ文章中の全単語に対してこれらアクセント情報を適切に付与する必要があり、現在では、アクセント辞書(単語のアクセント情報を列挙した電子的な目録)を活用することが一般的という。

しかし、新語や流行語、商標名のように、標準的な辞書には掲載されない単語や、複雑な複合語などについては、実用上の重要性の高さにもかかわらず、既存の標準的なアクセント辞書では必ずしも十分に対応しきれていなかったという。

なお今回の成果の一部は、国立研究開発法人 新エネルギー・産業技術総合開発機構(NEDO)の助成事業の結果得られたものという。

関連記事
PKSHAが3Dアルゴリズム開発のSapeetを子会社化

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。