Alexaのスキルのデベロッパーは8つの声を使い分けられるようになる(当面アメリカ英語のみ)

これからは、デベロッパーが作るAlexaの音声アプリは、Alexaの声でなくてもよい。Amazonは今日(米国時間5/16)からデベロッパーに、テキスト→音声変換サービスAmazon Pollyで使われている声の中から8つを無料で提供する。ただし当面はアメリカ英語だけで、Amazon PollyのWebサイトによると、女声5名、男声3名だ。

Amazon Pollyが最初に紹介されたのは2016年11月のAmazon re:Inventデベロッパーイベントで、その後着実に能力を高めている。このテキスト音声変換サービスは今では、ささやき声やスピーチマーク、音色の変化、ダイナミックレンジの圧縮、などの機能を提供しており、これらにより声がより自然に聞こえる。

今回Alexaデベロッパーに提供されるのはアメリカ英語だけだが、このスピーチエンジンは今では20あまりの言語をサポートしている:

Australian English Nicole Russell
Brazilian Portuguese Vitória Ricardo
Canadian French Chantal  
Danish Naja Mads
Dutch Lotte Ruben
French Céline Mathieu
German Vicki Hans
  Marlene  
Icelandic Dóra Karl
Indian English

Raveena

Aditi

 
Italian Carla Giorgio
Japanese Mizuki Takumi
Korean Seoyeon  
Norwegian Liv  
Polish Ewa Jacek
  Maja Jan
Portuguese – Iberic Inês Cristiano
Romanian Carmen  
Russian Tatyana Maxim
Spanish – Castilian Conchita Enrique
Swedish Astrid  
Turkish Filiz  
UK English Amy Brian
  Emma  
US English Joanna Matthew
  Salli Justin
  Kendra Joey
  Kimberly  
  Ivy  
US Spanish Penélope Miguel
Welsh Gwyneth  
Welsh English   Geraint

 

でも、複数の声が使えると、ゲームやお話などではAlexaがもっと楽しくなる。ほかにも、いろいろ、奇抜な使い方があるだろう。

今、自分が作るスキルで複数の声を使ってるデベロッパーは、mp3のファイルをアップロードするなど、面倒なことをいろいろしなければならない。

Amazon Pollyを使うなら、デベロッパーはStructured Speech Markup Language(SSML)という言語を使い、その“voice name”タグで声を指定する。指定するだけだから、自分でmp3を録音することに比べると、超楽である。

Amazonはこれまでも、Pollyの用途を広げようと努力してきた。最近ではWordPress用プラグインを提供し、テキストによるブログを簡単にポッドキャストに変身できるようにした。

もちろん今回のAlexaのスキルAPIへの提供も、その努力の一環だ。ライバルのGoogle Assistantとの競合、というねらいもある。

(Googleは先週のデベロッパーカンファレンスで、Wavenetが生成する6つの声を発表したが、その中には歌手のJohn Legendの声もある。その展開は今年後半からだが、たぶんAssistantのデベロッパーにもその声の利用を売り込む気だろう。)

[原文へ]
(翻訳:iwatani(a.k.a. hiwa