今日(米国時間11/29)Amazonは、AWS専門のデベロッパー会議、AWS Re:INVENTを主催している。同社はそこで期待の新サービス、Amazon Transcribeを発表した。このサービスは現在プレビュー版が公開されており、数ある自動書き起こしサービスとは一線を画している。
ビデオやオーディオがウェブの多くを占めるようになった今、メディア内の情報を解析することは益々困難になっている。一つの方法はオーディオ部分を書き起こしてテキストに変換することだ。テキストはインデックス化や検索が可能なので新たな可能性が開かれる。
Amazon Transcribeのために、同社は音声認識エンジンを開発した。Amazon S3アカウントに保存されているオーディオファイルを文法的に正しいテキストに変換する。
Amazon Transcribeは、現在英語とスペイン語で利用できる。同社は数週間のうちにもっと多くの言語を追加すると約束した。
Amazon Transcribeの隠し味ともいえるのが、賢い書式設定と句読点の追加だ。複数の話者も識別し、タイムスタンプを付加するので会話の区別がしやすくなる。
Amazonはいくつかの利用場面を紹介した。たとえば、オンラインビデオに自動で字幕をつけることができる。カスタマーサポートへの電話を記録して分析するのにも適している。
同サービスは通話録音などビットレートの低いオーディオファイルでも利用できるほか、システムが製品名を理解しやすくするために、独自の語彙を追加することもできる。
Amazon Transcribeは、 本日発表されたAmazon TranslateとAmazon Comprehendという2つの新サービスと合わせて使うのにも便利だ。こうしてオーディオ録音を意味のあるデータに変えられるようになる。
[原文へ]
(翻訳:Nob Takahashi / facebook )