Amazon Transcribeで個人情報を自動差し替えできるように

AWSベースの書き起こしサービスのAmazon Transcribeが米国時間2月27日の午前、小さいながら重要な新機能をローンチした。その実装が正しければ、通話記録の書き起こしから個人情報を自動的に隠すことができる。

Amazon Transcribeの最も一般的なユースケースは、顧客からの電話を書き起こすことだ。ほとんどの場合、通話中に名前や住所、クレジットカードの番号などの情報が伝えらえれる。私の経験では、コールセンターの中にはクレジットカード番号を伝えようとすると録音を停止するところもあるが、必ずしもそうとは限らない。

この新機能では、Amazon Transcribeは自動的に社会保障番号、クレジットカード番号、銀行口座番号、名前、メールアドレス、電話番号、郵送先住所などの情報を識別し、それを編集できる。実際には、これらの情報は「PII」という文字列に自動的に置き換えられる。

もちろん、既存のドキュメントからPIIの文字を取り除くツールも存在する。しかし多くの場合、それらはデータ損失防止ツールに力を入れており、外部の人とドキュメントを共有する時に、データが外部に漏れないことを目的としている。新しいAmazon Transcribeツールでは、少なくとも一部のデータは共有できない(もちろん、録音した音声のコピーを保管しない限り)。

現在、Amazon Transcribeは31言語をサポートしている。そのうちの6言語は、キャプションやその他のユースケースのために、リアルタイムで書き換えることができる。

[原文へ]

(翻訳:塚本直樹 Twitter