Amazon Transcribeで個人情報を自動差し替えできるように

AWSベースの書き起こしサービスのAmazon Transcribeが米国時間2月27日の午前、小さいながら重要な新機能をローンチした。その実装が正しければ、通話記録の書き起こしから個人情報を自動的に隠すことができる。

Amazon Transcribeの最も一般的なユースケースは、顧客からの電話を書き起こすことだ。ほとんどの場合、通話中に名前や住所、クレジットカードの番号などの情報が伝えらえれる。私の経験では、コールセンターの中にはクレジットカード番号を伝えようとすると録音を停止するところもあるが、必ずしもそうとは限らない。

この新機能では、Amazon Transcribeは自動的に社会保障番号、クレジットカード番号、銀行口座番号、名前、メールアドレス、電話番号、郵送先住所などの情報を識別し、それを編集できる。実際には、これらの情報は「PII」という文字列に自動的に置き換えられる。

もちろん、既存のドキュメントからPIIの文字を取り除くツールも存在する。しかし多くの場合、それらはデータ損失防止ツールに力を入れており、外部の人とドキュメントを共有する時に、データが外部に漏れないことを目的としている。新しいAmazon Transcribeツールでは、少なくとも一部のデータは共有できない(もちろん、録音した音声のコピーを保管しない限り)。

現在、Amazon Transcribeは31言語をサポートしている。そのうちの6言語は、キャプションやその他のユースケースのために、リアルタイムで書き換えることができる。

[原文へ]

(翻訳:塚本直樹 Twitter

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。