アマゾンが医療向け音声認識サービス「Amazon Transcribe Medical」を発表

Amazon（アマゾン）はAWSの文字起こしサービスであるAmazon Transcribeの新機能として、医療会話のサポートを開始した。これは米国時間12月2日、午前のAWS re:inventカンファレンスで発表された。機械学習に基づく新サービスであるAmazon Transcribe Medicalは、医師の診断などに関する会話を、人間の介入なしにリアルタイムで正確なテキストに変換するとアマゾンはコメントしている。

一部のサービスのように「カンマ」や「ピリオド」などと言う必要はなく、普通に話すだけでいい。変換されたテキストは、ERシステムやAWSのAmazon Comprehend Medicalなどの言語サービスに送り込まれて処理される。同サービスはHIPAA（医療保険の相互運用と責任に関する法律）に準拠しており、ユーザーのニーズに応じたスケーリングも可能で、前払金不要で使ったぶんだけ料金を支払う。

技術的な仕組みは次のようになる。マイクロホンから取り込んだ音声をパルス符号変調したデータをストリーミングAPIにWebSocketプロトコルを使って送り込む。APIは変換されたテキストに単語単位のタイムスタンプと句読点を加えてJSONのBlobオブジェクトとして送り返す。データはAmazon Simple Storage Service（S3）) のバケットに保存することもできる。

Amazon Transcribe Medicalは、2017年に公開されたAmazon Transcribeを基に開発され、アマゾンが医療分野への投資を増やし始めたときに登場した。音声技術と医療の融合には特に力を入れている。例えば、先週アマゾンはAlexaの投薬管理サービスを公開し、ユーザーは薬の追加や服用のリマインダーを音声で依頼できるようになった。

さらに同社は、音声アプリAlexaをHIPAA準拠に改善し、医療スタートアップのPillPackやHealth Navigatorを買収し、社員向けの医療サービスとしてAmazon Careを提供しているほか、病院現場でのAlexa利用の試行も行っている。

医療分野で音声認識に力を入れているのはアマゾンだけではない。GoogleもGoogle Brainで参入し、MicrosoftやNuance、Philipsなど既存の大手企業やさまざまなスタートアップもこの分野に加わった。Amazon Transcribe Medicalは、米国東部（バージニア北部）と米国西部（オレゴン）の両リージョンでまず提供される。

[原文へ]

（翻訳：Nob Takahashi / facebook ）