AppleはSiriの音声データを匿名化して最大2年保存する

AppleのiOSデバイス上の音声アシスタントSiriは、情報を捨てずに保存し、それらを、同社がリモートのサーバ上で行っている分析処理の結果をより正確にするために利用している。同社はこれまで、Siriとぼくのやりとりをいつまで保存するのか、それをどのように利用しているのかを明かさなかったが、このほどWired誌がAppleに取材をして、Siriのデータの保存のされ方を突き止めた。

Appleによると、Siriが集めた音声ファイルには識別子としてユーザのアカウントではなく乱数を付ける。それによってデータは匿名化される。メールアドレスなどユーザを識別できる情報は、いっさい付けない。乱数とデータの結びつきは6か月続き、そのあと削除される。音声ファイルそのものは、まだ残る。そして識別子を失った音声ファイルはAppleのサーバ上にさらに最大で18か月残り、Siriの改良や新製品のテストに利用される。ただしユーザがSiriを完全にoffにすると、データも識別子もすべて即座に削除される。

口述型のアプリケーションやサービスをめぐるプライバシーの懸念という問題は、前からある。Siriのための音声認識ソフトウェアを作ったNuanceは、2009年にiPhone用のDragon Dictationをローンチしたとき、プライバシーを心配する人びとに対して自分を擁護しなければならなかった。Nuanceは、そのアプリの会話の書き起こしを同社のサーバに保存して、自社技術の改良に役立てていた。Googleが個人化〜ターゲティングやGoogle Nowの正しい動作のために集めている情報にも、まったく同様の問題がある。

American Civil Liberties Unionの弁護士Nicole Ozerはプライバシー評論家としても有名だが、今回Wired誌にAppleを調べさせたのも彼だ。彼は、Appleが、ユーザの個人データの保存ポリシーを、ユーザに分かりやすい形でどこにも明記していないことを、問題にしている。SiriのFAQにもない。どんな情報をどんな形で保存し利用しているか、それを消費者に正しく伝えることはAppleの義務だ、と彼は主張している。

原則として、アプリやサービスがデータの収集を必要とするときには、個人の情報が内部的にあっちへ行ったりこっちへ来たりを激しく繰り返すことはほぼ間違いない。プライバシーを重視するユーザは、そのような状況に対して用心すべきだ。Siriに関するAppleのポリシーは、ほかと比べてかなりひどいかもしれないが、今回それを明確に具体的に述べてくれたことは、ありがたい。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))