アップルはSiriの音声クリップのレビュー方法を抜本的に見直しへ

Apple(アップル)について重要なニュースが入ってきた。同社のすべてのデバイスについて、Siriの音声レビュー、いわゆる「グレーディング」といわれる作業を見直すというもの。まず、ユーザーが明示的に選択しなければ、音声レビューを実行しないようにする。これは、今後のソフトウェアアップデートで対応予定だ。現在、そして将来のすべてのSiriのユーザーに適用される。

次に、ユーザーがレビューを許可した場合も、契約社員ではなくAppleの社員が自ら音声クリップを扱うようにする。これにより、プライベートなデータの処理を会社として中核的なプロセスに位置付けることになる。

Appleは、Siriのプライバシーの詳細の一部について、概要を説明するブログ記事を掲載した。これは、以前にもセキュリティに関するホワイトペーパーで説明していた内容だが、必ずしも一般に知られているわけではなかった。

Appleはこの問題について謝罪している。

「見直しの結果、私たちが掲げる高い理想に完全には到達していないことに気付きました。その点についてはお詫びします。以前にお知らせしたように、Siriのグレーディングプログラムは現在停止中です。ソフトウェアアップデートがユーザーにリリースされたとき、この秋の終盤には再開する予定でいます。それは以下に挙げる変更を加えた後ということになります」。

そして、Siriのグレーディング作業に加えられようとしている3つの変更の概要を説明している。

  • デフォルトでは、Siriとのやり取りの音声記録は保存しないようにします。引き続き、コンピューターによって文字情報に変換されたものを使って、Siriの改善に努めます。
  • ユーザーが明示的に選択すれば、ユーザーがSiriにリクエストした音声サンプルから学習することにより、Siriの改善にご協力いただくことができます。Appleがユーザーのデータを尊重し、強力なプライバシー管理を実施していることをご理解いただいて、多くの方々がSiriの改善にご助力いただけることを願っています。参加を選択していただいた方は、いつでもキャンセルすることが可能です。
  • ユーザーが参加を選択した場合には、Appleの社員のみが、Siriとのやりとりの音声サンプルを聞くことができるようにします。私たちのチームは、意図せずにSiriが起動してしまったと判断される場合には、その録音は削除することにします。

Appleは、まだこれらの変更を実施していない。また、停止したSiriのグレーディング作業も再開していない。それらは、OSのソフトウェアアップデートによって、ユーザーが自分の意思でプログラムに参加できるようになるのを待たなければならない。OSを新しいバージョンに更新すると、ユーザーがSiriに対してリクエストした内容を検証するための音声記録を使ったグレーディングのプロセスを有効にする設定が可能となる。これは事実上、アップデートが公開されてインストールされると、Siriのすべてのユーザーは、いったんこのプロセスから除外されることを意味する。

Appleによれば、今後もコンピューターによって文字情報に変換され、匿名化されたユーザーのリクエストを、データとして機械学習エンジンに入力するという。これは、他社の音声アシスタントでも同様だ。こうした文字情報も、おそらくAppleの社員によってレビューされることになる。

Amazon(アマゾン)とGoogle(グーグル)も、アシスタント機能の音声記録を人間によってレビューしていることが、すでに露見していて、やはりユーザーの同意を求めるという方策を取り始めている。

Appleは、グレーディングのプロセス自体にも変更を加えようとしている。たとえば、「ホームアプリで設定したデバイスと部屋の名前は、評価されるリクエストに家屋内のデバイスのコントロールが含まれる場合にのみ、レビュー担当者からアクセスできるようにします」としている。

8月初旬にThe Guardianに掲載された記事は、Siriの音声サンプルが、Appleが雇った契約社員に渡されていたことを明らかにした。そこでは、Siriの応答の品質や、機械学習エンジン用に生成した文字情報が評価されていたという。このような作業形態は前例のないものではないが、あまり明確に公にはなっていなかった。Appleはプライバシーポリシーの中で、そうした作業には人間が関わっていることを明らかにすべきだったのだ。さらに、サンプルの評価を、Appleの社員ではなく、契約社員に任せていたという問題もある。ある契約社員は、音声記録には秘密にすべき情報やプライバシーに関わるものが含まれていたと告白している。また場合によっては、ユーザーを特定できそうなものもあったという。Appleによる匿名化処理を施しているにもかかわらずだ。

それを受けてAppleは、そのプロセスを見直すため、世界中でグレーディング作業を停止したのだ。今回のブログ記事と、そこで述べているプロセスの改善案は、その見直しの結果として出てきたもの。

Appleによれば、そもそも音声サンプルのレビューを受けたSiriへのリクエストは、全体の0.2%程度に過ぎないという。しかし、Siriは毎月150億ものリクエストを処理している。統計的に見れば小さな数字だとしても、簡単な計算をしてみれば、それが実際にはかなりの数になることが分かるはずだ。

Appleが契約社員による作業を止めたことは、Alex Hearn(アレックス・ハーン)氏が報告しているように、ヨーロッパで大量の解雇があったことから推察できる。

Appleは、Siriのプライバシー管理が、こうしたグレーディングのプロセスにどのように適用されるのかについて、FAQを公開している。ここで、すべてを読むことができる。

Appleのブログ記事とFAQは、Appleがグレーディングのプロセスをどのように扱うのか、そうしたグレーディングのプロセスにおいて、データをレビューする人に示すデータをどのように最小化するのか、そしてSiriにおいてプライバシーはどう守られるのか、といったことに関する詳細の一部を消費者に開示するものだ。

当初、AppleのSiriに関する処理は、かなりの部分を可能な限りデバイス上の処理に限定するものだった。そのため、多くの専門家は、Appleはプライバシーを重視して性能を犠牲にしていると評価していた。AmazonやGoogleのような会社のアシスタント機能は、データセンターを使った負荷の重い処理を実行しているのに対し、Appleはデバイス上の「パーソナル・クラウド」によるデータ処理にこだわっているということ。残念ながら、人間によるレビュープロセスの透明性を欠いたこと、そして契約社員を使ったことが、Appleが当初から取り組んできた基礎的な作業の価値を棒に振ることになってしまった。ここでAppleが、プライバシーポリシーに関して過去の業界標準にまでさかのぼって、グレーディングの改善に取り組み直すというのは、むしろよいことだろう。そうする必要があったのだ。

実のところ、他社のアシスタント機能は、どれもSiriほどプライバシーに気を使っていない。すでに述べたように、そうしていては進化の速度が妨げられてしまう、ということを言い訳にする。今回のできごとが、Appleにとって、より高い透明性を実現するきっかけになることを願うのみだ。完全に自動化されていると思われているようなプロセスにも、実は人間が関わっているという事実を明らかにするよい機会だろう。

ほとんどの人は、「AI」や「機械学習」は、コンピューターのみによって実現されていると考えている。しかし悲しいことに、そうしたプロセスのほとんどは、まだかなりの部分で人手に頼っているのが実情だ。なぜなら、AI(人工知能)などというものは、実はまだ存在せず、機械学習もクズのようなものばかりだからだ。そうしたものが賢く見えるようになるまでには、この先まだだいぶ長いこと人間が関わっていく必要がありそうだ。

原文へ

(翻訳:Fumihiko Shibata)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。