アップルがSiri改善のためフィードバック収集アプリ「Siri Speech Study」をひそかに提供開始

Apple(アップル)は最近、対象ユーザーから音声データを収集するための研究を開始した。2021年8月初め、同社は「Siri Speech Study」という新しいiOSアプリをApp Storeで公開した。このアプリは、オプトインした調査参加者が自分の音声リクエストやその他のフィードバックをAppleと共有できるようにするもの。同アプリは世界の多くの市場で利用可能だが、公開されている「ユーティリティ」カテゴリーを含め、App Storeのチャートには登録されていない。

アプリストア分析会社Sensor Towerのデータによると、このiOSアプリは8月9日に初めて公開され、8月18日に新しいバージョンにアップデートされた。現在、米国、カナダ、ドイツ、フランス、香港、インド、アイルランド、イタリア、日本、メキシコ、ニュージーランド、台湾で利用可能となっており、本調査がグローバルに展開されていることを示している。ただし、App Storeをキーワードで検索しても、Appleが公開しているアプリの一覧を見ても、このアプリは表示されない。

Siri Speech Studyアプリ自体には、この研究の具体的な目的や参加方法はほとんど記載されていない。その代わりに、ごく標準的な使用許諾契約書へのリンクと、参加者がID番号を入力する画面が用意されているだけだ。

Appleにコメントを求めたところ、同社はTechCrunchに対し、このアプリはSiriの製品改良のためにのみ使用されており、参加者がAppleに直接フィードバックを共有する方法を提供している、と述べた。また、この研究に参加するには招待されなければならず、一般ユーザーが参加するために登録する方法はないと説明している。

App Storeのスクリーンショット

このアプリは、同社がSiriを改善するために取り組んでいる数多くの方法の1つに過ぎない。

これまでAppleは、一般ユーザーが録音した音声のごく一部を業者に送り、手作業で採点・レビューしてもらうことで、Siriのミスをより深く学ぼうとしてきた。しかし、ある内部告発者が英国のThe Guardian(ガーディアン)に、このプロセスでは機密事項を盗聴されることがあったと警告した。Appleはその後間もなく、そうした人手によるレビューをオプトイン方式に変更し、音声の採点を社内で行うようにした。このような消費者データの収集は継続されているが、その目的は調査研究とは異なる。

関連記事:アップルはSiriの音声クリップのレビュー方法を抜本的に見直しへ

そうした広範囲で一般的なデータ収集とは異なり、フォーカスグループのような調査では、収集したデータと人間のフィードバックを組み合わせるため、AppleはSiriのミスをよりよく理解することができる。Siri Speech Studyアプリでは、参加者がリクエストに応じて明確なフィードバックを提供するとAppleは述べている。例えば、Siriが質問を聞き間違えた場合、ユーザーは何を聞こうとしていたのか説明することができる。また、ユーザーが「Hey Siri」と言っていないのにSiriが起動した場合は、その旨を伝えることができる。また、HomePodのSiriが複数人の家庭で話者を誤認した場合、参加者はそれを記録することができる。

もう1つの特徴は、参加者のデータが自動的にAppleと共有されないことだ。代わりに、ユーザーは自分が行ったSiriのリクエストのリストを見た上で、どれを選択してフィードバックとともにAppleに送信するかを選べる。また、参加者から直接提供されたデータ以外のユーザー情報は、アプリ内で収集・使用されないと同社は述べている。

Apple WWDC 2021

Appleは、自分のことを理解してくれるインテリジェントなバーチャルアシスタントが競争上の優位性を持つことを理解している。

2021年に入り、Appleは元Google(グーグル)のAI科学者であるSamy Bengio(サミー・ベンジオ)博士を起用し、SiriをGoogle アシスタントの強力なライバルに育てようとしている。一方、家庭内ではAmazon(アマゾン)のAlexaを搭載したスマートスピーカーが米国市場を席巻しており、中国以外のグローバル市場でGoogleと競合している。AppleのHomePodが追いつくには、まだまだ時間がかかりそうだ。

しかし、近年、音声ベースのコンピューティングが急速に進歩しているにもかかわらず、バーチャルアシスタントは特定の種類の音声を理解するのに苦労することがまだある。例えば2021年初め、Appleはユーザーがポッドキャストで話始めにつっかえた際の音声クリップを集め、この種のスピーチパターンの理解を向上させると発表した。また、家庭内に複数の機器があり、複数の部屋からの音声コマンドを聞いている場合にも、アシスタントはミスを犯しやすい。また、家族の中で声を聞き分けようとしたり、子供の声を理解しようとすると、アシスタントはよく失敗する。

言い換えれば音声研究は、同社の現在のフォーカス以外にも、時間をかけて追求できる道筋がたくさんあるということだ。

AppleがSiriの音声研究を行っていることは、必ずしも新しいことではない。同社はこれまでにも、何らかの形でこのような評価や研究を行ってきた。しかし、Appleの研究が直接App Storeで公開されることはあまり多くない。

このアプリをより秘密にしておくために企業向けの配布プロセスを通じて公開することもできたはずだが、Appleは公開マーケットプレイスを利用することを選んだ。これは調査研究がAppleの従業員だけを対象とした社内向けのアプリではないためか、App Storeのルールに沿ったものとなっている。

しかし、一般ユーザーがこのアプリを偶然見つけて混乱することはまずないだろう。Siri Speech Studyアプリは、発見されないように隠されており、アプリのダイレクトリンクがなければ見つけることができない(我々が詮索好きでよかった)。

関連記事
「音声認識AIの競争に対する懸念が高まっている」とEUが発表
iOS 15でSpotlightが大幅強化、アプリのインストールも可能に
スマホを臨床的に認められた血圧計にするアプリをSiri開発者と科学者の「Riva Health」が開発中
画像クレジット:Apple

原文へ

(文:Sarah Perez、翻訳:Aya Nakazato)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。