アップル、Siriに「性別の区別が明確につかない声」を追加

Apple(アップル)が、男性とも女性とも明らかな区別がつかない新しいSiri(シリ)の音声を開発した。このSiriの声は、iOS 15.4のベータ版で、言語を「英語(アメリカ合衆国)にすると利用可能になる。アップルは歴史的に、同社のデジタルアシスタントが不当な性差の固定観念を強化してきたという批判を受けてきた。今回のジェンダーニュートラルな音声を導入するという決定は、この大手テクノロジー企業がその批判から、また一歩距離を取るためのものと見ることができる。

長年にわたり、業界のオブザーバーや専門家は、Alexa(アレクサ)、Siri、Cortana(コルタナ)といった女性っぽい名前の音声アシスタントが作られ、それも女性っぽい声で話すことは、女性がいつでも言いなりになり、虐待さえ甘んじて受けるべきという考え方を暗示するものだと主張してきた国連の研究では、女性の声のアシスタントが従順で、時には媚びるようにさえ感じられることを指摘している。

さらに問題なのは、多くのバーチャルアシスタントをデフォルトで女性に設定するという決定は、私たちの日常的なテクノロジーの構築を担うチームに多様性が欠けているために行われている可能性が高いということだ。この問題は、AI音声の軽率な選択につながるだけでなく、女性にとって便利なツールの進化を遅らせる原因にもなってきた。例えば、人類の約半数に関連する健康指標であるにもかかわらず、アップルが「ヘルスケア」アプリに生理日追跡機能を搭載すべきだと気づくまでに何年もかかったのだ。

アップルは2021年、その信用を得るために、Siriの声に関する懸念に対処し、より多様な声を追加したアップデートを配信した際に、Siriの声がデフォルトで女性に設定されないようにした。

関連記事:アップルが英語圏のSiriに2つの新たな声を追加、「女性」の声のデフォルト設定は廃止に

しかし、AIの音声アシスタントの性別について、まったく考えなくて済むとしたらどうだろう?

それは明らかに、今回Siriに5番目の声を追加した意図である。アップルはまだそうはっきりと明言しているわけではないが。

しかし、iOSソフトウェアのコードを見れば、アップルの考え方を知るためのいくつかのヒントを得ることができる。

開発者のSteve Mosser(スティーブ・モッサー)氏は、iOS 15.4ベータ版の初期のバージョンで、性的区別のないSiriの声への参照を見つけ、今週には米国向けに用意された5番目のSiriの声が「Quinn(クイン)」というファイル名でベータ4に追加されたことを指摘した

Quinnはアイルランドを起源とする名前で、性別にとらわれない名前として知られ、長年にわたって男の子にも女の子にも使われてきた。これが新しいSiriの声にもなっているのは、偶然ではないだろう(ただし、アップルは音声ファイル名をエンドユーザーには表示しておらず、ユーザーインターフェース上では「声 1」「声 2」「声 3」等と表示される)。

Quinnの声は聞く人によって、少し女性っぽく、あるいは男性っぽく聞こえるかもしれない。だが、男性か女性かどちらかに決めて聞くようにすれば、その通りに解釈されるようになるだろう。

しかも、この新しい声は、ひと昔前のようなロボット的な調子に戻ることなく、性別を超えて聞こえるのだ。以前から他のSiriの声で聞かれるような自然な抑揚と滑らかな移行があり、人間らしい声であることに変わりはない。

アップルはTechCrunchに、新しい声はLGBTQ+コミュニティのメンバーによって録音されたと述べている。その自然な音声には、Neutral Text to Speech(ニューラル・テキスト・トゥ・スピーチ、Neural TTS)技術が活用されている。英語圏の音声はすべてNeural TTSを使用しており、他の6言語(フランス語、ドイツ語、スペイン語、中国語、日本語、韓国語)の音声も同様だ。ユーザーは、デバイスの設定とSiriの音声を選択する際に、合計16の言語から選択することができる。

インクルージョンに関してアップルは、Siriの音声だけでなく、デジタルアシスタントの発言にも力を注いできたた。過去数年の間に、アップルは「Black Lives Matter(ブラック・ライブズ・マター)」や「Stop Asian Hate(ストップ・アジアン・ヘイト)」に関するSiriの応答を追加し、ジェンダーやセクシュアリティに基づく暴言に対する強い応答を導入してきた。同社はまた、Speak Screen(スピークスクリーン、画面を読み上げ)、Dictation(ディクテーション、音声によるテキスト入力)、Voice Control(ボイスコントロール、音声コントロール)といった、数々の音声アクセシビリティ機能も導入してきた。

「私たちは、英語を話す人向けに新しいSiriの声を導入し、ユーザーが自分に話しかける声を、より多くの選択肢の中から選べるようにできることを大変うれしく思います」と、アップルの広報担当者は、新しいSiriの声について問い合わせた我々に答えた。「私たちが住む世界の多様性をより良く反映した製品とサービスを開発するというアップルの長年のコミットメントの一環として、私たちは2021年、2つの新しい音声を導入し、音声のデフォルト設定を廃止しました。世界中の何百万人もの人々が、毎日何かをするためにSiriを頼りにしています。そのため、私たちはできるだけパーソナライズされた体験が感じられるようにしようと力を入れています」と、アップルの広報では述べている。

新しい音のオプションは、3月中に配信が予想されるiOS 15.4で、英語話者向けに導入される予定だ。

画像クレジット:Thomas Trutschel / Contributor / Getty Images

原文へ

(文:Sarah Perez、翻訳:Hirokazu Kusakabe)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。