性的嗜好や支持政党が顔認識アルゴリズムでわかる研究が物議を醸す

顔の特徴だけで個人の支持政党をかなりの精度で判別できるという機械学習システムが研究者によって構築された。この研究は、性的嗜好も同様にして推測できる可能性があることを示したグループによって行われたものだが「現代版骨相学」であることを率直に述べ、その罠に陥らないよう慎重を期した上で、外見は我々が思っているよりも多くの個人情報を表している可能性があるという心地の悪い結論に到達している。

先のNature journal Scientific Reportsに掲載されたこの論文は、スタンフォード大学のMichal Kosinski(マイケル・コジンスキー)氏によって執筆された。個人の性的嗜好は顔データから推測できるという内容の同氏の論文は、2017年にもトップニュースを飾ったことがある。

この研究は批判を招いたが、その理由はその手法ではなく、概念上非身体的な(見た目ではわからないはずの)ことをこのような方法で検出できるという考え方にある。そもそもコジンスキー氏は、本人もずっと説明しているとおり、そうしたことは不可能だということを証明しようとしたのだが、結果は他の人にとっても、コジンスキー氏自身にとっても驚くべき、困ったものとなってしまった。この研究目的は、ゲイかどうかを識別する能力をAIで実現することではない。その反対である。研究チームが発表当時に寄稿したように、このようなテクノロジーが研究以外の目的で関心を持つ者によって開発されるリスクがあることを一般の人たちに警告する意味で、今回の研究結果を公開する必要があった。

この結果には本当に困惑しており、この事実を公開すべきかどうか判断に迷いました。公開することにより、我々が警告しているリスクが現実になってしまうのを避けたいと考えました。性的指向を公表するタイミングと相手をコントロールできることは、その人の幸福だけでなく、安全性のためにも極めて重要です。

政治家とLGBTQコミュニティに今直面しているリスクを早急に認識してもらう必要があります。我々はプライバシーを侵害するツールを開発したのではなく、広く利用されている基本的な方法が重大なプライバシー侵害を招くことを示したのです。

所属政党についても同様の警鐘を鳴らすことができるだろう。少なくとも現時点の米国では所属政党は性的嗜好ほど敏感または個人的な問題ではないが、敏感で個人的な問題であることは確かだ。政治的または宗教的に「反体制派」であるという理由で逮捕または殺害された人たちのニュースを1週間以上聞かないことはまずない。たとえばメッセージを傍受するといった方法ではなく、単に「アルゴリズムによって過激主義者と特定された」というだけで、抑圧的な政府が(逮捕または捜索するための)相当な理由を得られるとなると、そうした圧政的行為を非常に簡単かつ大規模に行えるようになってしまう。

このアルゴリズム自体は決して最先端のテクノロジーというわけではない。コジンスキー氏の論文では米国、カナダ、英国の出会い系サイトや米国のフェイスブックのユーザーの100万件を超える顔写真を収集し、機械学習システムに取り込んで学習させるというごく通常のプロセスが説明されている。顔写真が使用された人たちは、そのサイトのアンケートで政治的に保守派かリベラル派であることがわかっている。

このアルゴリズムは、オープンソースの顔認識ソフトウェアに基づいて開発されたもので、まず、顔だけを切り出す基本的な処理を行った後(これにより背景がアルゴリズムの処理対象から除外される)、さまざまな特徴を表す2048個のスコアで顔を単純化する。他の顔認識アルゴリズムと同様、この特徴は必ずしも「眉毛の色」とか「鼻のかたち」といった直感的なものではなく、よりコンピューターネイティブな概念だ。

画像クレジット:Michal Kosinski / Nature Scientific Reports

上述のユーザーから収集した所属政党データをこのシステムに取り込むと、保守派とリベラル派の顔に関する統計データの違いを細かく分析し始める。実際、両者の間には明らかな違いがある。

もちろん、これは「保守主義者は眉毛が濃い」とか「リベラル派にはしかめっ面が多い」といった単純なものではない。かといって、人口統計でもない。それではあまりに簡単で単純過ぎる。結局、支持政党が年齢や肌の色と関係があるなら、簡単な推測アルゴリズムができあがるはずだ。しかし、コジンスキー氏が使用したソフトウェアのメカニズムは極めて標準的なものであるが、この研究が前回のように疑似科学として片づけられないように同氏の考えたあらゆるケースを慎重に網羅するようにした。

これを実現する最も明白な方法は年齢、性別、人種が同じ人たちの支持政党をシステムに推測させるというものだ。このテストでは、2つの顔と2つの支持政党を提示し、どちらの顔がどちらの政党を支持しているか推測させた。偶然当たる確率は当然50%だ。人間はこの種の作業が苦手であり、結果は確立よりもわずかに高い55%程度であった。

このアルゴリズムで、年齢、性別、人種が一致する2人の支持政党を推測させた場合、正解率は71%の高確率となり、年齢、性別、民族性が任意の2人について推測させた場合(ただし、どちらかが保守派でどちらかがリベラル派という点は同じ)、正解率は73%に達した。

画像クレジット:Michal Kosinski / Nature Scientific Reports

4分の3という正解率は最近のAIにしては大成功とは言えないかもしれないが、人がやるとコイン投げより少し高い程度の正解率しか得られないことを考えると、検討するに値する何かがあるように思える。コジンスキー氏はその他のケースについても慎重に網羅した。確かに、この数字は、統計に現れた変則性や分離された結果の誇張ではないように思う。

支持政党が顔に現れるという考え方にはドキッとさせられる。ある人が右寄りか左寄りかということは最も個人的な情報とはいえないが、実体のない情報とみなされるのも当然だ。帽子、ブローチ、Tシャツなどで政治的信条を表現することはあるかもしれないが、人の顔というのは一般に無党派(政治的信条とは無関係)だと考えられてる。

顔のどの特徴に特に政治的信条が現れるのか知りたいと思うかもしれないが、残念ながらこのシステムではそこまで説明されることはない。コジンスキー氏は副次的な研究で、顔の特徴(顔の毛、凝視の程度、さまざまな感情)を数十個取り出し、それらに政治的信条がよく現れているかどうかをテストしたが、どの特徴も確率や人が推測したときよりも少し正解率が上がる程度だった。

「顔の向きや感情表現は際立った特徴だった。リベラル派は顔をカメラにまっすぐ向ける傾向があり、驚きの表情をする可能性が高いが、嫌悪感を見せることは少なかった」とコジンスキー氏は論文の執筆者ノートに書いている。しかし、こうした点を考慮しても、正解率の10%以上は説明がつかないままだった。「つまり、顔認識アルゴリズムは政治的志向を示す顔の特徴を他にもたくさん見つけたということだ」。

「そんなことがあるはずがない。骨相学はインチキだった」という反射的防御反応はここではあまり意味がない。これが真実であると考えるのは怖いが、極めて重要な真実である可能性があることを否定しても有益ではない。このアルゴリズムは人に対して非常に簡単に使える可能性があるからだ。

性的指向の研究と同様、ここでの問題は、こうした情報の完璧な検出システムを開発することではなく、それによって生まれるリスクを人々が認識し始めるような方法で実装できることを示すことである。例えば圧政的な神権体制が、性的指向がストレートでない人たちや特定の政治信条をも持つ人たちを厳重に取り締まる必要があると考えた場合、このようなテクノロジーは、そうした取り締まりを「客観的に」実施するための妥当な技術的手法を為政者に与えてしまうことになる。そのうえ、このやり方ならほとんど作業することなく、また、対象者に関する情報を取得することなく実施できてしまう。ソーシャルメディアの履歴を探ることや、購入品(ここにも政治的信条がよく現れる)を分析するといった作業も不要だ。

中国が追い詰められたウイグル族の宗教的少数派を見つけるための顔認識ソフトウェアを配備するというニュースが流れている。米国でも、当局はこの種のAIを信頼している。警察がこうした「最新のテクノロジー」を使って抗議行動の参加者の顔を分類し「この10人はシステムによって最もリベラルであると判定された」などと言っている様子は容易に想像できる。

数人の研究者がオープンソースソフトウェアと中規模の顔データベースを使うことで(政府にとって、この程度のシステムを構築するのは造作もないことだ。というより、おそらくすでに構築してしまっているだろう)世界中のどこでも、目的が何であれ、顔認識システムを実現できてしまうというのはゾッとする話だ。

「お門違いな非難は止めて欲しい。私は論文で、広範に利用されている顔認識アルゴリズムのリスクについて警鐘を鳴らしている。こうしたAI人相システムがすでに、性的指向の判別に使用されているのは懸念される。学者、政治家、市民は目を光らせる必要がある」とコジンスキー氏は語る。

関連記事:ポートランド市の顔認識技術禁止条例は民間企業も対象になる

カテゴリー:パブリック / ダイバーシティ
タグ:顔認証機械学習

画像クレジット:Design Cells / Getty Images

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。