【インタビュー】CMUロボティクス研究所の新ディレクターが語るロボット研究の未来

カーネギーメロン大学のロボティクス研究所では、2年間にわたって暫定的にポストを担ったSrinivasa Narasimhan(スリニヴァサ・ナラシマン)教授が退任し、この度6人目となるディレクター、Matthew Johnson-Roberson(マシュー・ジョンソン=ロバーソン)氏が着任した。2005年にカーネギーメロン大学コンピュータサイエンス学部を卒業した同氏は、ミシガン大学の海軍建築・海洋工学部および電気工学・コンピュータサイエンス部の准教授を経て同ポジションに就任することとなった。

関連記事:フォードがロボティクス研究でミシガン大学に研究者やエンジニアら100人を配置

ジョンソン=ロバーソン氏はUM Ford Center for Autonomous Vehicles(ミシガン大学自動運転車Fordセンター)の共同ディレクターも務めており、今回はそのオフィスから新しい役職における今後の計画や、ロボット研究の将来像について語ってくれた。

TC:今はミシガンでFord(フォード)関連に取り組んでいる最中なのですか?

MJR:そうですね。数人の生徒とともにロボット関連の研究をして楽しんでいますよ。

TC:そこでの主な取り組みは何でしょうか。

とても多くのことを進めています。Fordのための長期的で既成概念にとらわれない研究です。Argo(アルゴ)のように、できれば半年から3年以内に道路を走れるようになる予定のものを対象に多くの研究を行っています。道路を走れるようになるのが5年から10年先のようなものに対しても長く取り組んでいます。新タイプの奇妙なセンサーから人間の予測や安全性の保証まで、あらゆることに非実際的なアプローチをとることができるのが大学の良いところです。

TC:Fordとミシガン大学がとっているような連携システムは、多くの大学にとっての手本のような存在になるのだと感じます。特にCMU(カーネギーメロン大学)のような大学には、裕福な資金提供者との長い歴史があります。こういったパートナーシップは今後大学研究のモデルになっていくとお考えですか?

これは、過去20年間にわたってロボット工学が通り抜けてきた変革を反映しています。90年代、00年代に開発された技術の多くが成熟して商用製品として展開されるようになり、多くの産業の未来に大きな変化をもたらしています。企業と大学が徐々に関係を持ち始めるようになったというのは、自然な流れだと思います。ピッツバーグという街を見ても、天然資源や鉄鋼を中心とした重工業からの転換が進んでいますが、この転換はさらに加速するでしょう。

関係性を継続し、新しい関係を築いていくことが私の目標の1つです。産業界だけでなく政府や政策など、これからのロボット工学に関連するあらゆることを考慮し、そうした関係を築いて研究所ですでに行われている技術的な仕事の強みを生かしていきたいと思っています。これは私が特に楽しみにしていることです。

TC:ピッツバーグでは地元スタートアップ企業が数多く存在する一方で、Google(グーグル)のような大企業も研究や法廷を学んだ卒業生の近くに進出してきています。このような関係をさらに深めるため、CMUはどう取り組んでいるのでしょうか。

CMUのある教授と共同するためにWaymo(ウェイモ)のオフィスを開設しています。このような関係は、教員とだけでなく学生に対しても見られます。高度な訓練を受けた新しい従業員こそがこういった企業の生命線です。採用活動で優位に立ち、人々が来たいと思うような文化を築くためにできることは、これらの企業にとって大きな利点となります。また、企業が共同研究を行ったり、研究のスポンサーになったりして、新しいプロジェクトを開発したり、入学してくる学生との新しい関係を築いたりしています。大学の最もすばらしい点は、毎年世界で最も賢い人々が新たに入ってきてくれるという点です。

TC:大学という幅広い文脈の中で、これらのスタートアップ企業の成長を支援するというのはあなたのタスクの1つとお考えですか。

そうですね。私自身、スタートアップを立ち上げる機会がありましたし、知識に大きなギャップがあることを知りました。非常に賢く、世界に対して大きな野心を持っている学生が大勢いるため、彼らがそれを実現できるように支援する方法を考えることが私の役割だと思っています。今あなたが強調したのもスタートアップですし、エコシステムという言葉がよく聞かれます。その地域に他のスタートアップ企業があるということもありますが、それに加えて一緒に何かをしたり、何かを作ったりする気の合う仲間を見つけることができるコミュニティがあるということです。

TC:現在ミシガン大学にいらっしゃるので、デトロイトで起きている変革を目の当たりにしていると思います。スタートアップコミュニティの育成という点でデトロイトはピッツバーグほど進んでいないかもしれませんが、そこには多くのチャンスがあります。CMUが惹きつけた人材を維持するために、学校はどういった役割を果たせるでしょうか?

いくつかのことがあります。近年ますます重要だと感じることの1つは、まずチャンスがそこにあることを認識するということです。ロボット産業のスピードと規模は、私たちの誰もが予想できないほどの速さで加速しています。そのために重要なのは、そのことを認め、じっとしていようとしないことです。業界は変化し、ロボットを取り巻くエコシステムが変化し、またこれらの企業を取り巻く規模やスケールも変化しています。これを実現するための方法をともに考えていきたいのです。

TC:ロボット工学は歴史的に最もインクルーシブな分野ではありません。その中でCMUはどのような役割を果たしていけるでしょうか? CMUのようなところに入学する多くの人は、入学する前からロボット工学に慣れ親しんでいる人たちなのではないでしょうか。

今回私はCMUにいる間に2つのことを残したいと思っています。1つ目は機会を増やし、参加者の幅を広げ、各分野における多様性を高めるということです。そして2つ目はもっと重要なことだと思います。大学は若い人たちの心を形成するのに適した場所です。私がロボット工学に多様性と包括性を持たせるための変革を起こすためには、第一級のロボット研究機関にいるということ以上に効果的な方法はありません。次世代のロボット工学者の誕生の場にいるということなのですから。

TC:あなたはCMUに入学した当初、ロボット工学を専攻していたわけではないので、良い例ですね。

まったくその通りです。さらにもう一歩踏み込むと、CMUに入学したとき私はとても苦労しました。みんなが自分よりも賢いという場所に足を踏み入れたのは初めてのことでした。それこそがあの場所の特別なところだと思います。何があってもロボット工学を辞めることにはなりませんでした。それは当時も今も、あの場所にいる人々のおかげだと私は思います。

TC:最近のロボット工学において最も楽しみにしていることは何ですか?

世界各地で展開されている大規模なロボット工学分野のシステムは、現在まさに変曲点に来ています。いつか、米国や世界のどこにいても、窓の外を見ればロボットが何か役に立つことをしているという状況になって欲しいと思っています。今の世界はそうではありません。工場の現場などに行けばロボットを見ることができますし、もしかしたらロボット掃除機を持っているかもしれませんが、私は窓の外を見るとロボットがいるというレベルにしたいと思っています。

画像クレジット:CMU

原文へ

(文:Brian Heater、翻訳:Dragonfly)

【コラム】ダイバーシティに関するデータが透明性を欠いている理由

テクノロジー業界では、ダイバーシティが大きな話題となっている。FacebookやGoogleなどの企業が企業文化の向上を目指し、ダイバーシティ、エクイティ、インクルージョンへの取り組みを行っている。しかし分析によると、DEIを推進しているとされるこれらの企業では、こうした取り組みにもかかわらず、過去10年間でダイバーシティに大きな変化は見られなかった。

2010年代に入り、多くのハイテク企業が透明性を示すために年次のダイバーシティに関する報告書を公開したが、データを見てみると問題が浮かび上がってくる。報告書は、ダイバーシティの数値の増減を記載していることが多いが、企業が具体的な変化を起こすのに役立つデータを分析できていないことが多いのだ。

データを活用し、ダイバーシティに影響を与えるシステムを深く掘り下げる

これらの報告書に記載されているデータは、結果を示すものだ。企業がダイバーシティにおける測定分野(人口統計学的コミュニティが一般的だ)において成長したのか、衰退したのかがわかる。しかし、なぜそのような結果になったのか、システムのどの段階で失敗しているのかはわからない。

したがってこれらの報告書は、改善されたプロセスやシステムを測定するという、説明責任の強力な効果を逃しているのだ。

一例として、ある企業のマーケティングデータを見てみよう。

大企業がマーケティングファネルを最適化しようとするとき、マーケティングプロセスのあらゆるレベルのデータを見ることがある。例えば、外部のマーケティング活動から得られるインプレッション数を推定したり、広告からウェブサイトへのコンバージョン数を数値化したり、ウェブサイトの訪問者のうち何人が顧客に転換したかを計算したりする。これらの情報は、パフォーマンスを最適化し、売上を増加させるために定期的に使用される。そしてこれらの情報は、企業が成功するためには収益の創出が不可欠であることをリーダーたちは知っているため、優先的に使用される。

リーダーは採用システムのすべての段階でデータを記録し、分析すれば、採用段階で質の高い分析を行うことができる。データセットには、すべての交流ポイントにおける以下の(しかしこれに限定されない)人口統計学的情報が含まれるだろう。

  • 求人広告のインプレッション数
  • ソーシングチャネルを通じて特定された候補者
  • 面接に来た候補者
  • 面接官による評価結果
  • 内定および承諾された内定

それからリーダーは、プロセスの各段階で、就職可能な人材と少なくとも同等の人口構成のコミュニティを確保することができる。そして結果の改善のために(毎年ではなく)、このデータを利用して、優先的に定期的にシステムに変更を加える必要があるだろう。

採用活動はその一例に過ぎず、他にもさらに有益なダイバーシティデータを活用できるビジネス分野はある。

情報の実用化

リーダーは、説明責任を果たすための情報やより高い公平性と包括性を実現する情報を公開することで、データを実用的なものにするという選択ができる。

以下の各項目の共有を検討してみて欲しい。

  • 人口構成別の給与の透明性と給与の公平性
  • エンゲージメントとインクルージョンのデータ(人口構成別)
  • 人口構成別の昇進率
  • 人口構成別の定着率

このような提言をすると、ジェネラルカウンシルは不安になるかもしれない。しかし、人材、文化、エクイティの分野でイノベーションを起こしている企業は、こうした透明性と説明責任の領域に踏み込んでいる。

さらに、これらのデータを公開することで誠実さを全面的に打ち出している組織は、ダイバーシティを中心とした帰属意識の高い文化の構築に向けて大きく前進している。

データの透明性とデータの説明責任は別物である

私たちはよく、何かを測定できるなら、それを変えることができると信じている。しかし、測定だけでは変化はやって来ない。測定可能な変化に対してステークホルダーに責任を持たせながら、適切なデータ要素を測定することが極めて重要だ。

これが営業ではどうなるのかを考えてみて欲しい。

営業チームは、収益目標の達成に貢献したかどうかで個人の業績を評価する。結果を出さなければ仕事を失うリスクがある。なぜなら失敗すればビジネスに悪影響を及ぼすからだ。

DEIでも同じように、業績評価の目標の一部として、四半期ごと、あるいは毎年、具体的な結果を出すことに責任を持つリーダーが出てくるだろう。だが残念ながら、何が起こったかを報告するだけでは、リーダーたちが結果に有意義な影響をもたらすプロセスを変えるためにさらに行動するようにはならない。

低い数値を基準にしても変化は起こらない

ダイバーシティの報告書では、自社の過去の指標、業界全体、同規模の企業、または地域全体(米国など)に対し、毎年のデータを基準とすることがよくある。このような方法で進捗を測定すると、少しずつの進歩が実際の成果よりも大きく見える。リーダーはこのデータを見て、自分たちは業界標準を満たしているということはできるが、業界の進歩率がごくわずかであれば、それはただ結果を改善する責任がなくなるだけだ。何十年もの間、企業はダイバーシティを正しく理解していなかったのに、なぜその標準以下の実績を基準にするのだろうか?

簡潔にいうと、低い実績を基準にするのはお粗末な行為だ。

基準を設けるなら、少なくとも、ダイバーシティとそのコミュニティに関して上位4分の1に入る成績を収めている企業を基準とすることで、真の意味での改善を目指すことだ。しかしこれによってまたハードルが上がり、リーダーにはより戦略的になることが求められる。

さらに重要なことは、企業は利用可能なタレントプールを(米国の労働統計局のデータや、人口構成や専攻分野別の卒業率を利用しながら)基準として、地理的、業界的、職種的に人材の数が少ない箇所を特定することだ。

例えば、コンピュータサイエンスを専攻した女性の卒業率は、ほとんどの企業における新入社員レベルのソフトウェアエンジニアリング職に就いている女性の割合を大幅に上回っている。

しかし、米国の労働統計局のデータでさえ、誰が雇用対象なのかに関する前提条件に依存しており、真に雇用可能な人々の全体像を除外してしまうという欠陥がある。このことから、これらの基準と地域の人口データを組み合わせれば、効果を示す別のデータセットとして利用することもできる。

もしハイテク企業が、組織内で現在起こっていることについてのデータだけでなく、システミックな偏見が、組織にアクセスできない多様な人材に対してどのような影響を与えているかを示すデータを公開すれば、そのような報告書が行動変革の動機となり、自分たちの組織の成果を向上させたいと考えている他の業界の読者にとって価値のあるものになるかもしれない。

編集部注:本稿の執筆者Fran Benjamin(フラン・ベンジャミン)氏はGood Works Consultingのマネージング・パートナー。Monique Cadle(モニーク・キャドル)氏は、Good Works Consultingの創立パートナーであり、Delfi Diagnosticsの人材担当VP。

画像クレジット:A-Digit / Getty Images

原文へ

(文:Fran Benjamin、Monique Cadle、翻訳:Dragonfly)

【コラム】ソーシャルオーディオアプリが今行うべき5つの変革

Clubhouse(クラブハウス)、Beams(ビームス)、Pludo(プラード)、Racket(ラケット)、Quest(クエスト)などのソーシャルオーディオアプリがこの1年で人気を集め、より多くのマーケターやプロダクトチーム、そして新進のライバルたちが、この領域でユーザー体験を創造し、破壊する戦略を模索し始めている。

一方で、これらのプロダクトが最初に市場に登場したとき、コンテンツクリエイターは、サインアップ、オーディオルームやショート形式のポッドキャストの作成、放送時間の設定をシンプルに行うことができた。しかし、ユーザーからの否定的なフィードバックがインターネットフォーラムのトップに集まるようになってきた今、ソーシャルオーディオがいかに「ソーシャル」であるべきかを考える良い転機が訪れていると言えよう。

ソーシャルオーディオはYouTube(ユーチューブ)、Twitter(ツイッター)、Facebook(フェイスブック)のユーザー体験を模倣するものではないことは認識されている。しかし、それらを除外した場合、ソーシャルオーディオ企業は戦略を策定する際に何を考慮すべきであろうか。

これまでテレビとマーケティングを担当してきた筆者自身の経験からすると、ソーシャルオーディオが主要な報道機関と同じ戦略を活用する必要があると考えるのは自然なことではないかと思う。

経験に基づいて、ソーシャルオーディオアプリチームがそれを行う上で最も手軽に利用できる方法を、5つ紹介しよう。

インクルージョンに向けた構成

私たちがアプリの設計について考えるとき、一般的に頭に浮かぶのは、ハンバーガースタックの配置、フォントの種類、そしてユーザーが自分のアカウントに簡単に出入りできるかどうかという点だ。

しかし、その設計が障害のあるユーザーをどのようにサポートし、またサポートしないかということについては、あまり考慮されていないように思う。2020年にソーシャルオーディオが普及した際、注目すべき、そして理にかなった懸念として浮上したのは、視覚や聴覚に障害のある人向けのアクセシビリティ機能が不足していることだった。

小さなテキストは、視覚障害のある人がアプリを操作するのを困難にし、キャプションがないことは、聴覚障害のある人が会話を楽しむのを妨げてしまう。

レストランや映画館では、顧客が点字や大きな活字で別のメニューを使用したり、番組を楽しむために追加のサポートが必要な観客のために字幕を提供したりすることが多いことを考えてみよう。ソーシャルオーディオアプリチームと設計者は、開発ロードマップの早い段階でこれらの懸念に対処するために、ワークフローにアクセシビリティチェックポイントを含める必要がある。

最初の1年間はジャーナリストやホストを活用

コンテンツクリエイターにソーシャルオーディオアプリをマーケティングすることは、アーリーアダプターを引き寄せるすばらしい方法ではあるが、ベータ段階で自社のブランドと協力することをいとわない経験豊富なホストやジャーナリストを見つける方が賢明かもしれない。

それはなぜか。最終的にメディア市場の一部を占めるようなアプリを作る際に、信用が鍵になるからである。

コンテンツを作成することと、信用を得ることは、互いに排他的なものとはならない。また、ライブショーの制作や一般からのフィードバックのモデレーションの実績がある経験豊富なジャーナリストやホストによって審査されることで、視聴者の体験を向上させることができる。

いうまでもないことだが、要領を心得ている才能ある人材のラインアップから始めれば、ユーザー教育オファリングに費やす時間を稼ぐことができる。信頼できる名目上のリーダーが対話をリードすることで、後から加わったクリエイターたちがプラットフォームを効果的に利用するための方向性を決めることにもつながるだろう。

大手メディアを模倣する

Spotify(スポティファイ)、Netflix(ネットフリックス)、Hulu(フールー)、Amazon Prime(アマゾン・プライム)、ABC、NBC、CBS、BBCの共通点は何か。それは番組編成に関することにある。

ABCで今夜8時に何が始まるのか知りたい人は、簡単にそれを見つけて番組を見る時間を作ることができる。Netflixでは、視聴者は数カ月前ではないにしても数週間前にラインナップの変更について知ることができる。

自社の才能によって制作されるルームや番組のラインナップを用意することを考えてみよう。そうすることで、ユーザーオーディエンスは、お気に入りのクリエーターの活動が中断されていてもプラットフォームに参加する理由を持つことができる。

確かに一部のコンテンツクリエイターたちは、自分がいつ戻ってくるかをオーディエンスに知らせるだけの十分な機転を持ち合わせているが、一方で、プレゼンスの維持を確保してくれるプロデューサーや経験豊富なチームのサポートを得られずにいる人たちも少なくない。

一見すると、これはアプリチームにとって大きな問題ではないように思われる。なぜなら、コンテンツクリエイターが戻ってきて、彼らのオーディエンスを連れてくることに賭けているからだ。しかし、アプリが実際にエンゲージメントを失っているのはこの部分にある。クリエイターが一貫しておらず、オーディエンスがいつ戻ってくるかわからず、ユーザーが似たようなオーディオルームや番組への提案をすぐに受けられない場合、彼らは興味を失い、戻ってこなくなる。

その後、ユーザーにプラットフォームの利用を中止した理由を尋ねると、その評価は概して、継続的な価値を見出せなかったというネガティブなものとなる。

クリエイターがクレームを受けた場合はすみやかに教育する

エンターテイナーたちが失敗すると、何人かのグループがその懸念を表明するだけで、気づかぬうちに彼らのキャリアは大打撃を受ける。コンテンツクリエイターが悪質な行為をしたことが原因の場合もあれば、純粋なミスや無知によるものもある。

ここで問題なのは、もしクリエイターを早急に排除してしまうと、彼らのキャリアに傷がつくだけでなく、同じような状況で何をすべきか、そして初期の懸念を個人的にも公にも解決するにはどうすればよいかについて、教育コミュニティ内の他の人たちが必要としていたことが失われてしまうことだ。

これらのプラットフォームの生来の性質を考えると、このような混乱は必ず起こるものである。そのため、関係者全員を支援する方法で問題に対処する方法を見つけることが望ましいと言えるだろう。

ここでの提案として、コンテンツクリエイターがプラットフォームに戻る前に完了すべきトレーニングプログラムを作成するか、会社がオンラインまたは対面トレーニングコースと提携し、人種、文化、社会問題などに関連するトピックについて人々を教育することを推奨したいと思う。

筆者はそれを、交通違反で切符を切られ、教習所に通うことになる状況になぞらえている。こうしたアプリチームは、クリエイターたちが公共の目の中にいて、その場で学んでいけるような、似たようなソリューションを考えるべきだろう。すべてのコンテンツクリエイターがジャーナリストとして訓練されているわけではない。もし彼らがマーケティングのターゲットになっているのであれば、ミスが起きた後でさえ、彼らをプラットフォームのアクティブな参加者として維持し続けるための戦略があるべきだろう。

コンテンツ協議会の設置

最後になるが、忘れてはならないのは、会社がベータテストに入ったときに、プラットフォームに現れる可能性のある機密性の領域に対処するために、コンテンツ協議会を設立することが賢明だということだ。

スタートアップが諮問委員会を設置しているのと同じように、ダイバーシティ、エクイティとインクルージョン、身体障害、国際問題、政治、LGBTQIA擁護、人種、医療、社会正義などの分野で業界の専門家とコンテンツ評議会を組織することを検討して欲しい。これにより、社内の従業員は、プラットフォーム上の難しいトピックにどのように対処すればよいかというプレッシャーから解放される。また、社内的にビジネス活動に関与する人材が会社にもたらされることもある。これらの専門家は、注目を集めるトピックに関してプラットフォームが論争に直面した場合に助けになってくれるかもしれない。

ソーシャルオーディオ領域が拡大するにつれ、クリエイターやオーディエンスのプラットフォームへの関わり方も広がっていくだろう。しかしその成長が2021年の終わりまで続くかどうかは定かではない。1つ確かなのは、ソーシャルオーディオ領域は現在の姿よりも大きくなる可能性を秘めており、コンテンツクリエイターとしてもエンドユーザーとしても、この領域にどのようなオポチュニティが生まれるのかを見るのは楽しみであるということだ。

画像クレジット:krisanapong detraphiphat / Getty Images

原文へ

(文:Adonica Shaw、翻訳:Dragonfly)

インドやフィリピンなどアクセントが異なる英語の認識が向上した音声認識モデル「Speechmatics」

ここ数年、スマートスピーカーや運転支援モードの普及に伴って、音声認識は便利なものから重要なものへと変化してきたが、誰の声でも同じようにきちんと認識できるわけではない。Speechmatics(スピーチマティック)は、最も包括的で正確なモデルを持っていると主張する。特に一般的な米国のアクセント以外のスピーチに関しては、Amazon(アマゾン)やGoogle(グーグル)などを凌駕しているという。


同社は、2019年にスタンフォード大学で行われた「Racial Disparities on Speech Recognition(音声認識における人種格差)」と題した研究の内容から精度の問題関心が向いたと説明している。たとえばAmazon、Apple(アップル)、Google、IBM、Microsoft(マイクロソフト)の音声エンジンは「人種による大きな格差が見られている。たとえば平均ワードエラー率(WER)をみると、白人話者に対しては0.19であったのに対し、黒人の話者の場合は0.35だった」とある。つまりイマイチってことだ!

この差の原因は、システムの学習に使用したデータセットに多様性がないことが一因であると考えられる。結局、データの中に黒人の話者が少なければ、モデルはそのようなスピーチパターンを学習することができない。これは、他のアクセントや方言を使う話者についても同じことがいえる。英国はいうまでもなく、米国にはさまざまなアクセントがあるので「すべての人たち」のためのサービスを提供すると主張する企業は、そのことを認識する必要がある。

ともあれ英国のSpeechmaticsは、その最新モデルでアクセント違いの英語を正確に聞き取ることを最優先にしており、他のモデルを圧倒できると主張している。スタンフォード大学の研究で使用されたのと同じデータセット(ただし、最新バージョンの音声ソフトウェアを使用)に基づいて「Speechmaticsは、アフリカ系米国人の声に対して、Googleの68.7%およびAmazonの68.6%と比較して、82.8%という総合的な正確性を達成できた」と同社はプレスリリースに記している

同社によれば、この成功は、音声認識モデルの作成に比較的新しいアプローチを採用したことによるものだという。従来、機械学習システムにはラベル付きのデータが提供されていた。これは、音声ファイルにメタデータやテキストファイルが付随したものだ、通常はそうした付随データの書き起こしは人間が行いチェックもしている。猫の検出アルゴリズムでは、画像とともに、どの画像に猫が写っているか、どこに猫が写っているかなどのデータが付随する。これが教師あり学習で、用意された2つの形式のデータの相関関係をモデルが学習する。

Speechmaticsはデータセット、学習効率、計算能力の向上にともない、近年注目されている自己教師あり学習を採用している。同学習法は、ラベル付きのデータに加えて、ラベルのない生のデータを大量に使用し、より少ないガイダンスで独自の音声「理解」力を構築していく。

関連記事:「常識」獲得に向け少しずつ進化するコンピュータービジョン、フェイスブックの最新研究

今回のモデルでは、基本的な理解力を得るために約3万時間のラベル付きデータで学習が行われた後、YouTubeやポッドキャストなどのコンテンツから得られた110万時間の公開音声が投入された。こうした収集方法は多少グレーゾーンだ、なぜなら他者の商用音声認識エンジンのトレーニングに自分のポッドキャストが使われることには、誰も明確に同意はしていないからだ。しかし、OpenAI(オープンAI)のGPT-3の訓練に「インターネット全体」が使われたように、多くの人によってそのような使い方が行われている(まあ、まだ私個人の声をマスターしてはいないが)。

Speechmaticsのモデルは、米国の黒人話者に対する精度を向上させただけでなく、子どもの聞き取り能力も向上させ(約92%の精度、これに対してGoogleやDeepgramでは約83%の精度)、インド人、フィリピン人、南部アフリカ人、そしてスコットランド人なども含めた世界中のアクセントの異なる英語に対して、小さいながらも大きな改善が見られたとしている。

このモデルは他にも何十もの言語をサポートしており、その多くで他のエンジンに対する競争力を誇っている。これは単なる英語認識モデルではなく、英語をリンガフランカ(「国際共通語」の意、今となっては失笑を買うほど不適当な慣用句だが)として使うことを考えると、アクセントは特に重要な意味を持つ。

Speechmaticsが挙げた数字は先進的なものだが、AIの世界は信じられないほどの速さで動いているため、2022年以降さらに飛躍することがあっても不思議ではない。たとえばGoogleは、発話の不自由な人でもエンジンを使えるようにするための努力をしている。最近では、インクルージョンはすべてのAIワークにおいて重要な役割を果たしており、企業が互いにしのぎを削るところを見られるのは良いことだ。

関連記事:GoogleがProject Euphoniaの包括的な音声認識を支えるAIの詳細を発表

画像クレジット:drafter123/Getty Images

原文へ

(文:Devin Coldewey、翻訳:sako)

【コラム】イーロン・マスクやスティーブ・ジョブズ、「独創的」な考え方を持つ脳多様性な人たちも活かすソフト設計とは

ホモ・サピエンスは実に多様性に富んだ種である。地球上のさまざまな地域に起源を持つ私たちは、出自に基づく区別を呈する姿をしており、コミュニケーション手段には何千もの言語が存在する。そしてそれぞれの経験、伝統、文化に基づいた異なる思考パターンを持ち合わせている。私たちの脳は、そのすべてに独自性がある。このような特性をはじめとするあらゆる機能を駆使して、私たちは問題を分析し、意思決定を行う。

これらの要素はすべて、私たちがビジネスを行う方法と、職務を遂行するためにツールを使用する方法に直接影響している。ビジネスを上手く進めることは、ほとんどの人にとって課題をともなうチャレンジングなものだ。しかし、ニューロダイバース(神経学的に多様)の特性を有する人々、故Steve Jobs(スティーブ・ジョブズ)氏がかつて述べたような「think different(異なる考えを持つ)」プロフェッショナルたちは、その才能が企業内でしばしば過小評価されるか、未開拓である、独自の類型となっている。こうした企業は、標準化に価値を置き、通常のワークパターンからの逸脱は限定的であることを好む傾向にある。

ニューロダイバーシティ(神経多様性 / 脳の多様性)の役割

ニューロダイバースな資質を持つ(ニューロダイバージェント)人々は、主流派とは異なる方法で情報を処理する。自閉症スペクトラム、失読症、注意欠陥障害(ADD)を持つ人々もその例として挙げられるが、専門家は全人口の40%がニューロダイバージェントであると考えている。

優秀なセールスパーソンほど粘り強さを発揮し「独創的」な考え方をすることが多いことを勘案し、このパーセンテージはセールス専門職ではさらに高くなると思う人も少なくない。あるセールスチームの誰かがスーパースター級のセールスパーソンであっても、彼らが情報や他者とどのようにやり取りするかに影響を与える神経学的変異を持っているという可能性は低い。こうしたことから、ニューロアティピカル(神経学的に非定型)な人々をセールス組織に統合し、彼らを成功に導く知恵についての非常に興味深い議論が生じている。

例えば、セールスパーソンはCRM(Customer Relationship Managementm、顧客関係管理)ソフトウェアシステムを利用している。このシステムでは、すべての記録、ワークフロー、アナリティクスが標準化されており、ユーザーエクスペリエンスはシステムに設定された1つの方法に限定されている。

だが、このような複雑で柔軟性に欠けるシステムを誰もが最適に使用できるわけではない。特に、ユーザーインタラクションレイヤーが非常に厳しく制限されている場合はなおさらだ。ニューロダイバースな人々の多くは、特に「独断的」なアプリケーションを使うことに困難を感じる。このようなアプリケーションでは、ユーザーに特定の作業方法を押し付ける傾向があり、ときにユーザーの人間性のすべての面、つまり情報を処理し、ワークフローをナビゲートするユーザー独自の方法を考慮しないこともある。そのため、ほとんどのセールス組織において、最も高いパフォーマンスを発揮するセールス担当者は、CRMを最低限しか更新していないことが多い。ノートテイキングアプリケーション、タスク、スプレッドシートなどの基本的なツールで取引のパイプラインを管理しているセールス担当者が多いのも、こうした理由からだろう。

ニューロダイバースなプロフェッショナルは、異なる視点と強みをもたらし、しばしば現状に挑戦する。思考の多様性が、特別なやり方で組織に力を与えるのだ。

企業はニューロダイバースの人材から何を得るべきだろうか?

JP Morgan(JPモルガン)は、2015年にニューロダイバーシティのパイロットプログラム「Autism(自閉症)at Work」を立ち上げた。その結果は注目に価するものであった。このプログラムに参加した従業員は、同僚よりも48%早く仕事を完了し、92%生産性が高かった。オーストラリアのDepartment of Human Services(福祉省)の別のパイロットプログラムの結果によると、同組織のニューロダイバースなソフトウェアテストチームは、ニューロティピカル(神経学的に定型)なチームよりも30%生産性が高くなっていた。

自閉症の人の多くは細部にまで強いこだわりを持つことが知られている。例えば、自閉症スペクトラムの7歳の少年は、歴史上のあらゆる難破船の詳細を暗記している。この種の情報への集中と欲求は、適切な役割に利用されることで、驚くべきポテンシャルが生み出される。自閉症の人材は、データアナリティクス、技術サービス、ソフトウェアエンジニアリングなど、知識経済の急成長分野の一部に理想的に適していることも多い。実際、Tesla(テスラ)のCEOであるElon Musk(イーロン・マスク)氏は、自身が自閉症の一種であるアスペルガー症候群であることを最近明らかにしている

ニューロダイバーシティの別の領域として、独創的な考え方をする人は失読症であることが多い。世界を変革した失読症の人々について考えてみよう。Steve Jobs(スティーブ・ジョブズ)氏、Richard Branson(リチャード・ブランソン)氏、Bill Gates(ビル・ゲイツ)氏。これはほんの一部の例にすぎない。彼らに共通しているのは、世界を違った目で見る能力である。

ソフトウェアのジレンマ

企業はこうしたメッセージを意識し始めている。ニューロダイバージェントの従業員は才能と貢献の巨大な源泉として評価されるべきであるという認識である。同時に、2020年の出来事をきっかけに、あらゆる種類の社会的不公平に対する意識が高まり、より多くの組織がニューロダイバーシティを多様性、公平性、インクルージョンの取り組みの一環として認識するようになった。

しかしこれまでのところ、焦点が当てられているのは、雇用、トレーニング、オンボーディングプロセス、さらにはオフィス設計(私たちがオフィスに復帰した場合)がどのようにしてニューロダイバージェントの人々にとってより包括的になることができるのかということだ。例えば、SAP(エスエイピー)とMicrosoft(マイクロソフト)は、ニューロアティピカルの従業員をより多く雇用する取り組みを拡大している。

こうしたイニシアティブは重要であるが、ソフトウェア企業は一歩進んで、中核的な設計レベルでアプローチを変える必要があると私たちは考えている。

多くのソフトウェアは、ユーザーの視点からすべてのものがどのように感じられ、どのように流れるかについてほとんど、またはまったく配慮することなく、ユーザーに特定の作業方法を課している。そしてその過程で、この硬直的なシステムは、ニューロダイバースな人々を排除してしまう。その結果、ユーザーは日々の業務で課題に直面することになる。これまで提供されてきたツールは、標準化という名の下に、情報の処理方法やワークフローの操作方法に適合していないのである。そして、組織はツールやシステムの適用状況が不十分であることに悩まされている。

このようなことを意図的に行っているベンダーは存在しない。ただ、実行して良い結果を出すのは難しいということである。しかし、あらゆるユーザーを念頭に置き、すべてのユーザーが同じように効率的かつ生産的になれるような、共感できるソフトウェア設計を追求することは、すべてのソフトウェア企業にとってコアバリューとなるはずだ。それは、すべての「ユーザー」が同じではないことを認識し、尊重することから始まる。そうすることで、より多くの人々が自然に利用できる、より柔軟でアプローチしやすいソフトウェアを設計する道が開けてくるだろう。

セールス組織がニューロダイバージェントの人材を多く擁しているとしたら、間違った種類のツールがもたらす影響を想像してみて欲しい。例えば、ADHD(注意欠陥・多動性障害)を持つ人に大量の単調なデータ入力タスクを要求するCRMソフトウェアのようなものだ。熟練した、ニューロダイバースなセールスパーソンが、自分の潜在能力を十分に発揮するには不適切なツールを与えられたために、フラストレーション、潜在能力の喪失、士気の低下が生じてしまうことを想像して欲しい。

業界全体として、ソフトウェアのユーザーエクスペリエンスについての考え方を広げ、柔軟性を主要な設計原則として組み込む時期がきているといえるだろう。

編集部注:本稿の執筆者Pouyan Salehi(プーヤン・サレヒ)氏は、Scratchpadの共同設立者兼CEO。

画像クレジット:Hiroshi Watanabe / Getty Images

原文へ

(文:Pouyan Salehi、翻訳:Dragonfly)

Xboxとスペシャルオリンピックスが知的障がい者のためのeスポーツイベントを初開催

ゲーミング全般がアクセシビリティに配慮する方向にある中、eスポーツはあまりそうではない。一般のスポーツと同じく、そこは本質的に競争世界であり、ある意味で排他的だ。Xbox(エックスボックス)とSpecial Olympics(スペシャルオリンピックス)は、競争とインクルージョンを組み合わせた新たなイベントの共同開催された。

今週、スペシャルオリンピックスのアスリートたちは、Rocket League(ロケットリーグ)、Madden NFL 22(マッデンNFL 22)およびForza Motorsport 7(フォルツァ・モータースポーツ7)のトーナメントで競い合った。賞品は、名声とプライドに加えて、スペシャルオリンピックスのセレブサポーターの1人とプレイできることだ。バスケットボールNBAのスーパースターであるJayson Tatum(ジェイソン・テイタム)、アメリカンフットボールNFLのレジェンドであるJamaal Charles(ジャマール・チャールズ)、女子バスケットボールWNBAのスーパースターJewell Loyd(ジュエル・ロイド)、プロレスWWEのスーパースターDominik Mysterio(ドミニク・ミステリオ)とEmber Moon(エンバー・ムーン)というスーパースターたちだ。

「このトーナメントはeスポーツをよりアクセシブルにし、スペシャルオリンピックスのアスリートたちに新たな競争の場を与える重要な一歩です」とXbox Social Impact(エックスボックス・ソーシャル・インパクト)代表のJenn Panattoni(ジェン・パナトニ)氏が語る。「Xboxは、Xbox Adaptive ControllerやCopilot、音声テキスト変換など、数多くのアクセシビリティ機能とプロダクトに投資してきました。こうような継続した取り組みの目的は、プレイヤーが間違いなく歓迎されていると感じ、Xboxプラットフォームの一員になれることです」。

トーナメントは録画され、今週中に配信されるとともに米国時間9月18日土曜日の「セレブリティーショーケース」でハイライトが放映される。スケジュールはこちらの投稿で確認できるが、Xbox TwitchチャンネルSpecial Olympics YouTubeチャンネルをただ眺めるのもいいだろう。

関連記事:マイクロソフトがXboxやPC用ゲームのアクセシビリティをテストする開発者向けサービスを開始

私がこうしたイベントを取り上げたいのは、ゲーミング世界では長年アクセシビリティが二の次にされてきたからだが、今こうしてデベロッパーやパブリッシャー、パートナーたちの大きな行動によって状況が改善されようとしている。Microsoft(マイクロソフト)のXACがすばらしい例で、最新のゲーム、Ratchet & Clank(ラチェット&クランク)はビジュアル、オーディオ、難易度オプションの装備を一式備えている。eスポーツが多様性をもっと必要としている分野であることは間違いないが、参加しているプレイヤーたちは喜んで協力してきた。スペシャルオリンピックスのアスリートであるJose Moreno(ホゼ・モレノ)氏とColton Rice(コルトン・ライス)氏に思いを聞いてみた。

競技ゲームは前よりアクセシブルになってきたと思いますか?

ライス:競技ゲーミングは間違いなく以前よりアクセシブルになっています。ゲームがアクセシブルになるだけでなく、アクセシビリティによって障がいをもつ多くの人たち競技ゲームのプレイヤーになっています。知的障がいをもつ人たちは常に全力で戦おうとしています。私たちは他のみんながやっているのと同じことをやりたくて、時々そのためにちょっとした力添えが必要なだけです。

モレノ:競技ゲーミングはよりアクセシブルになっていると思います。Microsoftが知的障がいや身体障がいをもつ人たちの利用できる、つまりすべての人たちが利用できるビデオゲームコントローラーを売り出したからです。私は生まれながらのゲーマーなので、eスポーツにおけるアクセシビリティは革新的な出来事です。アクセシブルなゲーミングは私の子ども時代にはありませんでした。今はあらゆる能力の友だちとプレイできて誰もが参加できるのでずっと楽しくプレイしています。

スペシャルオリンピックスのアスリートであるコルトン・ライス氏(左)とホゼ・モリノ氏(右)(画像クレジット:Special Olympics<)

どのように変化を経験していますか?

モレノ:私が思うに、ビデオゲーム業界がより多くの知的障がい者を受け入れるほど、ビデオゲームコミュニティは、私たちが他の人と同じようにビデオゲームをプレイするのが大好きだということを知るようになります。そしてGaming for Inclusion(ゲーミング・フォー・インクルージョン)のようなイベントを通じて、私は競技に参加できるだけでなく、私を歓迎して仲間に入れてくれるゲーマーコミュニティの一員になれました。

ライス:知的障がいをもつ人たちは細部に注意を払うスキルをもっています。何かをすることに集中し、自分にできるベストになるまで練習します、それを楽しんでいる時には特に。そしてゲーミングはその1つです。障がいを持つ人達は学習に時間が必要なだけですが、情熱をもてるものに専念した時、成功するまでやめることがありません。

デベロッパーやパブリッシャーなどに期待することはなんですか?

モレノ:ビデオゲームやコンピューターゲーム全般のデベロッパーやメーカー、パブリッシャーには、ビデオゲームに関わる仕事に知的障がい者を増やしていほしい。知的障がいをもつ人たちはさまざまな役割を果たすことができて、ゲーミング体験を改善するユニークなものの見方を教えてくれます。パブリッシャーとデベロッパーは障がいをもつ人たちから新たな見識を得られます。たとえばストーリーラインに知的障がいをもつ人たちが登場したり、ゲームそのものに出てくることなどです。私たちはこのプロセスにぜひ参加したい。そしてゲーム業界のフォーカスグループに参加したり、クリエイターとして本格的な仕事につきたい知的障がいをもつ熱烈なゲーマーはたくさんいます。

ライス:これらのゲームを作っている企業は、誰もが楽しめる高品質なゲームを作ろうとしています。ゲームをもっとアクセシブルにするためにできることはまだたくさんあります。例えば知的障がいをもつゲーマーが新しいゲームのやり方を学ぶ時、説明が読みにくいとイライラします。何年もプレイしたゲームの新しいバージョンのプレイ方法を知るために何時間もかかることがあります。それは知的障がいをもつ人たちにプレイや競技をする能力がないという意味ではありません。身につけるためにもっと良いアクセシビリティツールが必要なだけなのです。

ゲーム会社がアクセシブルでインクルーシブなゲームを作りたければ、開発プロセスに知的障がいをもつゲーマーを参加させて「読みやすい説明」や初心者向け説明の作成やテスト、あるいはゲームのレベル間のナビゲーションをシンプルにする方法を見つける手助けをしてもらうことだ。ゲーミングはコミュニティを作って取り残されたと感じている人たちとつながることができる。アクセシビリティはあらゆる人たちが楽しむことを可能にする。


この競技やオンラインゲーミングのその他のイベントは、困難な数年の間、スペシャルオリンピックスコミュニティが繋がり続け、アクティブでいるために非常に重要だ。

「スペシャルオリンピックスはMicrosoftと長い間、パートナーシップを続けており、スペシャルオリンピックス活動のアスリートや家族に大きな価値を与えています」と同組織の最高情報・テクノロジー責任者であるPrianka Nandy(プリアンカ・ナンディー)氏は語る。「新型コロナウイルス(COVID-1)パンデミックの中、私たちの大きな心配事はアスリートたちの安全と健康です。彼らはウイルスによる有害あるいは致命的被害を受ける最も弱い立場にあります。パンデミックのために何千という恒例の対面イベントや競技が中止や延期に追い込まれました。これはアスリートたちがチームメイトやコーチや友人たちとつながったり、一緒にいる楽しさを体験するを失ったことを意味します。今も私たちの目標は、スペシャルオリンピックス活動の認知を向上し、私たちの驚くべきアスリートたちの成果と希望と夢を叶えるとともに、ゲーミング・コミュニティにおける知的障がいをもつ人たちに対する姿勢を変え、ゲーミングが誰にとっても楽しくインクルーシブになりうることを常に忘れないことです。

関連記事
【コラム】アクセシブルなゲーミングの未来を創る
ホンダ新事業創出プログラムIGINITION第1号のAshiraseが5000万円調達、視覚障がい者向け単独歩行ナビを2022年度製品化
【コラム】アクセシビリティを最初からスタートアップのプロダクトと文化の一部にする
画像クレジット:Microsoft / Special Olympics

原文へ

(文:Devin Coldewey、翻訳:Nob Takahashi / facebook