【コラム】音声認識が子供のために使えるようになった、今こそ活用する時だ

音声認識テクノロジーが、ようやく子どもたちのためにも使えるようになった。

1999年に私がScholastic Education（スカラスティック・エデュケーション）で同僚たちと音読支援プログラムのREAD 180（リード・ワンエイティー）を作ったときは違っていた。当時私たちは音声対応アプリの導入を考えていた。子どもがコンピュータープログラムに向かって読むと、流暢さと識字能力をリアルタイムでフィードバックする。そして教員は生徒の進歩状況を受け取る。

残念ながら私たちのアイデアはテクノロジーの20年先を行っていたので、音声認識機能を省いたREAD 180の開発を進めることになった。ドットコムバブルの絶頂期でさえ、教室向け音声認識はまだSF世界の産物だった。

人工知能や機械学習を使っても、騒がしい教室の周囲雑音を遮断するために必要なテラバイトのデータを作ることはできなかった。また、大人よりも声の高さやしゃべるパターンの多い子どもたちの複雑な音声を把握したり、さまざまな方言や訛りを認識し、何よりも、システムを使う子どもたちの予測不可能な行動を操るまでには進化していなかった。

Scholasticでは、子どもたちに彼らの知らない何かを習得しているとは言いたくなかったし、実際には正しいのに何かを間違えたと幼い生徒たちに感じさせてしまうことの奥深い意味を私たちは理解していた。

時は過ぎて今。音声認識は子どもたちの発話を認識、理解して、異なる訛りや方言にも対応できるところまで進歩している。たとえばダブリン拠点のSoapBox Labs（ソープボックス・ラボ）は、にぎやかな校庭や教室で聞こえてくる子どもたちの多様な声をモデルにした音声認識技術を開発した。テクノロジーの高い精度と性能のおかげで、小学校教員はこれを使って生徒の進歩を高い規則性をもって測ることが可能になり、個人にあわせた指導方法をとれるようになった。

こうした進歩は、この上なく重要な時期にやってきた。

パンデミック前においてさえ、経済的に恵まれない家族の子どもたちの80%以上が、小学4年生の読み方習熟度に達していなかった。熟練した教育者から1年間切り離され、大人向けに作られたテクノロジーやデジタル格差と戦いながら、生徒たちは例年の87%しか読み方を習得できていない、とMcKinsey & Co.（マッキンゼー・アンド・カンパニー）は報告している。春季の学校閉鎖によって、彼らは平均3カ月分の学習機会を失った。

想像できるように、読み方能力の欠如は有色人種生徒の多い学校で顕著であり、読み方スコアは過去の平均の77%でしかない。

生徒たちが教室に戻ってきた時、音声認識は教育に革命を起こせる。リモート学習や家庭でのエンターテインメントも含めて、子どもたちがテクノロジーとやり取りする方法を転換することによって変わる。音声を利用した読解、さらには数学、言語のプログラムが、子どもたちの習熟度の測定や基本知識の習得における事務的作業を肩代わりすることによって、現場は専門的作業に専念できるようになる。

例えば音声認識を使って生徒の読み方の進歩に関する有益な観察を定期的に生成し、パターンを見つけたり改善の必要な部分を特定したりできる。教師は音声対応ツールが生成した進捗や評価データを見て、それぞれの生徒にあった学習方法を適用し、失読症などの障害を見つけたり、必要な時に介助できるようにスケジュールを組むことができる。

音声利用読書ツールを使うと、授業時間中にすべての生徒が音読してフィードバックを受けることができる。こんなことは教師1人では実現不可能だった。例えば25人のクラスで生徒1人につき15分を費やすと、1人の教師の時間を6時間以上占める、毎日。この種の個人観察と評価は、新型コロナウイルス（以前から）教師にとって永遠の課題だった。自宅学習が導入され、生徒たちが教育的にも情緒的にも過去に類を見ない問題を抱えて学校に戻ってくることで、問題はいっそう深刻化している。

音声認識技術には、教室の公平性を高める可能性もある。人間による読み方能力の評価は、結局のところ極めて主観的であり、評価者の偏見によって最大18％の偏差が見られたという最近の研究報告もある。現在利用可能な子ども中心で精度の高い音声認識は、訛りや方言によらずどの子どもの声も理解することで、人間の必然的な偏見を排除することができる。

今後数年のうちには、このテクノロジーがあらゆる教室で授業の一部となり、年少者の読み方（および数学や言語）能力を高めるようになるだろう。教育者は、この技術をより戦略的に自らの授業に取り入れられることに気づくだろう。そしてこれは、新型コロナ時代に切実に求められているものへの期待を大きく高める。それは読解能力を著しく改善し、世界的な読み書き能力問題に、深く本格的に取り込むことのできるテクノロジーだ。

編集部注：本稿の執筆者Mergery Mayer（マージェリー・メイヤー）氏は、Scholasticで教育担当プレジデントを25年間務めている。

画像クレジット：Flashpop / Getty Images

［原文へ］

（文：Margery Mayer、翻訳：Nob Takahashi / facebook ）

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。 TechCrunch Japan の投稿をすべて表示