コンピュータ同志がパックマンを教えあって機械学習を改善する

今日が4月1日でなければ、いかにこれがすばらしいかを理解してもらえたのだが、私の知る限りこの研究が掲載されたのは数日前のことであり、完全に真実だ。要するに、ワシントン州立大学の研究者たちは、コンピューター同志が教え合うことによる機械学習の実験をしている。実験は、1台のコンピューターがパックマンの遊び方を別のコンピューターに、単にプログラムをコピーするのではない方法で教える。

「われわれはアドバイスを与えるためのアルゴリズムを設計し、そのアドバイスが最大の違いを生むのはいつかを調べた」とAIを専門とするMatthew E.Taylor教授は言った。教える側のコンピューターは、他のコンピューターに、「うまく」プレイする方法、即ち、ゴーストに食べられることなく、最大のポイントを得るところを「見せる」。これらの先生生徒ペアたちは、StarCraftの遊び方も教えあい、ある時点で、生徒が先生を越えた。

リリース文より:

本研究において研究者らは、先生ロボットがアクションのアドバイス、即ち生徒にいつ行動するべきかを教えることに集中するようプログラムした。ティーンエージャーを持つ親なら誰でもわかるように、コツはいつアドバイスを与えるべきかを知ることにある。全くアドバイスを与えなければそのロボットは教えていない。しかし常にアドバイスを与えていると生徒はうるさがって先生をしのぐほど学習しない。

この研究には、機械学習 ― ロボットの集団行動等 ― 、人間とコンピューターの相互作用や学習といった応用分野がある。もしロボットが別の明らかに鈍いコンピュータにパックマンの遊び方を教えることができるなら、ロボットが人間の生徒にどんな数学や科学のアドバイスを与えられるか想像してみてほしい。

[原文へ]

(翻訳:Nob Takahashi / facebook