Appleの機械学習研究が新たな先端技術をものにしようとしている。最近同社の研究者6名が結成した機械学習グループは、シミュレーション+教師なし学習の新しい方法を 論文で発表した。目的は合成訓練画像の品質改善だ。この研究は、成長の続くAI分野で明確なリーダーになろうとしている同社の意欲を表している。
Google、Facebook、MicrosoftをはじめとするIT既成勢力は、それぞれの機械学習部門を順調に拡張している。毎年発表される数百もの論文によって各社の学術的研究は詳しく公開されているが、Appleの態度は頑なだった ― 魔法は自分たちだけのもの。
しかし今月、AppleのAI研究責任者、Russ Slakhutdinovは近く同社が研究内容を公表することを発表し、変化が表れてきた。チーム初の試みはタイムリーかつ実用的なものだった。
近年、合成画像や合成映像は機械学習モデルのトレーニングによく使われるようになった。コストも時間もかかる現実世界の画像と異なり、合成された画像はコストも低く入手が容易でカスタマイズもできる。
この技法には様々な可能性があるが、わずかな不完全さが最終製品に重大な影響を及ぼすリスクもある。つまり、合成画像で実画像と同じ基準の質を得ることは難しい。
Appleは、 Generative Adversarial Networks (GAN) を使用して合成学習画像の質を改善することを提案している。GANは新しいものではないが、Appleはこの目的に合わせて修正を加えている。
上位レベルで、GANは競合するニューラルネットワーク間の敵対関係を利用して動作する。Appleの場合、シミュレーターが合成画像を生成し、それに精緻化処理を施す。改善された画像は、実画像と合成画像を区別する識別装置に送られる。
ゲーム理論の観点から見ると、各ネットワークは2人プレーヤー・ミニマックスゲームを争っていることになる。この種のゲームの目的は、発生可能な最大損出を最小に抑えることだ。
AppleのSimGANというGANの派生システムは、局所的敵対損失と自己規制の両方の項を最小化しようとする。ふたつの項は合成画像と実画像の差異を最小化すると同時に、合成画像と改善画像の差を最小化してニュアンスを保持しようとする。これは、修正を加えすぎると教師なし学習の意味がなくなるという考えに基づいている。もし樹木が樹木のようには見えず、モデルの目的が自動運転車が木をよけるためだとすれば、意味がない。
研究チームは修正の微調整も行っている。例えば、モデルが改善画像の一部を見るだけでなく修正履歴まで考慮することによって、あらゆる時点で生成画像を偽物と識別できるようにする。Appleの研究の詳細は、”Learning from Simulated and Unsupervised Images through Adversarial Training. ” という題名の論文に書かれている。
[原文へ]
(翻訳:Nob Takahashi / facebook)