Magic Ponyは既存データからニューラルネットワークで全く新しい画像をリアルタイムで生成する

2016-04-15-magicpony
The source image on the left was used to generate the one on the right.

(左側がオリジナルのしっくいが剥がれてかけたレンガ壁の画像。右側はニューラルネットワークを用いて新たに生成された画像)

イギリスのスタートアップは畳み込みニューラルネットワーク(convolutional neural network=CNN)を利用したユニークなソフトウェアを開発した。機能はAdobeの画像ソフトのコピースタンプや修復ブラシに似ているが、画像の隙間を単純に既存画像で埋めるのではなく、まったく新しい画像データを生成する点が異なる。

新しい画像は既存画像よりサイズが大きくなり、描写も詳細になる。そう聞いただけではにわかに信じがたい。まるで魔法のような機能だ。おそらくそれがこのスタートアップがMagic Ponyと名乗る理由なのだろう。

このスタートアップは半ステルス状態からわずかに脱したところだ。 Magic Ponyの開発者はシステムに同一の画像やビデオを異なる精細度で供給し、両者の差異を学習させたという。MIT Tech ReviewにMagic Ponyのテクノロジーの最初の成果が掲載されている。

われわれは人間の顔がどのようなものであるかよく知っている。そこで荒い画像からでも顔の細部を補うことができる。Magic Ponyの人工知能はこれと同様本来はどのような情報が含まれていたはずであるかをピクセルごとに推測する。この外挿法によって画像の細部が補われる。

たとえば、ひどくブレたビデオ画像を、元画像を推測することによって見やすい画像に置き換える。システムは画像が「本来どのようなものであったか」を判断できるので、どんなにひどくノイズが混入していても、それらを取り除いて文字なら文字を正確に復元できる。ピクセルのパターンが人間の顔を示していればシステムは人間の顔のあるべき状態に基いてシャープネスを高め、見やすくする。

screen_compare

クリックすると拡大されるので画像を比較しやすくなる。

当面きわめて有望な応用は、クライアント側で標準的なGPUだけを使って低品質なストリーミング・ビデオをリアルタイムで高品質に改善するようなアプリだろう。各種の高機能なビデオ・フィルターは市場に出回っているものの人工知能を高度に利用したMagic Ponyのテクノロジーはそれらを大きく上回る可能性がある。

画質の改良に加えて、Magic Ponyのシステムはそれまで存在しなかった新しい画像を生成することもできる。システムは輪郭線の検出といった低レベルの機能だけでなく、画像の全体的構造や何を意味しているかといった高レベルの認識も可能だ。人工知能はこれに基いて、既存の画像に統計的に類似した画像やオリジナル画像を拡大した画像を創りだすことができる。

記事のトップのしっくいとレンガ壁の画像をもう一度見ていただきたい。右側の画像は高い精度で同じ壁の異なった箇所を描写しているように見える。しっくいやレンガの色彩、質感はきわめて自然だ。システムは左側のオリジナル画像からしっくいやレンガが描写される規則を発見し、それらを用いてより大きい画像を創り出している。

ゲームや対話的CGビデオで、少数のテクスチャー・データからユーザーのコマンドや登場キャラクターの動きに応じてダイナミックにリアルな画像が生成されるところが想像できる。角を曲がった先の建物の蔦がはった壁面や鞘から抜かれた剣のきらめきといったディテールは現在の技術ではオンデマンドでは描写できない。もちろんMagic Ponyのテクノロジーを用いても依然として目視によるチェックとアルゴリズムの調整は必要だろう。 しかしアーティストや技術者がここ長年追求しきたリアルな描写のレベルが長足の進歩を遂げる可能性が十分にある。(画像:John Carmackと Mark Johnson)

Magic Ponyは金額は不明だが、Chris Mairs、Tom Wright、Xen Mateganなど数多くのエンジェル投資家からシート資金を調達している。また2015年のEntrepreneur Firstプログラムの参加メンバーでもある。テクノロジーに早期にアクセス可能となるパートナー契約について共同ファウンダーのRob Bishopは「申し込みを多数受けている」と確認した。ただしパートナー名は明かされていない。

6月にラスベガスで開催が予定されているコンピューター・ビジョンのカンファレンス、CVPRでMagic Ponyのニューラルネットワーク・テクノロジーとその応用についてさらに詳しく知る機会があるはずだ。

[原文へ]

(翻訳:滑川海彦@Facebook Google+

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。