Nvidiaの新アルゴリズムでペットの顔を他の動物に変換

Nvidiaが開発した新たなアルゴリズムを使いペットの顔を他の犬種や動物に変換することができる。

その変換を可能とする「PetSwap」と呼ばれるプロジェクトは、Nvidiaの研究者たちが開発した、教師なしで少量のデータから画像変換を学習するアルゴリズムのFew-Shot Unsupervised Image-to-Image Translation(FUNIT)を使用する。

FUNITのフレームワークはGenerative Adversarial Networks(敵対的生成ネットワーク、GAN)が基となっている。リアルなニセ画像や動画、「ディープフェイク」の背後に存在するのがGANだ。

研究者たちはFUNITの論文で、人間は、例えば初めて虎を見た場合でも、虎がどのように寝そべるかは簡単に予想できる、と説明。猫や他の動物が寝そべっているところを見たことがあるからだ。

だが、機械学習のアルゴリズムにはそれは難しい。そこで開発されたのがFUNIT。

FUNITでは、アルゴリズムは「少量のサンプル画像」に基き、与えられた画像の変換後の姿を推測する。

FUNITは人間の持つ「蓄積された知識から物事を推測できる」能力にインスパイアされており、従来のアルゴリズムは膨大な訓練データを必要とし、「利用(シーンが)限られてしまう」ため、開発された。

僕の妹、シャーリーの画像を使ってPetSwapのデモを試してみた。結果は以下のとおり。画像1がシャーリー、2から16は変換後の画像だ。

僕の写真を使った場合、結果は以下のとおり。

なお、PetSwapのデモを使用することで、利用規約に書かれているように、Nvidiaに画像を利用するライセンスを与えることとなるので、注意が必要だ。

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。