Nvidiaが開発した新たなアルゴリズムを使いペットの顔を他の犬種や動物に変換することができる。
その変換を可能とする「PetSwap」と呼ばれるプロジェクトは、Nvidiaの研究者たちが開発した、教師なしで少量のデータから画像変換を学習するアルゴリズムのFew-Shot Unsupervised Image-to-Image Translation(FUNIT)を使用する。
FUNITのフレームワークはGenerative Adversarial Networks(敵対的生成ネットワーク、GAN)が基となっている。リアルなニセ画像や動画、「ディープフェイク」の背後に存在するのがGANだ。
研究者たちはFUNITの論文で、人間は、例えば初めて虎を見た場合でも、虎がどのように寝そべるかは簡単に予想できる、と説明。猫や他の動物が寝そべっているところを見たことがあるからだ。
だが、機械学習のアルゴリズムにはそれは難しい。そこで開発されたのがFUNIT。
FUNITでは、アルゴリズムは「少量のサンプル画像」に基き、与えられた画像の変換後の姿を推測する。
FUNITは人間の持つ「蓄積された知識から物事を推測できる」能力にインスパイアされており、従来のアルゴリズムは膨大な訓練データを必要とし、「利用(シーンが)限られてしまう」ため、開発された。
僕の妹、シャーリーの画像を使ってPetSwapのデモを試してみた。結果は以下のとおり。画像1がシャーリー、2から16は変換後の画像だ。
僕の写真を使った場合、結果は以下のとおり。
なお、PetSwapのデモを使用することで、利用規約に書かれているように、Nvidiaに画像を利用するライセンスを与えることとなるので、注意が必要だ。