Womboの「Dream」は言葉で絵を描くことができるAI搭載のアートアプリ

この10年間、AIの現実を変える力はますます忙しくなっている。コンピュータービジョンを利用した3Dジオラマ、流行を仕掛けるスタイル転写、バイラルな写実的自撮りチューニング自撮りレタッチフェイススワップ、そしてもちろんディープフェイク、その他にも自撮りフィルター(ああ、「Disneyfying=ディズニー化する」カートゥーンレンズ!)による軽薄な(そして愉快な)楽しいものもたくさんある。

AIを使ったビジュアルリミックスは、注目を集めることができることを繰り返し証明してきた。しかし、AIが生成した効果の目新しさがなくなると、「注目」を維持することが難しくなる(自撮りレタッチアプリにはそのような問題はなく、リアリティを高める機械学習の需要は絶え間なくある)。

この間のAIを利用した合成メディアの発展で最も注目すべきは、これまで以上に強力なモバイル処理ハードウェアに助けられ、これらのビジュアルエフェクトの速度が向上したことだ。

完成までの待ち時間を大幅に短縮できるようになったこと。これは、ニューラルネットワークやGAN(Generative Adversarial Networks、敵対的生成ネットワーク)の創造性とパワーを製品化(そして潜在的には収益化)するためのゲームチェンジャーだ。つまり、機械学習のフレームワークが、レタッチやリフレーミング、あるいは生成的なモデリングを行い、そのインスピレーションを人間のプロンプトから得ている。

過去10年間、アプリを使ったビジュアルリミックスのほとんどは、AIを使った純粋な画像生成に対して、レタッチ、リスタイリング、オーグメンテーションに焦点を合わせてきたが、これも変わりつつある。

カナダのスタートアップWombo(ウォンボ)は、社名を冠したAI活用リップシンキング・ビデオ・アプリで注目を集めたが、最近、DreamiOSAndroid)という別のアプリを立ち上げた。この新アプリはAIを使って、テキストのプロンプトに基づいてオリジナルの「アートワーク」を制作する。

超、超シンプルだ。何を描いてほしいか、ただ言葉で表現する。例えば「恐ろしい木」とか「史上最悪のサンドイッチ」などと言って、提供される選択肢(神秘的、バロック、ファンタジーアート、スチームパンクなど)からスタイルを、あるいは「スタイルなし」を選び、作成を押すだけだ。

すると、文字通り数秒(筆者が数えたのは20秒以下)で、完成した「アートワーク」が表示される。

待っている数秒間は、AIの動きを垣間見ることができるので、退屈することはない。アプリにはモデリングが急速に進化していく様子が映し出される。スターターマークから、人間離れした速さでキャンバスに肉付けされ、あっという間に別の完成した構図に到達する。

生成された作品の中には、ちょっと感動するようなものもある。そうでないものもある。

しかし、もちろん、2つのプロンプトが同じ画像を生成することはない。なので、気に入ったものができるまで、同じプロンプトで新しい画像を求め続けることができる。

要するに、クリスマスカード作家やパルプフィクションのイラストレーターは、もう引退できる。

今や誰もが「アーティスト」だ。

とはいえ、実際のアーティストが心配することはあまりないはずだ。というのも、人間の頭脳と身体によって作られた芸術は、世界中に「マシンアート」が溢れれば、その価値は高まる一方だからだ(NFTが作られるたびに「デジタルアート」という言葉の意味が薄れていくように…)。

Dreamアプリの「アート」の質は確かにばらつきがある。長くて複雑なプロンプトはアプリを困惑させるようだ。なので、要求する内容によって、アウトプットの質が変わることがある。

「スタイル」は、多くの模倣がある中でひとつの包括的なスタイルがあるとすれば、具体的で正確というより、抽象的で歪んだものになる傾向があるようだ。ポートレートを依頼しても、写実的に描かれることはない。また、現実よりも幻想的に描かれる(例えば、「聖母子像」のプロンプトでは、暗号化されたボッティチェリではなく、悪名高いスペインの教会の修復に失敗したものに近い作品が提供された)。

しかし、その制作の速さには感心させられる。恐ろしいほどだ。

  1. Dream1

  2. Dream2

  3. Dream3

  4. Dream4

  5. Dream5

  6. Dream6

 

新鮮なアートワークが表示されるとすぐに、このアプリはそれを売ろうとする。「プリントを買う」というオプションがポップアップ表示される。ウェブショップにリンクする、視覚的なトリックを実際の売上に変える巧妙な方法のように見える(「カスタムWomboドリームプリント」を提供しており、マットポスターは20ドル=約2300円から、フレーム付きプリントは45ドル=約5200円からだ)。

もし、このスタートアップが、20秒もかからない処理を20ドル以上の売上に変えることができれば、ちょっとしたお金のパイプラインを作ることになる。

11月末までに、1000万枚以上の画像がすでにユーザーによって作成された。(一方、Google Playアプリは提供開始から1カ月ほどで100万回超のダウンロードを記録している)。

とはいえ、どんな種類のアートでも、ましてや心ない機械が生成した画像であっても、ほとんどの人はそれを飾るための壁のスペースは限られている。なので、こうしたランダムな作品の大半は、しっかりとバーチャルに留まることになる(「AIアート」は、NFTの完璧なネタになるかもしれないが…)。

「AIアート」がファッションや文化的価値においてどのような位置づけになるかは、もちろん興味深い問題だ。

クリップアートやストックフォトより優れているのは確かだ。Dreamアプリが出力する作品は、Ikea(イケア)で買える平均的な「アート」プリントよりも興味深いものになる可能性もある。しかし、その結果は、むしろ気持ち悪いもの、あるいは派生的なもの、あるいは下品なもの、あるいはただ単に奇妙なものであることもある。

そして、それはアートなのか? それとも、数学的プロセスの視覚的出力に過ぎないのか? コードにはそのようなものがないため、本当の感情やアイデンティティあるいは魂の感覚を解釈することができない、人間の創造的スキルの抽象化だろうか? アプリは、ただ言われたことをやっているだけだ。

そして、あなたは本当にコード化された抽象的なものを壁に飾りたいだろうか?

おそらくそうかも? 特に美的感覚に優れていれば。しかし、それはアートなのか、それともただの壁紙なのか? Womboは「アート」プリントではなく、Dream AIの壁紙や印刷されたマウスマット、Tシャツ(商品)を販売すべきなのかもしれない…。

あれこれ考えることがある。

いくつかはっきりしているのは、AIが生成するアートは、遊んでいてとても楽しいということだ。それは、ある種の視覚的な刺激だ。想像力のためのおもちゃだ。

また、間違いなくこの先も存在し続ける。芸術という主観的なテーマにおいて、「より良い」とはどういう意味かにもよるが、AIモデルは今後も「さらに良くなり」続ける(おそらく、生成的なアートのモデルは、その人がイメージしているものに近づいたり、個人的にユニークあるいは意味があると感じるまで微調整できるよう、機械が出力したものをカスタマイズ調整するツールを提供して、ユーザーをクリエイティブなプロセスに完全に参加させることによって、より成功的な結果をおさめるかもしれない。言い換えれば、よりハイブリッドな創作プロセスが、よりパワフルで感動的なアート的結果を生み出すかもしれない)。

また、このような芸術的なAIが今後多数存在し、それぞれが学習データから異なる「フレーバー」や「キャラクター」の視覚的出力を生成することになるだろう。あるいは、異なる「スタイル」を持つアート系AIも出てくるだろう(しかし、おそらく「専門性」の方がコード化されたマークに近い)。

GANベースの画像生成AIツールは他にもたくさんあり、処理速度はずっとずっと遅いのだが、筆者はPixrayのシステムの大ファンであることを白状する(ピクセルアートの出力は特にかわいい)。だが、Womboはこの技術を応用して収益を上げるのが最も早かったようだ。

現実を変える機械学習の次の10年は、かなりの旅になることだろう。

画像クレジット: Natasha Lomas/TechCrunch

[原文へ]

(文:Natasha Lomas、翻訳:Nariko Mizoguchi

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。