GaNの採用で、2020年になっても充電器はまだまだおもしろい

まあ聞いてよ。充電器は確かにセクシーじゃない。プレゼンでおいしいことを言っている充電器メーカーも、とっくにそれを承知だ。電子機器のアクセサリーにはろくなものがない、と思うきっかけにもなりそうだ。ドングルやコードラップもそうだろう?

でも、充電器にはまだ十分おもしろい要素がある。今が2020年で、しかも有線でもだ。そのキーワードは、窒化ガリウム(GaN)だ。この素材には重要な用途がいくつかあり、次世代のワイヤレス技術もその1つだが、現時点で重要なのはたった1つ。それは小型の充電器だ。

昨年のCES 2019では、Ankerのすばらしい小さな充電器について書いた。その後、私のパソコンが15インチのMacBook Proにアップグレードしたので、CESに出品されていた2つの企業に大きなコンピューター用の充電器について聞いてみた。まず、私の大きなパソコンを充電できるか、ということ。そして出張が多いので、デルタ航空などの座席についてるコンセントから外れて落ちたりしないか、ということだ。

これは4時間以上のフライトでは特に深刻な問題だ。

Navitasが推薦したのは、RavPowerとEggtronicの窒化ガリウム充電器で、それぞれ61Wと65Wだ。両者の主な違いは物理的な仕様で、36ドル(約4000円)のRavPowerの方が大きくて分厚い。100ドル(約1万1000円)とかなり高価なEggtronicは、薄くて置きやすい。問題は、各自が充電器に何を望むかということ。どちらもデルタ航空のコンセントで使えるが、実際には何度か外れた。航空機の座席のコンセントには、そもそも無理があるのだろう。

また、61や65Wでは標準の85や87ワットの大きい充電器に比べて時間がかかりすぎる。ポータブル機はずっと充電状態で使うべきなのだろうか。これまで使っていたGoogle Pixelbookの充電器はやめて、自分のバックパックに2つのうちどちらかを入れておこう、と思っている。長旅では、MacBook用の標準充電器だ。充電器について理想を言い出すときりがないが、これが今の結論だ。

どちらの窒化ガリウム(GaN)充電器も、実際に販売されている。

CES 2020 coverage - TechCrunch

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

自分やアイドルの顔と声から抽出した人工遺伝子で「自分だけのアイドル」を作るゲームがあるらしい

ディープラーニングで「アイドル自動生成AI」を開発するデータグリッドは3月19日、東京大学松尾研究室のスピンアウトVCであるDeep30から1500万円の資金調達を実施したと発表した。

このスタートアップが持つ技術はいろいろな意味で非常に面白い。その技術とは、GAN(敵対的生成ネットワーク)と呼ばれるモデルを利用してアイドルの顔画像を学習し、それらの特徴を組み合わせることで「架空のアイドル」の顔画像を生成するというもの。

ここで登場するGANとは、画像などのデータから特徴を学習することで、実在しないデータを生成したり、存在するデータの特徴に沿って変換する技術のこと。例えば、シマウマの画像と走るサラブレッドの画像を学習させることで、実際には存在しない「走るシマウマの画像」を生成することができる。

データグリッドは、この技術を利用してオルツおよびICOVO AGというスタートアップの3社合同で「GENE A.I.dols(ジーンアイドル)」というゲームを開発中だ。このゲームでは、データグリッドがもつ技術により、画像を学習させて「人工遺伝子」を作成し、それを組み合わせていくことによって「自分だけのアイドル」を作ることができる。

また、オルツが持つ話者適応技術(少量の音声データから、その人の音声を真似する技術)を利用することで、アイドルの声も生成する。そうすることで、世界で1つの容姿と声を持つアイドルが生まれるというわけだ。アイドルファンにはたまらないゲームだろう。

それと、この人工遺伝子はこのゲームで生成したアイドルからだけでなく、実在する人物からも抽出することができる。だから、例えば自分の画像や声から抽出した人工遺伝子と、ゲームから生まれたアイドルの人工遺伝子を組み合わせれば、自分とそのアイドルの「子ども」も作り出せてしまう。うーん、じつに奥が深い。

同社は将来的に、ジーンアイドルのVRへの対応、および人工遺伝子に書き込まれたアイドル個々の音声モデルと対話エンジンの開発も行う計画だという。それが実現すれば、VRを使って自分が生んだ架空のアイドルと“会って会話する”ことも夢ではない。

ジーンアイドルは2019年春にリリース予定。気になる読者はこのページからサインアップすることができるので、チェックしてみてほしい。

Facebookの、真に「目を見張らせる」新しいAI研究

赤目やレンズフレアを除去することなど、写真を操作してより良く見せる方法は沢山ある。しかし、これまでのところ、まばたきは良いスナップショットの頑固な敵であることは良く知られている。だがそれも、Facebookによる研究によって変わるかもしれない。この手法は閉じた目を開いた目へと、驚くほどもっともらしく置き換えることができるのだ。

それは、プログラムが特定の領域を類推によって塗りつぶし不要なオブジェクトを消してしまう、インテリジェントな「インペインティング」の例よりも遥かに進んだものだ。例えばAdobeは「コンテキストを意識した塗りつぶし」で似たことを行っていて、ユーザーが望まない対象、例えば突き出た枝や雲を、非常に巧みな類推を使って、まるでなかったかのように消去することを可能にしている。

しかし、ツールの置き換え能力を超越してしまう場合もある。そのうちの1つが「目」の置き換えである。目の詳細で多様性をもつ性質は、システムがそれをリアルに変更あるいは生成することを、実質的に困難にしている。

おそらく歴史上、他の誰よりも多く、まばたきをしている人の写真を保有しているFacebookは、この問題に切り込むことにした。

それはGAN(Generative Adversarial Network)を基本にしている。これは本質的には、自分自身の創造物が実物であると考えるように、自分自身をだまそうとする機械学習システムである。GANでは、システムのある部分が顔などを認識することを学習し、システムの別の部分は認識部分からのフィードバックに基づいて、徐々にリアルになって行くイメージを繰り返し生成する。

左から順に、「原型」画像、ソース画像、Photoshopの目開きアルゴリズム、そしてFacebookの手法。

この場合、ネットワークは、開いた目をもっともらしく認識し複製するように訓練されている。これは既にある程度できているかもしれないが、右に示した例からわかるように、既存の手法にはまだ改善の余地がある。既存のアルゴリズムは、残りのイメージとの一貫性をあまり考慮せずに、人びとの目に対して貼り付けを行うようだ。

これは機械の単純さに由来するものである:開いた目はまわりの皮膚の色を変えたりしないという直感的理解を持っていないのだ(その点に関して言えば、そもそも彼らは目や色などに関する直感的理解を何一つ有していないのだが)。

Facebookの研究者がしたことは、目を開けた対象者を示す「原型」のデータを取り込むことだった。そこからGANはどの目が顔の上に乗るかを学習するだけでなく、特定の個人の目がどのような形や色などになるかも学習する。

結果は非常にリアルなものである:色の不一致や明らかな継ぎ目は存在しない、なぜならネットワークは人間がそのように見えないことを知っているからだ。

テストしてみたところ、人びとは作られた「目の開いた写真」を、本物だと間違えた。言い換えれば半分以上のケースでどちらがどちらかを区別できなかったのだ。写真が間違いなく改変されていることを知っていなければ、おそらくニュースフィードをスクロールしている最中にそれが出てきても気付くことはないだろう。とはいえガンジーは少しばかり奇妙に見える。

まだ時々失敗することもある。ひとの目が部分的に髪で覆われていた場合には妙な結果を生成するし、色を正しく再生成できないこともある。しかし、それらは修正可能な問題である。

ある人の他の写真をチェックして、最新の写真のまばたき部分を置き換えてくれるFacebook上の「目を開ける」自動ユーティリティの有用さは想像できると思う。それは少々気味の悪さもあるが、そうしたやり方は実にFacebookらしい。まあ少なくとも数枚のグループ写真を救うことはできるだろう。

[原文へ]
(翻訳:sako)