AIでモデルのポーズを変えるアドビのProject Strike a Poseは

毎年開催されるAdobe MAXカンファレンスの目玉の1つは「スニーク」セッションだ。このセッションで同社は最先端研究をしているプロジェクトをいくつかお披露目する。研究成果は主力製品であるCreative Cloudのアプリに組み込まれることもあれば、クールなデモだけのこともある。2021年のAdobe MAXのスニークで興味深かったものといえば、Project Strike a Poseだ。

こんな課題を解決したいとしよう。使いたいモデルの写真はあるのだが、そのモデルがあなたの希望するポーズをとっている写真がない。こんなときにProject Strike a Poseは、別のモデルがあなたの希望するポーズをとっている写真をサンプルにして、AIプラットフォームのAdobe Senseiの活用により、使いたいモデルがそのポーズをとっている写真を自動で生成する。基本的にはモデルのポーズに関するStyle Transferのようなものだ。

画像クレジット:Adobe

サンプルのポーズと大まかに似せただけでもなく、顔を入れ替えただけでもない結果になるのが印象的だ。少なくとも、このプロジェクトに関わるAdobeのリサーチサイエンティストであるKrishna Kumar Singh(クリシュナ・クマール・シン)氏が見せたデモでは、Project Strike a Poseのニューラルネットワークは、例えばモデルが着ている服、モデルの頭の角度、靴までも適切に再現できているようだった。

しかも、モデルが背を向けた写真が欲しいときにもこのツールを使える。ただし下の写真の通り、髪は若干ずれている。

画像クレジット:Adobe

Adobeはこのプロジェクトで使われているアルゴリズムのトレーニングについては説明していない。しかしこのようなニューラルネットワークをトレーニングするには、モデルがさまざまなポーズをとっているサンプルをたくさん使う必要があるのは明らかだ。シン氏はこれまで敵対的生成ネットワークに関する多くの研究をしてきたので、この新しいプロジェクトはすでにその技術をベースにしている可能性がある。

現時点では実験的な研究プロジェクトで、Maxのスニークで披露されるものはたいていそうだが、これがPhotoshopなどのツールに組み込まれれるかどうかはわからない。もしこれがデモと同じように動作するなら(Adobeは人種の異なるモデルを使ってもソフトウェアに問題はないと言っている)、Photoshopなどのアプリ、さらには画像を操作するスキルがさほど高くない人々がすでに広く使い始めているAdobe Sparkなどでも、この機能は間違いなく多くのユーザーに歓迎されるだろう。

残念なことだが、このようなシステムを悪用する方法も容易に想像できる。ディープフェイクや写真の操作が問題となる現在、技術に明るくない人が有名人、あるいは他の誰かの名誉を傷つけるような画像を簡単に作れてしまう。もちろん今でもそうしたことは可能だが、うまくやろうとすればある程度のスキルは要る。Project Strike a Poseなら数回のクリックでできてしまうのだ。

画像クレジット:Adobe

原文へ

(文:Frederic Lardinois、翻訳:Kaori Koyama)

【レビュー】グーグル「Pixel 6 Pro」、ハード面でも真のブレークスルーを達成

家電製品の領域では、ヘイルメリーパス(アメフトで逆転勝利を狙って行ういちかばちかのロングパスのこと)を何度も出すことはできない。それがたとえ大企業であってもだ。例えば、Microsoft(マイクロソフト)の携帯電話に対する長年の思いを見てみよう。かつて圧倒的な強さを誇ったNokia(ノキア)を72億ドル(約8200億円)で買収しても、Apple(アップル)やSamsung(サムスン)と肩を並べることはできなかった。


初期の失敗を除けば、Google(グーグル)のモバイルハードウェアの野望は、全体的に見てより成功しているほうだ。しかし、Pixelシリーズは、このカテゴリーに費やされたリソースを正当化するのに必要な大ヒットを記録していない。これらのデバイスは、よくいえば、Googleがモバイルソフトウェアや機械学習で取り組んでいるクールなものを紹介するためのショーケースであり、悪く言えば、一種の劣等生のようにも感じられてきた。

スマートフォンのような混雑した分野に参入することは決して容易ではなかったが、同社が波風を立てずに奮闘している姿は、正直なところ奇妙なものだった。また、他社フラッグシップスマートフォンがどれも全体的に非常に優れており、この分野での継続的な優位性が主にこれまでの前進する勢いの結果によってもたらされている場合、これを達成させることは二重に困難だ。さらに面倒なことに、Googleは、真のブレークスルーはすべて「ソフトウェア側」で起こっていると長年執拗に主張してきた。

AppleやSamsungなどがスペック競争に明け暮れるのは時間の無駄だというのは、確かにおもしろい命題だ。確かにその通りだと思うが、少なくとも現状では、ハードウェアに依存しないことは不可能だ。人工知能や機械学習の重要性が増していることは間違いないが、カメラレンズ、ディスプレイ、プロセッサーのすべてが重要であることに変わりはない。少なくとも、今のところは。

Google Pixel 6 Pro

2020年5月、Pixelチームの主要メンバーが会社を去ったことが明らかになった。これは、大きな見直しの一環であり、その再考はさらに進むことになる。2021年の8月には、Sundar Pichai(サンダー・ピチャイ)CEOが、同社が4年前から自社製の半導体を開発していることに言及した。Qualcomm(クアルコム)のようなチップメーカーからの脱却は、ヘイルメリーパスを出す(リスクをとる)上で、大きな意味を持つ。そして、それには大きな携帯電話が必要になってくる。

2020年の同時期に発売された「Pixel 5」は、旧来の方法の最後の名残となった。大きな変化は一夜にして起こるものではなく、ましてや主要な家電製品ラインに関しては1年で起こるものでもない。Googleにとっては残念なことに、小規模なリストラのニュースが発売前に流れてしまい、Googleでさえ、より良い時代が来るのはまだ随分先だということを認めざるを得なかった。今回の「Pixel 6」が、Googleの製品ラインを決定するものではないが、何世代にもわたって刺激のない販売を続けてきたGoogleは、物事が正しい方向に向かっていることを証明する必要がある。

その基準からすれば、本モデルは大成功といえるだろう。

Google Pixel 6 Proレビュー

スペックにこだわらないGoogleの姿勢とは対照的に、優れたソフトウェアにはやはり優れたハードウェアが必要だということを証明している。Pixel 6は、決してオーバークロックされた最先端のスペックマシンではないが、適切なハードウェアを与えられたときに、Googleの優れたソフトウェアにどんなことができるのかを示す例となっている。

しかし「Pixel 6 Pro」を手にした瞬間、何かが違うと感じた。この端末は、Pixelの系列というよりも、Samsungの製品のように感じられる。Galaxyシリーズを彷彿とさせるサイズ感と重厚感があり、曲面ガラスのエッジによってその美しさはさらに増している。

発表当日、正直なところ最も驚いたことの1つは、オンラインコミュニティで曲面ガラスについての意見がいかに二極化しているかということだった。今回の発表では、Samsungのようにエッジを用いた機能を盛り込むのではなく、主に美しい外観を重視した使い方がされている。私が耳にした曲面ガラスに対する最大の反論は、携帯電話の両脇をつまんだときに誤ってタッチスクリーンを作動させてしまうリスクだ。この問題に関しては、私は経験していないし、正直なところ、私は全体的に曲面スクリーンには興味がない。

Google Pixel 6 Proレビュー

6 Proのディスプレイは6.7インチで、512ppiのQHD+(3120×1440)OLEDだ。最大リフレッシュレートは120Hzで、大きくて明るいのがいい。一方、スタンダードのPixel 6は6.4インチ、411ppi、90Hzのディスプレイだ。どちらを選んでも間違いではないが、Proはこの点で優れたアップグレードといえる。前面のカメラはピンホールデザインで、デフォルトの壁紙では見えづらくなっている。

また、下部にはディスプレイ内蔵指紋認証リーダーがあり、すばやくロックを解除することができる。ディスプレイはGorilla Glass Victusで覆われており、背面にはGorilla Glass 6が使用されている。背面の上部3分の1は、大きくてはっきりとしたカメラバーで独占されている。デザイン的には気に入っている。競合他社がこぞって採用している標準的な四角いカメラバーからの良い変化だ。

しかし、このカメラバーにはかなりの高さがあるため、背面に置いたときに携帯電話が斜めになってしまう。しかし、標準的なケースを装着することで、この影響はほとんどなくなるだろう。カメラの配置でもう1つ気になるのは、ランドスケープモードで撮影する際に、手の位置を少し気にしなければならないことだ。この点については、私は特に問題を感じなかったしし、もし問題があったとしても簡単に正すことが可能だ。

  1. PXL_20211020_202724275

  2. PXL_20211020_205606592

  3. PXL_20211020_210136151

  4. PXL_20211020_200038741

  5. PXL_20211020_201037316

  6. PXL_20211020_195716958

  7. PXL_20211020_201141829

  8. PXL_20211020_201930032

  9. PXL_20211020_202455176

  10. PXL_20211020_202856092

  11. PXL_20211020_202906327

  12. PXL_20211020_210449977

カメラバーの上下のガラスにわずかな色の違いがある。これは、Pixelの旧モデルで電源ボタンに採用されていたような、ちょっとした遊び心だ。Googleが、どれも瓜二つの競合製品との差別化を図る方法をいまだ開発し続けてくれていることは明らかだ。ありがたいことに、これはほんの些細なポイントだ。デザイン言語全体は、退屈さと突飛さの間のちょうどよいラインだ。

カメラシステムは、優れたソフトウェアとハードウェアが互いに影響し合うことを示す究極の例といえる。「Surface Duo」と同時にPixel 6 Proをテストしていたのだが、特に光が混ざった状態や光量の少ない状態では、Microsoftのデバイスがしっかりとしたカメラリグを持っているにもかかわらず、(いわば)昼と夜のような違いがでた。

何世代にもわたって独自のカメラシステムを開発してきたことが功を奏したのだと思う。私は、このカメラで撮影できた写真がとても気に入っている。Proに搭載されている4倍の光学ズームもいい感じだ。デジタルでは最大20倍まで可能だが、Googleのコンピュータ写真処理を使っても、すぐに画像にノイズが入るようになってしまう。

標準的なPixelカメラの機能に加えて、いくつかのクールな新機能が搭載されている。「消しゴムマジック」は、Photoshopの「コンテンツに応じた塗りつぶし」ツールと原理的には似ている。不要な背景画像の上に指を置くと、周囲の設定を使ってその部分を埋め、被写体を効果的に「消す」ことができる。しかし、完璧とは言えない。よく見ると、ムラのある部分が見つかるのと、周囲の環境が複雑であればあるほど、一般的に出来栄えは残念なものになる。それでも、アプリに搭載された新機能としては、すばらしい働きをしてくれている。

「アクションパン」も同様だ。この機能は、ポートレートモードと同様に、被写体の背景に擬似的なぼかし効果を加えてくれる。車のような大きくて幾何学的にシンプルな形状のものによく合う。一方、自転車に乗っている人などは、ポートレートのように輪郭周辺部が気になる。「長時間露光」はその逆で、動いているものをぼかし、背景は静止したままにしてくれる。

正直にいうと、私はパンデミックで閉じこもりがちな生活を送っているため、ヒトを撮影する機会があまりなかった。また、2台のカメラと顔検出機能を使って、動いている被写体にシャープな画像を合成する「フェイスアンブラー(顔のぼかし解除)」機能も注目されている。「リアルトーン」機能については、近日中にもう少し詳しく紹介する予定だが、幅広い肌色をよりよく撮影できるようになったことは、大いに歓迎すべきことだ。ただし、この機能も顔検出に依存しているため、問題が発生することもある。

また、Pixelに搭載された一連のテキストツールも印象的だ。私の限られたテストでは、リアルタイム翻訳がうまく機能し、テキスト入力にすばらしい効果をもたらしてくれた。アシスタントの音声入力はうまく機能しているが、音声による絵文字の追加など、時々問題が発生した(おそらく私の発音が悪いのだろう)。また、ドイツ語や日本語に対応した「レコーダー」などの既存の機能に加えて、このような機能が追加されたことは歓迎すべきことだ。

Google Pixel 6 Proレビュー

もちろん、今回のショーの主役はTensorだ。Googleは、現在増えつつあるQualcommの半導体の独占状態を避けて独自のチップを採用する企業の仲間入りを果たした。これは、4年前から計画されていたもので、GoogleがPixelシリーズに今後も力を入れていくことを示す良いサインといえるだろう。今回、同社はPixel 6の新機能の多くが自社製SoCによって実現されているとしている。同社は、最近のブログ記事で次のように述べている。

Google Tensorによって、モーションモード、フェイスアンブラー、動画のスピーチエンヘンスメントモード、動画へのHDRnetの適用など、最先端の機械学習を必要とする驚くべき新しい体験が可能になります(詳細は後述)。Google Tensorは、スマートフォンにおける有用性の限界を押し広げることを可能にし、スマートフォンを画一的なハードウェアから、多種多様なスマートフォンの使い方を尊重し、それらに対応することができるほど大きな知能を持つデバイスへと変えてくれます。

Geekbenchテストでは、シングルコアで1031点、マルチコアで2876点を記録した。これは、Pixel 5の平均値である574と1522を大幅に上回るものだが、Pixel 5はSnapdragon 765Gというミドルレンジのプロセッサーを採用していた。フラッグシップモデルとは言えない。Snapdragon 888を搭載したSamsungの「Galaxy S21」の1093と3715と比較すると、処理能力の点でGoogleの自社製チップにはまだまだ課題があることがわかる。「iPhone 13 Pro」のテストで得られた1728と4604と比較すると、結果はさらに悪くなる。

Google Pixel 6 Proレビュー

バッテリーは、従来のモデルの最大の難点の1つだったが、Googleはこの点を大きく改善した。6には4614mAh、6 Proには5003mAhのバッテリーが搭載されており、Pixel 5の4080mAhからしっかりとアップグレードされている。それがPixel 4からのすばらしい飛躍だった。Googleによると、満充電で24時間使用可能とのことだが、私の適度な使用で26時間ほどもったので、その点では朗報だ。

ここ数年、Pixelのハードウェアと売上は中途半端だったため、Googleは、低迷するモバイル部門を前進させるためのデバイスを本当に必要としていた。これまでの4年間にわたるプロセッサーの開発、6世代にわたるソフトウェア、そしてピカピカの新しいハードウェアが、1つのパッケージにうまくまとめられている。Googleはこれまで、Pixelシリーズは単に新しいAndroidソフトウェアをアピールするだけのものではないと主張してきたが、今回はそれが現実のものとなった。

画像クレジット:Brian Heater

原文へ

(文:Brian Heater、翻訳:Akihito Mizukoshi)

アドビ、次世代Creative CloudでもAIの推進を続ける

ここ数年、Adobe(アドビ)はAIに全力で取り組んできた。2021年のMAXカンファレンスでも、同社のAIプラットフォーム「Sensei」を搭載したほぼすべての製品のアップデートが行われ、その成果が披露された。Lightroomのマスキングツールやプリセットの推奨、Photoshopでの画像間の色のトランスファー、Character Animatorのボディトラッカーなど、さまざまな機能がアップデートされている。


Photoshopを使ったことのある方なら、対象オブジェクトを正確に選択して操作することの難しさをご存知だろう。「自動選択ツール(英語だとMagic Wand Tool=魔法の杖ツール)」を使っても、魔法のようにはいかないことが多かった。2020年、AdobeはAIを使った「オブジェクト選択ツール」を追加した。今回のアップデートではさらに一歩進んで、画像内のさまざまなオブジェクトを自動的に認識する「オートマスキング」が導入された。Adobeは、まだすべてを検出するわけではないということをかなりオープンに認めているが、この機能は時間とともに改善されるだろうとも述べている。

画像クレジット:Adobe

同様に、2020年、Adobeは「ニューラルフィルター」と同社が呼ぶ機能を導入した。これにより、古い白黒画像のカラー化、ポートレートの改善、深度ブラーまたは画像のズームアップなどの機能が追加され、ニューラルネットワークが自動的にすべてのディテールを再作成しようとする。

画像クレジット:Adobe

2021年は「ランドスケープミキサー」という機能が導入されている。いくつかのスライダーを動かすだけで、プリセットを使ったり、または自分でカスタマイズして、例えば秋や冬に撮影されたような写真にすることができる。または、前景が少し暗いけれど、緑のイメージにしたいとしたら、青々とした緑の風景が写っている画像を探してきて、そのスタイルをトランスファーすることができる。

画像クレジット:Adobe

また、以前から搭載されていた深度ブラーは、焦点距離を事後に変更できるようになり、画像内のオブジェクトの周囲をすべてぼかすことに主眼を置いていた従来のフィルターに比べて、かなりプロフェッショナルな印象を与える。

一方、Lightroomでは、写真編集者が新機能を使って空を自動的に選択できるようになった(反転させて空以外のものも選択できる)。また、AIとは関係ないが、Lightroomの「見つける」フィードに「リミックス」タブが追加され、写真家が自分の作品を共有し、他のユーザーに自分が行った編集を見てもらうことができるようになった(変更を許可することも可能)。

ビデオグラファー向けには、Premiere Proに、音楽クリップの長さをビデオシーケンスの長さに合わせて自動的に調整することができる新しいAI機能を追加する。Creative CloudスイートのオーディオエディターであるAdobe Auditionで初めて採用された(やや紛らわしいが「Remix」と呼ばれる)この新機能は、シーケンスが終わったときに曲の途中でフェードアウトしないようにする。音楽クリップを短くする際に、曲の最後がシーケンスの最後に残っているようにオーディオを自動的にカットするという。

画像クレジット:Adobe

Creative Cloudのその他のアップデートとしては「Creative Cloud スペース(Creative Cloud Web)」がある。これは、ウェブ上のファイルやライブラリにアクセス、整理、共有するための新しいハブだ。これはまだプライベートベータ版で、Fresco、Illustrator、XD、Photoshopでのみ利用できる。これは、チームがアセットにテキスト、ステッカー、画像を追加できるリアルタイムのコラボレーションスペースを備えている。なお、これはウェブ上のPhotoshopやXDではない。プロジェクトやアセットを話し合うための場に過ぎない。

画像クレジット:Adobe

しかし、絶望することはない。PhotoshopとIllustratorのウェブ版(パブリックベータ版)も発表され、ブラウザ上での基本的な編集ツールをサポートしている。

その他にも、Creative Cloudのすべてのツールにさまざまなアップデートが行われている。明らかなのは、Adobeがクリエイティブプロフェッショナルやホビイストの作業をより楽にするために、AIに大きく賭けているということだ。ある意味では、SkylumのLuminar AIのような、AIをアプリケーションの中心に据えている競合他社に追いつきつつあるとも言える。しかし、Adobeの優位性は、その機能セットの幅広さであり、新規参入者がこれを再現するのは難しいだろう。

画像クレジット:Pavlo Gonchar/SOPA Images/LightRocket / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Aya Nakazato)

エンタメやAR/VRで人気のAI音声・合成発話「ボイススキン」を手がけるLOVOが約4.9億円調達

「ボイススキン」は、AIベースの音声アシスタントで非常に人気のある機能となっている。Alexaのようなサービスで得られる、役には立つが、無味乾燥でロボットのような発話音声といった、より退屈な側面のいくつかをパーソナライズするのに効果を発揮する。さまざまな企業が自社のサービスを横断して利用したり、サードパーティが作成や応用の目的で使用できるようなボイススキンを構築しているスタートアップが、その成長を促すために資金調達を進めている。

カリフォルニア州バークレーを拠点とする人工知能(AI)音声および合成音声ツール開発企業のLOVOは今週、韓国のKakao Entertainment、Kakao Investment、LG GroupのITソリューションアフィリエイトであるLG CNSが主導するプレシリーズAのラウンドで450万ドル(約4億9000万円)を調達した。

以前の出資者であるSkyDeck Fundと、DoorDashの財務担当副社長Michael Kim(マイケル・キム)氏もこのラウンドに参加している。

調達した資金は、人工知能と合成音声の研究開発を推進し、チームを成長させるために使われる。

「機械学習、人工知能、プロダクト開発からマーケティング、ビジネス開発に至るまで、あらゆる分野で人材を大量に採用する計画です。資金はGPUやCPUなどのリソースの確保にも充てられます」と共同創業者でCOOのTom Lee(トム・リー)氏はTechCrunchに語った。

2019年11月に設立されたLOVOには、共同創業者でCEOのCharlie Choi(チャーリー・チョイ)氏とCOOのリー氏を含めて17人が在籍している。

同社は、LOVOのAIモデルをさらに改良し、AIの音声機能を強化し、現在の市場に存在するあらゆるものを凌ぐより良いプロダクトを開発する計画だとリー氏は語っている。

「私たちの目標は、人々の心と感情に触れるようなAIの音声を提供する世界的リーダーになることです。コンテンツ制作における制約を民主化したいと考えています。私たちは音声関連のあらゆるもののプラットフォームになることを望んでいます」とリー氏は続けた。

LOVOのミッションにより、企業や個人のコンテンツクリエイターは、マーケティング、Eラーニング、カスタマーサポート、映画、ゲーム、チャットボット、拡張現実(AR)、仮想現実(VR)で使用するためのボイスオーバーコンテンツを生成することが可能になる。

「1年少し前にローンチして以来、ユーザーは私たちのプラットフォーム上で500万以上の音声コンテンツを作成してきました」と共同創業者でCEOのチョイ氏は語る。

LOVOは2020年に最初のプロダクト「LOVO Studio」をリリースしている。個人や企業が欲しい音声を見つけたり、ボイスオーバーコンテンツを制作、公開したりするための使いやすいアプリケーションだ。開発者はLOVOのVoiceover APIを利用して、自分たちのアプリケーションに統合された形で、テキストをリアルタイムでスピーチに変換できる。ユーザーは、LOVOのDIY Voice Cloningサービスを使って15分のスクリプトを読むだけで、自分のAI音声を作ることができる。

LOVOは200以上のボイススキンを所有しており、ユーザーのさまざまなニーズに適した言語、スタイル、状況に基づいて分類された音声を提供している。

リー氏によると、世界のテキスト読み上げ(TTS、text to speech)市場は30億ドル(約3300億円)と推定され、ボイスオーバー市場は100億ドル(約1兆1000億円)前後になるという。2021年8月に公開されたResearch Interviewerのレポートでは、世界のTTS市場は2020年の19億4000万ドル(約2127億円)から2028年までに56億1000万ドル(約6151億円)増加すると予測されている。

LOVOはすでに5万人のユーザーを獲得しており、米国のJ.B.Hunt、Bouncer、CPA Canada、LGCNS、韓国のSinhan Bankなど50社以上の企業顧客がいるとリー氏は述べている。

LOVOの4つのコアマーケットは、マーケティング、教育、映画およびゲームなどのエンターテインメント、そしてAR / VRであるとリー氏は語る。Saw(ソウ)シリーズの最新作である映画「Spiral(スパイラル:ソウ オールリセット)」には、LOVOの声が出演しているという。

韓国のエンターテインメント企業からの最新の資金調達を受けて、LOVOはエンターテインメント業界にさらなる相乗効果をもたらすことが期待されている。

Kakao EntertainmentのCEOビジョンオフィスの副社長であるJ.H. Ryu(J.H.リュウ)氏は「LOVOとKakao Entertainmentのエンターテインメント垂直分野、特にウェブ小説や音楽における将来の取り組みとの相乗効果に期待しています」と述べ「AI技術はオーディオコンテンツの新しい市場への扉を開きつつあり、個人の声が知的財産や資産として有効に活用される未来が期待されます」と言い添えた。

SkyDeck Fundの創設パートナーであるChon Tang(チョン・タン)氏は次のように述べている。「オーディオは情報の一形態として独自の魅力を持っていますが、特に大規模に生産するには困難が伴います。LOVOの人工知能ベースの合成プラットフォームは、品質とコストにおいて他のクラウドベースのソリューションよりも一貫したパフォーマンスを示しています」。

LOVOはまた、国際市場へのさらなる進出を準備している。「当社は米国、英国、カナダ、オーストラリア、ニュージーランドで強力なプレゼンスを確立しており、その他の欧州、南米、アジアからもシグナルを受けています」とリー氏は語る。LOVOは韓国にオフィスを構えており、近いうちに欧州への進出を予定していると同氏は付け加えた。

画像クレジット:LOVO

原文へ

(文:Kate Park、翻訳:Dragonfly)

機械学習を使って作物の気候変動への適応を加速するAvalo

気候変動は世界中の農業に影響を及ぼしており、その解決策に単純なものはほとんどない。しかし、何千マイルも離れた場所に移動することなく、暑さ、寒さ、干ばつに強い作物を植え付けることができたらどうだろう?Avaloは、AIを利用したゲノム解析によって、この高温の世紀においてより丈夫な植物を育てるために必要な時間と費用を削減することで、こうした植物の実現を支援している。

アカデミアの世界に入る前にスタートアップを試してみたいと考えた友人2人によって設立されたAvaloは、極めて直接的な価値提案をしている。だがそれを理解するには科学的な知識が少し必要となる。

大手の種子会社や農業会社は、主要な作物の改良版の開発に力を注いでいる。トウモロコシや米について、暑さ、虫害、干ばつ、洪水への耐性を少しでも高めることで、農家の収量と利益を大幅に向上させることができる他、以前は育たなかった場所で植物を育てることも可能になる。

「赤道地域では収穫量が大幅に減少しています。それはトウモロコシの種子が少なくなっているからではありません」と共同創業者でCEOのBrendan Collins(ブレンダン・コリンズ)氏はいう。「塩水の侵入により農地が劣化しているため、農家は高地を移動しています。しかし、苗木を枯らす早春の霜に見舞われます。あるいは、湿度が高く湿った夏に発生する真菌に対処するには、さびに強い小麦が必要です。こうした新しい環境の現実に適応するには、新しい品種を作る必要があります」。

このような改良を系統的に行う上で、研究者は植物の既存の形質を強調する。これは新しい遺伝子のスプライシングではなく、すでに存在している性質を引き出すものである、ということだ。これまでは、例えば遺伝学入門編におけるメンデルのような感じで、いくつかの植物を育てて比較し、目的の形質を最も良く体現する植物の種を植え付けるという単純な方法で行われていた。

しかし現在では、これらの植物のゲノム配列が決定されており、もう少し直接的になる可能性がある。望ましい形質をもつ植物においてどの遺伝子が活性であるかを知ることによって、これらの遺伝子のより良い発現を将来の世代に向けた標的とすることができる。問題は、これを実現するには依然として長い時間を要することだ。10年単位の時間である。

現代のプロセスの難しい部分は、干ばつにさらされた状態における生存のような形質は単一の遺伝子によるものではないという問題からきている。それらは、複雑に相互作用する任意の数の遺伝子であり得る。オリンピックの体操選手になるための単一の遺伝子がないように、干ばつに強い米になるための唯一の遺伝子というものはない。そのため、企業がゲノムワイド関連解析と呼ばれる研究を行うと、その形質に寄与する遺伝子の候補が何百も出てきて、生きた植物でこれらのさまざまな組み合わせを苦労してテストしなければならない。しかもそれを工業的な比率と規模で行うには何年もかかる。

試験目的で栽培されている、遺伝子的分化を検出して番号付けされたイネ(画像クレジット:Avalo)

Avaloの共同創業者でCSOのMariano Alvarez(マリアーノ・アルバレス)氏は「遺伝子を見つけて、その遺伝子を使って何かを行う能力は、実際にはかなり制約されています。こうした形質はより複雑なものになるからです」と語る。「酵素の効率を高めようとするのは簡単で、CRISPRを使って編集すれば済みます。ですが、トウモロコシの収量を増やそうとすると、何千、ともすると何百万もの遺伝子がそれに寄与しています。干ばつに強い米を作るという大きな戦略を立てようとするなら(例えばMonsanto)、15年という時間と、2億ドル(約220億円)という金額を検討することになるでしょう【略】それは長期にわたる賭けのような取り組みになります」。

ここにAvaloが足を踏み入れる。同社は、植物のゲノムに対する変化の影響をシミュレートするためのモデルを構築した。同社によるとこのモデルは、15年間のリードタイムを2〜3年に短縮し、コストを同等の比率で削減できるという。

「そのアイデアは、より進化的に認識できる、より現実的なゲノムモデルを作り出すことでした」とコリンズ氏は語る。つまり、ゲノムと遺伝子をシステムの上でモデル化し、そのシステムに生物学と進化に由来するコンテキストが組み込まれていくというものだ。より優れたモデルでは、ある形質に関連する遺伝子についての偽陽性がはるかに少なくなる。ノイズ、無関係な遺伝子、マイナーな寄与因子などの除外をより多く行うからである。

同氏はある企業が取り組んでいる耐寒性を持つイネの例を挙げた。ゲノムワイド関連解析では、566個の「興味深い遺伝子」が発見され、各調査に要する費用は、必要な時間、スタッフ、材料を考慮するとそれぞれ4万ドル(約440万円)前後になることが示された。つまり、この形質を調査すると、数年間で2000万ドル(約22億円)もの資金が必要になる可能性があり、このような操作を試みることができる当事者と、時間と資金を投資する対象作物の両方が必然的に制限されることになる。投資収益率を期待するのであれば、アウトライヤー市場向けのニッチ作物の改良にその種の資金をつぎ込むことはできないだろう。

「私たちはそのプロセスを民主化するためにここにいます」とコリンズ氏はいう。同じ耐寒性のイネに関するデータ群の中で「興味深い32の遺伝子を発見しました。私たちのシミュレーションとレトロスペクティブ研究に基づき、これらすべてが真の因果関係を持つことがわかっています。そして、それらを検証するために、3カ月の期間で3つ、10のノックアウトを育てることができました」。

それぞれのグラフの点は、検査しなければならない遺伝子の信頼水準を表している。Avaloモデルはデータを整理し、最も有望なものだけを選択する(画像クレジット:Avalo)

ここで専門用語を少し明らかにしてみよう。Avaloのシステムは当初から、個別に調査しなければならなかったであろう遺伝子の90%以上を除外した。この32個の遺伝子は単に関連しているだけでなく、因果関係があり、形質に実際に影響を及ぼしているという確信が高かった。そしてこれは、特定の遺伝子をブロックし、その影響を研究する「ノックアウト」研究の簡潔版により立証されたものである。Avaloはその方法を「情報のない摂動による遺伝子発見」と称している。

ノイズからシグナルを引き出すという点では、機械学習アルゴリズムが本来持っている機能もその一部だが、コリンズ氏によると、同社は新しいアプローチでこの問題に取り組む必要があり、モデルが自ら構造や関係を学習できるようにする必要があったという。また、モデルが説明可能であること、つまり、その結果がブラックボックスの外に表示されるのではなく、何らかの理由で正当化されることも重要であった。

後者に関しては難しい問題だが、彼らは繰り返しシミュレーションを行い、興味深い遺伝子をダミーの遺伝子に相当するものと系統的に入れ替えることでそれを達成した。ダミーの遺伝子は形質を破壊することなく、各遺伝子が何に寄与しているかをモデルが学習するのに役立つ。

Avaloの共同創業者Mariano Alvarez(マリアーノ・アルバレス)氏(左)とBrendan Collins氏(ブレンダン・コリンズ)氏、温室のそばで撮影(画像クレジット:Avalo)

「当社の技術を使えば、興味深い形質のための最小限の予測育種セットを考案することができます。完全な遺伝子型をin silico(すなわちシミュレーション)で設計し、集中的な育種を行い、その遺伝子型を観察することができます」とコリンズ氏は語る。そしてコストが十分低いことから、小規模な作物やあまり人気のない作物、あるいは可能性に欠ける形質でも導入することができる。気候変動は予測がつかないので、今から20年後に耐暑性小麦と耐寒性小麦のどちらが優れているかは誰にもわからない。

「こうした活動にかかる資本コストを低減することで、気候耐性のある形質に取り組むことが経済的に実現可能な空間を解放するような役割を私たちは果たしています」とアルバレス氏は語っている。

Avaloはいくつかの大学と提携し、他の大学では決して日の目を見ることのなかった、回復力があり持続可能な植物の創造を加速させようとしている。これらの研究グループは大量のデータを保有しているが、十分なリソースを持ち合わせていないため、企業の能力を実証する優れた候補者にすぎない。

大学とのパートナーシップにより、大規模に利用する前にある程度の作業が必要な「十分に栽培品種化されていない」植物にもこのシステムを適用していくことが確立される。例えば、自然界に存在する大型の穀物に干ばつ耐性を付与しようとするのではなく、自然界に存在する干ばつ耐性を持つ野生の穀物を大型化する方が得策かもしれないが、それを解明するために2000万ドルを投じようとする者はいなかった。

商業面では、データ処理サービスを最初に提供することを計画している。つまり同社は、農業や製薬などの分野で実績はあるが速度に欠けている企業に、コストと時間の大幅な節約を提供する多くのスタートアップの1つとなる。うまくいけば、Avaloはこの種の植物を農業に持ち込み、種子ども給者にもなることができるだろう。

同社は数週間前にIndieBioのアクセラレーターを卒業したばかりで、すでに300万ドル(約3億3000万円)のシード資金を確保して大規模に活動を続けている。このラウンドはBetter VenturesとGiant Venturesが共同で主導し、At One Ventures、Climate Capital、David Rowan(デイビット・ローワン)氏、そしてもちろんIndieBioの親会社であるSOSVも参加した。

「ブレンダン(・コリンズ氏)は私に、スタートアップを始めることは教員の仕事に応募するよりもずっと楽しくておもしろいことだと確信させました」とアルバレス氏。「そして、彼は完全に正しかったのです」。

画像クレジット:Avalo

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)

【コラム】AIイノベーションの推進と規制を同時に実現するために欧州委員会はどうすればよいのか

2021年4月、欧州委員会は人工知能(AI)の利用を規制する初の法案を提案した。この提案に対しては、規制がヨーロッパ連合(EU)におけるAIのイノベーションにブレーキをかけ、米国や中国とのAI分野のリーダーシップ争いの足かせになるという批判が続出した。

例えばAndrew McAfee(アンドリュー・マカフィー、マサチューセッツ工科大学スローンマネジメントスクール主任研究員)は、Financial Timesに「EU propose to regulate AI are only going to hinder innovation(EUの規制提案はIAイノベーションを妨げる)」とする記事を寄稿している。

GDPR(EU一般データ保護規則)を振り返っても、EUの個人情報保護に関する思想的リーダーシップは、必ずしもデータ関連のイノベーションに直結しなかったが、欧州委員会(EC)はこれを念頭に批判を予期しており、規制案と同時にAIに関する新たな協調的計画を発表して、AIのイノベーションに真剣に取り組もうとしている。

AIに関する新たな協調的計画には、EUがAIテクノロジーでリーダーシップを取るための取り組みが盛り込まれている。では、規制とイノベーション促進政策のコンビネーションは、AIのリーダーシップの加速を促進するための要素として十分なのだろうか。

AIイノベーションは適切な規制によって加速する

規制とイノベーションの両方の改善を目標とした今回の組み合わせは、よく練られてはいるものの、問題もある。すなわち、イノベーション促進に関してはR&D(研究開発)のみに焦点を当てていて、規制の対象となる「高リスク」なユースケースにおけるAI利用の促進についてはカバーされていないのだ。

これは見逃せない欠落である。多くの調査研究で、特に利用促進のインセンティブと、適切に設計された法的拘束力がある規制が同時に施行されると、実際にイノベーションが加速される、という結果が出ている。ECはこの研究結果を採り入れて、AIイノベーションのリーダーとなるべきである。

高リスクなAI規制とイノベーションへの投資

今回のEC規制の主目的は「高リスク」なAIシステムに新たな要件を課すことにある。「高リスク」には、遠隔生体認証、公共インフラ管理、雇用・採用、信用度評価、教育などに使用されるAIシステムや、救急隊員の派遣などさまざまな公共部門におけるユースケースが含まれる。

この規制では、これらの高リスクなシステムの開発者に対してAI品質管理システムの導入、すなわち、高品質なデータセット、記録保持、透明性、人による監視、正確性、堅牢性、セキュリティに関する要件に対処できる管理システムの導入を要求している。また、高リスク未満のAIシステムの開発者には、同様の目標を達成するための自主的な行動規範の作成が奨励されることになる。

この提案の創案者は、明らかに規制とイノベーションのバランスを認識していたと思われる。

まず、この提案では、高リスクとされるAIシステムを限定している。なんとなく高リスクと思われがちな保険などのAIシステムは除外し、雇用や融資など、すでにある程度の規制・監視が行われているAIシステムはほとんどが網羅されている。

次に、この提案は大まかな要件を定義しているが、具体的な方法については規定していない。また、厳格な規制ではなく、自己申告に基づくコンプライアンスシステムを取り入れている。

最後に、協調的計画には、データ共有のためのスペース、試験・実験設備、研究・AIエクセレンスセンターへの投資、デジタルイノベーションハブ、教育への投資、気候変動、医療、ロボット工学、公共部門、法執行機関、持続可能な農業のためのAIといったターゲットを絞ったプログラム的な投資など、R&Dを支援する取り組みが大量に盛り込まれている。

しかし、この提案には、他の分野の規制と組み合わせてイノベーションを加速させてきた利用促進に対する配慮が欠けている。

イノベーション促進の前例:米国のEVインセンティブ

では、規制を行いながら、AIイノベーションのさらなる加速を促進するために、ECはどうすれば良いのだろうか。そのヒントとなるのが、米国のEVインセンティブだ。

米国がEV生産の先駆者となることができたのは、起業家精神と規制、そして市場創造のための優れたインセンティブの組み合わせがあったからである。

Tesla(テスラ)は「EVの先陣は魅力的で高性能なスポーツカーであるべきだ」という識見に基づいて、EV産業を活性化させた。

CAFE基準(企業別平均燃費基準:自動車の燃費規制。車種別ではなくメーカー全体で、出荷台数を加重した平均燃費を算出し、規制をかける基準)による規制は、より効率的な自動車を開発するための動機となり、EVを購入する際の手厚い税額控除は、本来あるべき競争の激しい市場力学を妨げることなく、EVの販売を直接促進した。CAFE基準による規制、税額控除、そしてTeslaのような起業家精神に富んだ企業の組み合わせで、技術革新が大きく促進され、EVのモーターは内燃機関よりも安価になると予想されている。

AIインセンティブの正しい理解:推進するべき3つの取り組み

ECでも、AIで米国のEVと同様のことを実現することができる。具体的には、ECは現行の規制に以下の3つの取り組みを追加し、組み合わせることを検討すべきであろう。

新しい規制に準拠した高リスクのAIシステムを構築または購入する企業に対して、税制上のインセンティブを設ける。ECは、経済的・社会的な目標を達成するためにAIを積極的に活用しなければならない。

例えば一部の銀行では、AIを活用し、信用情報の少ない個人の信用力をより適切に評価すると同時に、銀行業務にバイアスを発生させない取り組みを行っている。これは、行政との共通の目標であるファイナンシャル・インクルージョン(金融包摂)を向上させるものであり、両者の利益が一致するAIイノベーションを示すものである。

ECの法制化にともなう不確実性をもっと軽減する。これは、AIの品質管理や公正さに関する、もっと具体的な基準を策定することで、EC自体がある程度実現できる。しかし、AIテクノロジーを提供する企業やユーザーグループが連携して、これらの基準の遵守に向けた実用的なステップを構築できれば、さらに大きな価値があるだろう。

例えばシンガポール金融管理局は、Veritasという銀行、保険会社、AIテクノロジープロバイダーのための業界コンソーシアムを組織し、FEAT(Fairness, Ethics, Accountability and Transparency、公平性・倫理・説明責任・透明性)のガイドラインで同様の目標を達成している。

法が要求するAI品質管理システムの導入を加速するために、これらのシステムを構築または購入する企業に対する資金提供を検討する。この分野では、ブラックボックスモデルの説明可能性、データやアルゴリズムのバイアスによる潜在的な差別の評価、データの多大な変化に対するAIシステムの耐久性のテストとモニタリングなど、学術的にも商業的にも重要な活動がすでに行われている。

ECは、このようなテクノロジーを広く普及させるための条件を整えることで、イノベーションを加速させ、新しい規制への持続的な準拠も確保するという2つの目的を同時に達成することができるはずだ。

ECが積極的に不確実性を軽減して高リスクのAIの使用を規制しながら促進し、AIの品質管理技術の使用を奨励すれば、EU市民を確実に保護しながら、AIイノベーションの世界的なリーダーになることもできるだろう。EUが世界の模範となれるよう、成功を期待している。

編集部注:本稿の執筆者Will Uppington(ウィル・アッピントン)氏は、TruEraのCEO兼共同設立者。

画像クレジット:PhonlamaiPhoto / Getty Images

原文へ

(文:Will Uppington、翻訳:Dragonfly)

買収したRed Hatは成長を続けるがIBMの苦戦は続く

IBMは、Arvind Krishna(アルヴィンド・クリシュナ)氏が2020年CEOに昇格して以来、ハイブリッドクラウドやAIにフォーカスして戦略転換を進めてきた。その中心となっているのが、2018年に340億ドル(約3兆8810億円)で買収したソフトウェア会社Red Hat(レッドハット)だ。IBMは米国時間10月20日決算発表を行い財務成績はかなり厳しいものだったが、少なくともRed Hatは勢いよく成長を続けている。

IBMの第4四半期の売上高は176億2000万ドル(約2兆110億円)だったが、CNBCの報道によると、これはアナリスト予想の177億7000万ドル(約2兆280億円)を下回った。明るい話題としては、前年同期比で0.3%という非常に控えめな伸びを示したことが挙げられる。これは大したことではないと思うかもしれないが、過去10年間、ビッグブルー(IBMのニックネーム)は前年の売上高を上回ることはなかった

Red Hatを含むクラウドおよびコグニティブソフトウェア事業の売上高は、2.5%増の56億9000万ドル(約6490億円)となった。決算発表後に行われたアナリストへの説明会で、CFOのJim Kavanaugh(ジム・カバノー)氏は、Red Hatが第3四半期に17%成長したと指摘した。「Red Hatの売上高は、インフラストラクチャアプリケーション開発と新興テクノロジーで2桁の成長を達成しました。また、OpenShiftの経常収益が40%以上増加しました」と同社のコンテナオーケストレーションプラットフォームに言及しながら述べた。

以上が良いニュースだ。悪いニュースは、需要に追いつくためには技術者を雇う必要があり、その人件費はより高額になっていて、収益を抑制していることだ。「競争の激しい労働市場では、人材獲得や定着のためのコスト増などが当社の人件費を圧迫する要因となっていますが、現在の価格にはまだ反映されていません。今後の契約でこの価値を獲得することを期待していますが、収益構造に反映されるまでには時間がかかります」とカバノー氏は述べた。

つまり、Red Hatが問題なのではなく、IBMは自社の中心的企業からもっと収益を上げる方法を見つける必要があるということだ。Constellation ResearchのアナリストであるHolger Mueller(ホルガー・ミューラー)氏は、Red Hatを単にIBMのサービスを販売するだけの存在とするのではなく、真に中立的なプレイヤーであることをハイブリッドクラウド市場に納得させるために、Red Hatをさらに成長させる必要がある、と話す。

「IBMは、企業がRedHatを使用してロックインを回避できるようにして自らをクラウドの『スイス』と位置づけることが完全にできていません。これは有効な提案ですが、世の中のCxOの心を捉えていません」とミューラー氏は述べた。

一方、IBMは2020年発表したように、インフラストラクチャサービス部門を別会社としてスピンアウトしている最中だ。これは、クラウドとAIの戦略に基づいて会社を強固にするための動きと見られているが、来月この手続きが完了すると、バランスシートからその収益を失うことになり、財務的には痛みをともなう。

関連記事
IBMがインフラサービス事業を2兆円規模の独立事業として分社化する計画を発表
IBMがレガシーインフラ事業をスピンアウト、クラウド事業に全面的に舵を切る

その他の主要部門であるグローバルサービス部門は5%減、システム部門は12%減と大幅な減収となった。唯一、グローバルコンサルティングが12%成長したのが救いとなった。

IBMは少しずつ前進しているが、十分ではなく、また迅速でもない。IBMの株価は10月21日の取引終了時に9.56%下落した。株主は明らかにさらなる成果を求めている。Red Hatがリードしている一方で、他の部門は遅れを取り続けていて、投資家は満足していない。

カテゴリー:
タグ:

画像クレジット:MIGUEL MEDINA / CONTRIBUTOR / Getty Images

原文へ

(文:Ron Miller、翻訳:Nariko Mizoguchi

AIを活用して生徒の外国語学習を支援する日本でも人気のMagniLearnが約3.2億円調達

言語を学ぶのは簡単ではない。だから生徒を助けようとするスタートアップがたくさんあるのも当然だろう。個人で学習し学校のシステムとは関係のないスタートアップもあれば、学校への導入に挑戦するスタートアップもある。最近この市場に参入したのがイスラエルを拠点とするMagniLearnだ。同社はAIを活用し、生徒の学習状況に応じて1人ひとりに合うレッスンを提供する。

同社は米国時間10月19日、シードラウンドで280万ドル(約3億2000万円)を調達したと発表した。このラウンドをリードしたのはクラウドファンディングプラットフォーム「OurCrowd」のインキュベーターであるLabs/02とインドのReliance Industriesで、イスラエルのInnovation Authorityや多くの個人投資家も参加した。

MagniLearnの共同創業者でCEOのLana Tockus(ラナ・トックス)氏は「精密にパーソナライズするので、2人の生徒のレッスンが同じになることはまったくなく、生徒は可能性を存分に伸ばすことができます。当社のAIアルゴリズムがリアルタイムで動的に練習問題を作成するので、レッスンは生徒の進捗状況に応じて進化します。練習問題は生徒1人ひとりが挑戦するのにまさにぴったりのレベルで、時間を最も有効に使えます。アルゴリズムが学習者の回答を理解し、正確なフィードバックを学習者の母語で提供します」と説明する。

画像クレジット:MagniLearn

現在は日本、韓国、イスラエルでこのサービスが利用されているが、トックス氏は今回調達した資金でアジアパシフィック地域で拡大していく計画だと述べた。現時点ではMagniLearnのプロダクトは英語教育に特化している。

コロナ禍で学校のシステムはたいへんなストレスを受けたと同社はいう。しかしトックス氏は、MagniLearnが外国語教員を置き換えようとしているわけではないと述べている。「我々は1人ひとりに合わせたデータドリブンのインサイトを通じて教員と生徒が学習効率を最大化できるようにしたいと考えています。グローバルなエコノミーに参加し、収入を倍増させ、自分と家族により良い未来を約束するために英語を必要とする世界中の生徒に対して、チャンスの扉を開くことになるでしょう」(トックス氏)。

画像クレジット:Catherine Falls Commercial / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Kaori Koyama)

あらゆる肌色の顔を美しく見せるPixel 6カメラのReal Tone、多様性を広げるAI技術

スマホメーカー各社が写真での顔の写り方に特別な注意を払っているのは、理に適っている。米国時間10月19日、Google(グーグル)が発表した新しいPixel 6には、人間をこれまで以上によく見せるための、AIを搭載した新しいツール群が導入されている。その中でも特に注目されているのが、動く顔のブレを軽減する「Face Unblur(顔のぼかし解除)」と「Real Tone(リアルトーン)」だ。後者は、Googleの新しいTensorチップを搭載したAIによる後処理機能で、あらゆる肌色の顔を可能な限り美しく見せることを目指している。

関連記事
Google Pixel 6のカメラはAIでスナップショットをスマート化する
Pixel 6のAI機能向けに設計されたTensor SoCで、グーグルは独自チップに賭ける

スマートフォンで撮影される写真の大半は、自撮りであれ、他撮りであれ、人間が写っている。従来、複数の顔が写っている写真、特に顔の肌色がすべて異なる場合、露出をきれいにするのは非常に難しいとされてきた。新しいPixel 6では、コンピュテーショナルフォトグラフィーのレイヤーが加わり、写真に写っている全員ができるだけきれいに見えるようになっている。Pixelチームは、さまざまなエキスパートのイメージメーカーやフォトグラファーと協力して、ホワイトバランス、露出、アルゴリズムの調整を行った。同社は、これにより、どんな肌色の人でもうまく撮れるようになったとしている。

Googleは、リアルトーンをフォトグラファーが直面している課題に対する決定的な解決策ではなく、同社のカメラシステムの改善そして、1つのミッションとして捉えていると強調している。Googleは、すべての人々、特に有色人種が、カメラによる顔の撮影においてよりよく表現されるよう、多大な資源を投入している。

AndroidチームのAdvanced PhotographyプロダクトマーケティングマネージャーであるFlorian Koenigsberger(フロリアン・ケーニヒスベルガー)氏は、Pixel新機種の発売に先立って行われたブリーフィングインタビューで、次のように述べた。「私の母はダークな肌の黒人女性で、父は白人のドイツ人です。私の人生を通じて、ずっと疑問でした。どうしたらみんながきれいに見える写真が撮れるだろう。新しいカメラは、その道のりの一歩です。Googleの多様性の数値はもはやミステリーではありません。当社には、実体験や、この問題に関してオーセンティックに語ることができる人材という点で、明らかに不足しているものがあると理解していました」。

カメラチームは、フォトグラファー、カラリスト、シネマトグラファー、撮影監督、ディレクターなどと協力して、多様な肌色の人々、特により暗い肌色の人々に照明を当てて撮影する際の課題を深く理解しようとした。中でも、ドラマシリーズ「Insecure(インセキュア)」の撮影監督であるAva Berkofsky(アヴァ・バーコフスキー)氏、フォトグラファーのJoshua Kissi(ジョシュア・キッシー)氏、撮影監督のKira Kelly(キラ・ケリー)氏など、幅広い分野のプロフェッショナルの経験を活用した。

「エスニシティや肌の色だけでなく、さまざまな手法を含め、実に多様な視点を取り入れることに注力しました」とケーニヒスベルガー氏は語る。「カラリストたちは、映像制作の過程で起こるサイエンスとして考えているので、実際に話してみると最も興味深い人たちでした」とも。

Googleのプロダクトチームは、画像処理の専門家たちと協力して彼らにカメラを渡し、混合光源、逆光、室内、1枚の画像に複数の肌色を入れるなど、非常に難しい撮影状況に挑戦してもらった。

「私たちは、特にこのようなコミュニティにおいて、どこが問題なのかを学び、そこからどのような方向に進むべきかを考えなければなりませんでした」とケーニヒスベルガー氏は説明する。「イメージングのプロフェッショナルたちは非常に率直で、我々のエンジニアと直接会話をしていました。私はこの会話の進行を手伝いましたが、技術的な学びだけでなく、この空間で起こった文化的な学びも興味深いものでした。例えば粉っぽさ、よりダークな肌のトーン、質感などのことです。ミッドトーンのニュアンスはさまざまです」。

このプロセスは、カメラの顔検出アルゴリズムから始まる。カメラが顔を見ていることを認識すると、カメラはどのように画像をレンダリングすればうまくいくかを考え始める。複数のデバイスでテストを行った結果、Pixel 6は競合メーカーの製品や旧世代のPixelデバイスよりも一貫して優れたパフォーマンスを発揮していることが、Googleのチームによって明らかになった。

この機能が実際にどのように機能するのか、グローバルな編集(画像全体に同じフィルターを適用すること)を行うのか、あるいはAIが編集パスの一部として個々の顔を編集するのかは、すぐには明らかになっていない。近いうちに、カメラのこの特定の側面が実際にどのように機能するのか、より詳しく調べてみたいと思う。

カメラチームは、この分野での取り組みにより、カメラアルゴリズムを作成するためのトレーニングセットの多様性が25倍になったことを強調している。リアルトーン機能は、カメラアルゴリズムの中核をなすものであり、オフにしたり無効にすることはできない。

画像クレジット:Google

原文へ

(文:Haje Jan Kamps、翻訳:Aya Nakazato)

Google Pixel 6のカメラはAIでスナップショットをスマート化する

Google(グーグル)の最新のフラッグシップモデルには、スマートブラー、オブジェクト除去、スキントーン露出などの写真をより美しく見せるための自動化されたAIツールが搭載されている。これらが宣伝通りに機能するかどうかは、実際に試してみないとわからないが、Pixelを気にしている人から気軽にスナップショットを撮る人まで、誰にとっても便利な機能となるかもしれない。

そもそも新しいカメラ自体が非常に印象的だ。Pixel 6とPixel 6 Proで共有されているメインのリアカメラは、そこそこの大きさのピクセルウェルとF/1.85相当の絞りを備えた5000万画素だ(デジタル一眼レフカメラのF/1.8ほどの光を取り込むことはできないが、それでも十分だ)。ウルトラワイドの方は、1200万画素とより小さなセンサーでF/2.2なので、圧倒的な画質は期待できない。6 Proには4800万画素の望遠があり、低照度能力は劣るが、4倍相当のズームが可能だ。いずれも手ぶれ補正機能とレーザーアシストオートフォーカスを搭載している。

基本的には、どんな状況でも最高の画質を求めるならメインカメラを使い、光量に自信があるならワイドやズームを使える。新しいカメラの機能はすべてのカメラで使えるようだが、一般的に、最初に良い写真を撮れば撮るほど、最終的な結果も良くなる。

最も簡単なツールは、「顔のぼかし解除」だ。完璧な写真を撮っても、シャープさに欠けることがあるだろう。Pixel Cameraでは、(今では普通の撮影プロセスの一部となった)自動的に常に多重露光撮影を行い、1つのカメラで撮影したメインショットと、別のカメラで撮影した顔の鮮明なショットを組み合わせる。そうするには、ギャラリーにあるシャープではない写真をタップし、「顔のぼかし解除」のオプションがあれば、すぐに実行できる。

画像クレジット:Google

確かに、上の画像のように、ぼやけた写真の中で顔だけがシャープになるのはちょっと変だが、この写真が欲しいのか欲しくないのか、と言われると欲しいと思う。

また、写真のボケに関しては、2つの新しい「モーションモード」を搭載している。1つは「アクションパン」で、背景を「クリエイティブ」にぼかしながら、通過する車などの動きのある被写体を鮮明に捉えることができる。つまり、通常の手持ちのボケではなく、演出されたズームのボケを適用するので、ちょっと「修正された」感じがするが、楽しいオプションだ。もう1つは長時間露光用ヘルパーで、背景をはっきりさせたまま動く被写体にボケを加えるものだ。三脚を使わずにヘッドライトの光を撮るときなどに便利だ。これらは、カメラアプリ内のモーションモードエリアにある。

画像クレジット:Google

「消しゴムマジック」は、最も明らかに「AI」なものだ。写真を撮ったときに、背景に人が入ってきたり、景色の良いところに車が止まっていたりしても、それらの厄介な現実世界の物体を消して、その存在を忘れられるようにしてくれる。ツールをタップすると、遠くにいる人や車など自動的に削除したいものがハイライトされる。さらに、例として挙げられているように、邪魔な丸太やその他のランダムな形状のものも削除できる。ビーチにある流木を消すなんて、本当に?幸いなことに、記憶の穴に捨てるものは選ぶことができ、無理強いされることもなく、認識できないものに丸を付ければ、最善を尽くして処分してくれる。

「スピーチエンハンスメント」は明らかに画像用ではないが、フロントカメラモードでは、デバイスが周囲のノイズを低減し、あなたの声に集中するよう選択できる。基本的にはGoogle版ノイズキャンセリングアプリKrisp(クリスプ)だ。これのような機能があれば、ずっと使っていたいと思うだろう。

「リアルトーン」は興味深い機能だが、危険をともなう可能性のある機能でもあるので、近々詳しく紹介する。Googleはこの機能について次のように説明している。「Googleのカメラや画像製品がすべての肌の色に対応できるようにAWB(オートホワイトバランス)、AE(自動露出)、迷光のアルゴリズムの調整を、画像制作者や写真家の多様な専門家と協力しました」。

確かにすばらしいが、彼らはモデルだ(画像クレジット:Google)

基本的には、彼らの「スマート」カメラのコア機能が、他の肌色よりも特定の肌色でより良く機能したり、より良く見えたりしないことを確認したかったのだ。このようなことは、これまでに何度も起こってきたことであり、10億ドル(約1140億円)規模の企業が何度も失敗することは、屈辱的で恥ずかしいことだ。リアルトーンがうまくいけばいいが、たとえうまくいったとしても、写真の中の人の肌を明るくしたり暗くしたりするだけなのかという多くの人にとってセンシティブな根本的な問題がある。Googleは「この機能はオフにも無効にもできません」と言っているので、よほど自信があるのだろう。我々は、この機能をテストし、開発者や写真家にこの機能について話を聞いてみる予定で、興味深いが複雑なこの分野をより深く掘り下げていく。

これらの機能のうち、どれだけのものがPixelラインの携帯電話以外でも利用できるようになるのか、また、いつ利用できるようになるのかについては、完全には明らかになっていないが、何かわかったらお知らせする。

画像クレジット:Brian Heater

原文へ

(文:Devin Coldewey、翻訳:Yuta Kaminishi)

Pixel 6のAI機能向けに設計されたTensor SoCで、グーグルは独自チップに賭ける

Google(グーグル)のPixel 6とPixel 6 Proほど、正式発表前に詳しい情報が得られたスマホは今までなかったのではないだろうか。しかし、同じようなAndroid携帯電話が多い中で、Googleは、特にそのすべてを動かすチップに関して、興味深い選択をした。Googleは今回、自社設計のSoCを搭載したスマートフォンを初めて提供する。

「Tensor」と名付けられたこのチップについて、Googleは2021年夏のはじめに初めて言及した。これはスマートフォンのすべてのオンデバイスAIを動かす。基本的には、Google独自のAI / MLアクセラレータに、比較的既製のArmのCPUコアとGPUコア、そしてGoogleの新しいセキュリティコアであるTitan 2を組み合わせたものだ。

画像クレジット:Google

Googleは、TensorがPixel 5に搭載されていたチップよりも最大80%高速なパフォーマンスを提供することを約束している。率直に言って、Pixel 5はよりミッドレンジのスマートフォンだったが、日常的な使用では完全にスムーズに感じられる。米国時間10月19日の発表に先立ってリークされたベンチマークでは、Qualcommの最新のSnapdragonモバイルチップと同等とされているが、これらのベンチマークにはGoogle独自のAI / MLコアは含まれておらず、Pixel 6のカメラとその複雑なコンピュテーショナルフォトグラフィーのキレを良くするためにこれらの専用コアが果たす役割は、標準的なベンチマークでは実際には捉えられない。

しかし、これらの初期のリーク情報からわかったことは、Tensorは、Armのパフォーマンス重視のモバイル設計のフラッグシップであるArm Cortex-X1チップを2つ搭載しているということだ。比較すると、Snapdragon 888は1つしか搭載していない。最近のSoCではほとんどがそうであるように、低パフォーマンスでバッテリーを節約するコアもある。噂によると、古いA76ベースのコアと最近の超高効率のA55コアが混在しているとのことだ(これらはすべて、Pixel 6が約束された24時間のバッテリー寿命を達成するのに役立っている)。Google自体は、これらの詳細については完全に沈黙を守っているが、これは、同社がこのシステムのAI機能に全面的に注力しようとしていることを考えると、理に適っている。

また、このチップには、低消費電力のAI「Context Hub」が搭載されており、デバイス上で常時稼働する機械学習機能の一部を支えている。

Googleのハードウエア部門責任者であるRick Osterloh(リック・オスターロー)氏は、19日の発表の中で、ライブ翻訳から携帯電話の写真・動画機能まで、これらのAI体験を強調した。

Google SiliconのシニアディレクターであるMonika Gupta(モニカ・グプタ)氏は、発表の中で次のように述べた。「Google Tensorによって、Motion Mode(モーションモード)、Face Unblur(フェイス アンブラー)、動画の音声強調モード、動画へのHDRnetの適用など、最先端のMLを必要とする驚くべき新しい体験を実現しています。Google Tensorは、スマートフォンの利便性の限界を押し広げ、画一的なハードウェアから、私たちが携帯電話を使用するさまざまな方法を尊重し、それに対応するのに十分な知能を持つデバイスにしてくれます」。

19日のイベントで同氏は、このチップがここ数年の間に開発されたものであることにも言及した。チームが行った設計上の選択はすべて、それらのAI機能を最大限に生かすことに基づいていたという。


画像クレジット:Google

原文へ

(文:Frederic Lardinois、翻訳:Aya Nakazato)

アスクルが「数理・データサイエンス・AI教育プログラム」賛同、大学など教育支援で事業課題やデータ提供・指導員で協力

  1. アスクルが「数理・データサイエンス・AI教育プログラム」賛同、協力企業として大学などの教育を支援

事務用品の販売などを手がけるアスクルは、10月19日、内閣府、文部科学省、経済産業省が創設した「数理・データサイエンス・AI教育プログラム認定制度」に賛同し、経済産業省の「MDASH SUPPORTERS」の協力企業として大学などの教育プログラムの開発、実施の際に事業課題やデータの提供、指導員の派遣を行うと発表した。

「数理・データサイエンス・AI教育プログラム認定制度」は、内閣府、文部科学省、経済産業省が連携して、これらの分野の教育を奨励するための認定制度。大学院を除く大学、短期大学、高等専門学校の教育プログラムを認定し、支援するというもの。「MDASH SUPPORTERS」とは、「数理・データサイエンス・AI教育プログラム」を支援する賛同企業や団体のこと。富士通、ソフトバンク、NTT DATAなどの大手企業が名を連ねている。

アスクルでは、「MDASH SUPPORTERSとして、数理・統計学を学ばれた若い方々の力が社会で発揮され、日本の競争力が高まることを期待し、本プログラムに協力してまいります」と話している。

東北大学がスマートチェアとAIで「腰痛悪化予報」を可能に

東北大学がスマートチェアとAIで「腰痛悪化予報」を可能に

東北大学大学院医工学研究科健康維持増進医工学分野の永富良一教授らの研究グループは、荷重センサーを装着したオフィスチェア(スマートチェア)と人工知能解析技術で、日々の腰痛悪化を高い精度で予測することを可能にした。

研究グループは、22人のオフィスワーカーの協力で、3カ月間にわたり4個の荷重センサーを座面下に装着したスマートチェアで仕事をしてもらい、データを収集した。また被験者には、1日3回、タブレットで主観的な腰痛の程度を記録してもらった。

その結果、同じ姿勢を保つこと(姿勢の固定化)を避けるために、人は細かく体を動かしており、それには共通する特定のパターンがあることが発見された。そして、そのパターンが見られなくなると、腰痛が高い確率で悪化することがわかった。このことから、腰痛の発生が予測でき、ストレッチやエクササイズを促すことが可能となる。

東北大学がスマートチェアとAIで「腰痛悪化予報」を可能に

これまでは、「実生活におけるさまざまな規則性に乏しい時系列信号の数理モデル化」が難しかった。つまり、座っているときの短時間の不規則な姿勢の変化などを数式化することが困難であったため、「主観的腰痛」の予測はできなかった。その点において、それを可能にした今回の研究は大変に重要だと、同グループは話している。

こうした姿勢の固定化を防ぐ細かい体の動きの発見により、腰痛の他にも、肩こり、頭痛、関節痛などの不定愁訴の要因の解明と対処法の開発が進むとのことだ。

AIを使った超音波分析の拡大に注力するイスラエルのヘルステックDiAが約15億円調達

イスラエルに拠点を置くAIヘルステック企業DiA Imaging Analysisは、深層学習と機械学習を利用して超音波スキャンの分析を自動化している。同社はこのほど、シリーズBのラウンドで1400万ドル(約15億3700万円)を調達した。

DiAの前回の資金調達から約3年後に行われた今回の投資ラウンドには、新たにAlchimia Ventures、Downing Ventures、ICON Fund、Philips、XTX Venturesが参加し、既存投資家としてCE Ventures、Connecticut Innovations、Defta Partners、Mindset Ventures、Shmuel Cabilly(シュムール・カビリー)博士らが名を連ねている。同社のこれまでの総調達額は2500万ドル(約27億4500万円)に達している。

今回の資金調達により、DiAはプロダクト範囲の拡大を継続し、超音波ベンダー、PACS / ヘルスケアIT企業、リセラー、ディストリビューターとのパートナーシップの新規構築や拡充を進めるとともに、3つの地域市場でのプレゼンスを強化していく。

このヘルステック企業は、AIを利用したサポートソフトウェアを臨床医や医療従事者に販売し、超音波画像のキャプチャと分析を支援している。このプロセスを手動で行うには、人間の専門家がスキャンデータを視覚的に解釈する必要がある。DiAは、同社のAI技術を「今日行われている手動および視覚による推定プロセスから主観性を取り除く」ものだと強調している。

同社は、超音波画像を評価するAIを訓練して、重要な細部の特定や異常の検出を自動的に行えるようにしており、心臓にフォーカスしたものを含む、超音波分析に関連する各種の臨床要件を対象とした広範なプロダクトを提供している。心臓関連のプロダクトには、駆出率、右心室のサイズと機能などのアスペクトの測定と分析の他、冠動脈疾患の検出支援などを行うソフトウェアがある。

また、超音波データを利用して膀胱容積の測定を自動化するプロダクトもある。

DiAによると、同社のAIソフトウェアは、人間の目が境界を検出して動きを認識する方法を模倣しており「主観的」な人間の分析を超える進歩につながるもので、スピードと効率の向上も実現するという。

「当社のソフトウェアツールは、正しい画像の取得と超音波データの解釈の両方を必要とする臨床医を支援するツールです」とCEOで共同創業者のHila Goldman-Aslan(ハイラ・ゴールドマンアスラン)氏は語る。

DiAのAIベースの分析は、現在北米や欧州を含む約20の市場で利用されている(中国ではパートナーが自社のデバイスの一部として同社のソフトウェアの使用の承認を取得したと同社は述べている)。DiAは、チャネルパートナー(GE、Philips、コニカミノルタなど)と協力して市場開拓戦略を展開しており、チャネルパートナーは自社の超音波システムやPACSシステムに追加する形で同社のソフトウェアを提供している。

ゴールドマンアスラン氏によると、現段階で3000を超えるエンドユーザーが同社のソフトウェアへのアクセスを有している。

「当社の技術はベンダーニュートラルであり、クロスプラットフォームであることから、あらゆる超音波デバイスやヘルスケアITシステム上で動作します。そのため、デバイス企業およびヘルスケアIT / PACS企業の両方と10社以上のパートナーシップを結んでいます。当該分野には、このような機能、商業的牽引力、これほど多くのFDA・CE対応のAIベースソリューションを持つスタートアップは他にありません」と同氏は述べ、さらに次のように続けた。「現在までに、心臓や腹部領域のための7つのFDA・CE承認ソリューションがあり、さらに多くのソリューションが準備されています」。

AIのパフォーマンスは、当然ながら訓練されたデータセットと同等である。そして、ヘルスケア分野での有効性は特に重大な要素である。トレーニングデータに偏りがあると、トレーニングデータにあまり反映されていない患者群で疾患リスクを誤診したり過大評価したりする、欠陥のあるモデルにつながる可能性がある。

AIが超音波画像の重要な細部を突き止めるためにどのような訓練を受けているのかと聞かれて、ゴールドマンアスラン氏はTechCrunchに次のように答えている。「私たちは多くの医療施設を通じて何十万もの超音波画像にアクセスできますので、自動化された領域から別の領域にすばやく移動する能力があります」。

「各種のデバイスからのデータに加えて、異なる病理を持つ多様な集団データも収集しています」と同氏は付け加えた。

「『Garbage in Garbage out(ゴミからはゴミしか生まれない)』という言葉があります。重要なのは、ゴミを持ち込まないことです」と同氏はいう。「当社のデータセットは、数人の医師と技術者によってタグ付けされ、分類されています。それぞれが長年の経験を持つ専門家です」。

「また、誤って取り込まれた画像を拒否する強力な拒否システムもあります。このようにして、データがどのように取得されたかに関する主観的な問題を克服しています」。

注目すべき点は、DiAが取得したFDAの認可が市販前通知(510(k))のクラスII承認であることだ。ゴールドマンアスラン氏は、自社プロダクトの市販前承認(PMA)をFDAに申請していない(また申請する意思もない)ことを認めている。

510(k)ルートは、多様な種類の医療機器を米国市場に投入する承認を得るための手段として広く利用されている。しかし、それは軽薄な体制として批判されており、より厳格なPMAプロセスと同じレベルの精査を必要としないことは確かである。

より大きなポイントは、急速に発展しているAI技術の規制は、それらがどのように適用されているかという点で遅れをとっている傾向があるということだ。巨大な展望が確実に開かれているヘルスケア分野への進出が増えている一方、まことしやかなマーケティングの基準を満たすことに失敗した場合の深刻なリスクもある。つまり、デバイスメーカーが見込んだ展望と、そのツールが実際にどれだけの規制監督下に置かれているかということの間には、依然としてギャップのようなものが存在している。

例えば、欧州連合(EU)では、デバイスの健康、安全性、環境に関するいくつかの基準を定めているCE制度において、一部の医療デバイスはCE制度の下での適合性についての独立した評価が必要になるが、実際にはそれらが主張する基準を満たしているという独立した検証が行われることなく、単にメーカーが適合性の宣言を求められるだけの場合もある。しかし、AIのような新しい技術の安全性を規制する厳格な制度とは考えられていない。

そこでEUは、来るべきAI規制法案(Artificial Intelligence Act、AIA)の下で「高リスク」と見なされたAIのアプリケーションに特化して、適合性評価の層を追加することに取り組んでいる。

DiAのAIベースの超音波解析のようなヘルスケアのユースケースは、ほぼ確実にその分類に該当するため、AIAの下でいくつかの追加的な規制要件に直面することになる。しかし現時点では、この提案はEUの共同立法者によって議論されているところであり、AIのリスクの高いアプリケーションのための専用の規制制度は、この地域では何年も効力を発揮していない状態にある。

関連記事
欧州がリスクベースのAI規制を提案、AIに対する信頼と理解の醸成を目指す
心電図読み取りAIを開発するCardiomaticsが約3.5億円を調達

画像クレジット:DiA Imaging Analysis

原文へ

(文:Natasha Lomas、翻訳:Dragonfly)

【コラム】何千年も前から続く人類と「乳がん」との戦いにAIはどう貢献するのか

この40年、毎年10月の「乳がん啓発月間」は、地球上で最も多く発生する癌であり、毎年約25万人の命を奪っている「乳がん」の認知度を高めることに貢献してきた。

乳がんは、古代エジプトにまでさかのぼる記録があるにもかかわらず、何千年もの間「口に出せない病気」と考えられてきた。女性は黙ったまま「尊厳」を持って苦しむことが求められていたのだ。

このような偏見が教育上の無知を助長し、ほんの数十年前まで乳がんは比較的研究が進んでいない病気だった。20世紀のほとんどの期間、他のがん治療が発展する一方で、乳がんを患った女性は、放射線治療や手術を受けることになるのだが、しばしば根治的な手術が行われたものの、大した効果が得られないまま、患者が傷つくことも多かった。

乳がんの死亡率は、1930年代から1970年代までほとんど変化がなかった。しかし、フェミニストや女性解放団体の努力により、乳がんの研究と治療は、男性優位の病院や研究機関の中で、正当な地位を得られるまでになった。その治療法は、一世代でがらりと変わったのだ。

1970年代には、乳がんと診断された女性が、その後10年間を生き延びられる確率は、およそ40%に過ぎなかった。それが今では、新薬や最先端の検診法、より繊細で効果的な手術のおかげで、その確率がほぼ2倍に伸びた。

このような変化に不可欠なのが、早期診断の重要性だ。乳がんの発見が早ければ早いほど、治療はしやすくなる。人工知能は、この乳がんの発見において、ますます重要な役割を果たすようになっている。2021年、英国の国民保健サービス(NHS)は、AIを用いて乳がんをスクリーニングする方法の研究を発表した。この方法は、人間の医師に代わるものではなく補完するものだが、放射線技師の不足を解消するのにも役立つ。新型コロナウイルスの影響からNHSが抱える検査の滞りを解消するためには、さらに2000人の放射線技師が必要とされているという。

いくつかのスタートアップ企業も、AIを使ってこの人手不足に取り組んでいる。英国のKheiron Medical Technologies(ケイロン・メディカル・テクノロジーズ)は、AIを使って50万人の女性の乳がんをスクリーニングすることを計画している。スペインのthe Blue Box(ザ・ブルー・ポックス)は、尿サンプルから乳がんを検出できる装置を開発中だ。インドのNiramai(ニラマイ)は、農村部や準都市部に住む多くの女性のスクリーニングに役立つ低コストのツールをてがけている。

しかし、生存率を高めるためには、再発のリスクが高い患者を特定することも同じくらい重要だ。乳がん患者の10人に1人は、初期治療後に再発し、生存率が低下すると言われている。

そのような患者を早期に特定することは、これまで難しかった。しかし、筆者のチームは、フランスのがん専門病院であるGustave Roussy(ギュスターヴ・ルシー)と協力して、再発のリスクが高い患者
の10人に8人を発見することができるAIツールを開発した。AIは、患者が必要とする治療を早期に受けられるようにすると同時に、リスクの低い患者が頻繁に不安な検診を受けなくて済むためにも役立つ。一方、製薬会社はリスクの高い患者をより早く募集することによって、乳がんの治験を加速させることができる。

だが、患者のデータのプライバシーは、迅速な研究の妨げとなる可能性がある。病院はデータを外部に送信することに慎重であり、製薬会社は貴重なデータを競合他社と共有したくない。しかし、AIはこのような問題の解決に役立ち、新しい治療法をより早く、より安全に、より安価に開発することを可能にする。

Federated learning(連合学習)は、データを病院から集約することなく、複数の機関のデータを使ってトレーニングを行う新しい形のAIで、研究者が必要不可欠でありながらこれまでアクセスできなかったデータにアクセスできるようにするために、欧州全域で使用されている。

我々はまた、最も侵攻性の高い乳がんがなぜ特定の薬剤に耐性を示すのかについて、AIを用いて理解を深め、化学療法よりも健康な細胞と腫瘍細胞との識別に優れた、新しい個別化された薬剤の開発に役立てている。

AIの影響力はますます大きくなっているものの、成果を向上させるために同じくらい重要なことは、医療は基本的に人間が行うものであるという認識である。どんなアルゴリズムでも、患者の最も暗い瞬間を慰めることはできないし、どんな機械でも、すべての患者が病気に打ち勝つために必要な回復力を植え付けて鼓舞することはできない。

私だけでなくすべての医師は、病気の治療と同じくらい患者を理解することが重要であると知っている。臨床医の共感は、患者の満足度の高さや苦痛の少なさに関係し、患者が困難な治療コースを続ける動機となり得る。ありがたいことに、乳がん治療にますます役立っているAI技術は、医師の能力を補完し、高めてくれる。

毎年、乳がんと診断される何百万人もの人々にとって、乳がんはもはや「口に出せない」病気ではない。10月の始まりを告げるピンクリボンの海は、最古の敵の1つである乳がんとの戦いにおいて、私たちがどれだけ進歩したかを示している。私たちは現在、この戦いに打ち勝ちつつあるのだ。乳がんを完全に根絶することはできないかもしれない。しかし、AIが患者の早期診断を助け、治療法の迅速な開発を可能にすることによって、数十年後には、もはや「乳がん啓発月間」の必要性がなくなるかもしれない。

編集部注:本稿を執筆したThomas Clozel(トーマス・クローゼル)医学博士は、Owkin(オウキン)の共同設立者兼CEOであり、パリのHôpital Henri-Mondr(アンリモンドール病院)の臨床非血液学の元助教授、ニューヨークのWeill Cornell Medicine(ワイル・コーネル・メディスン)のMelnick(メルニック)ラボの元研究員でもある。

画像クレジット:NYS444 / Getty Images

原文へ

(文:Thomas Clozel、翻訳:Hirokazu Kusakabe)

脳卒中のAI予測診断を救急医療サービス「Smart119」に実装、千葉消防局が実用化へ

脳卒中のAI予測診断を救急医療サービス「Smart119」に実装、千葉消防局が実用化へ

千葉大学発の医療スタートアップSmart119は10月18日、脳卒中AI予測診断アルゴリズムの研究論文がイギリスの科学雑誌「Scientific Reports」に掲載されたことを発表した。この論文は、急性期の脳卒中にAI予測アルゴリズムを確立し、有効性を実証したことを報告している。

三大疾病の1つである脳卒中は、くも膜下出血、脳梗塞、脳出血、主幹動脈閉塞などが含まれ、突発的に発病する傾向が強い。救命はもちろんのこと、片麻痺などの後遺症を抑えるためにも緊急の治療が求められる。しかし、救急隊員の判断は医療機関と共有されず、病院に到着してからの診断によって病状が特定されるのが現状だ。

そこでSmart119は、救急隊員の判断の精度を高め、専門医や設備を持つ医療機関での的確で迅速な治療を実現するために、救急隊と医療機関とで診断結果が共有できるAI予測診断を開発した。これは、容態、疾患履歴、気象状況など、患者の個別の背景条件から脳卒中の症状を診断できる。

実験では、千葉市内の医療機関と千葉市消防局の協力で、脳卒中の可能性のある救急患者約1500人の、容態、年齢、性別、気象状況のデータを収集。そのうち約1200人分(80%)のデータは機械学習の分類アルゴリズムモデルの設計に利用され、残る約300人(20%)のデータはテストに用いられた。分類アルゴリズムをテスト用300人のデータで検証した結果、評価指標AUC(Area under the curve)値で高い精度(0.980)が示された(AUCは、分類のアルゴリズムの精度を示す曲線値。閾値「0.8」を上回ることで高精度とされる)。

このアルゴリズムは、本年度中に緊急医療情報サービス「Smart119」に実装される予定とのこと。これを導入している千葉市消防局の救急車に装備されているタブレット端末アプリで利用できるようになる。

掲載した画面写真はデモ版のため、正式リリースでは変更になる場合がある

救急隊員は、患者に脳卒中の可能性がある場合に「脳卒中診断ボタン」をタップし、診断専用ページで患者の容態を選択肢に従って入力する。すると、AI予測診断で病状が確定し、受け入れ先の自動選択とともに、受け入れ要請が実施される。受け入れ先病院では、この情報を基に、救急車が到着する前に専門医の召集や緊急手術に関する準備を整えることができる。

このアルゴリズムは、他の病状への応用も期待されている。またこれは、Smart119により特許申請がなされている。

【コラム】知られざるデザインの事実とユーザーエクスペリエンスの偏りに対処する方法

最近とある巨大テック企業と話をする機会があった。彼らが知りたがっていたのは、彼らが手がける人間中心設計は、エクスペリエンスの偏りを防ぐことができるかどうかというものだった。簡単にいうとその答えは、おそらくノーである。

エクスペリエンスの偏りといっても、何も私たち自身の認知的な偏りのことではない。デジタルインターフォースのレイヤー(デザイン、コンテンツなど)における偏りのことを指しているのだ。人々が接しているほとんどのアプリやサイトは、制作したチームの認識や能力に基づいて設計されているか、ごく数人の価値の高いユーザーのために設計されている。もしユーザーがデザインにおける慣習を知らなかったり、デジタルへの理解が足りなかったり、技術的なアクセスがなかったりすると、そのエクスペリエンスは彼らにとって不利なものになると言えるだろう。

解決策としては、多様なユーザーのニーズに合わせ、デザインやエクスペリエンスを複数バージョン作るという考え方にシフトするというのがある。

前述のテック企業の話に戻ると、共感できるデザインへの投資はどんな企業にとっても不可欠だが、デザイン機能を立ち上げ運営してきた者として、ここで知られざる事実をいくつか打ち明けておく必要があるだろう。

まず第一に、UXチームやデザインチームは、戦略やビジネス部門から非常に限定されたターゲットユーザーを指示されることが多く、エクスペリエンスの偏りはすでにそこから始まっている。事業があるユーザーを優先しなければ、デザインチームはそのユーザーのためにエクスペリエンスを作る許可も予算も得られない。つまり、企業が人間中心設計を追求したり、デザイン思考を採用したりしていたとしても、多くの場合は商業的な利益に基づいてユーザープロファイルを繰り返し作成しているだけで、文化、人種、年齢、収入レベル、能力、言語などの多様性の定義からは程遠いものとなっている。

知られざる事実の2つ目に、人間中心設計ではUX、サービス、インターフェースのすべてを人間が設計することを前提としていることが挙げられる。エクスペリエンスの偏りを解決するために、ユーザーのあらゆるニーズに基づいてカスタマイズされたバリエーションを作成する必要がある場合、特にデザインチーム内の多様性が豊かでない場合には手作りのUIモデルというだけでは十分でない。ユーザーのニーズに基づいた多様なエクスペリエンスを優先させるには、デザインプロセスを根本的に変えるか、デジタルエクスペリエンスの構築に機械学習や自動化を活用するかのどちらかが必要であり、これらはどちらもエクスペリエンスの公平性へのシフトのためにはとても重要なことである。

エクスペリエンスの偏りを診断し、対処する方法

エクスペリエンスの偏りに対処するには、どこに問題があるかを診断する方法を理解するところから始まる。下記の質問は、デジタルエクスペリエンスのどこに問題が存在するかを理解するためにはとても有用な質問だ。

コンテンツと言語:このコンテンツは個人にとってわかりやすいものか?

アプリケーションには、技術面で特別な理解を必要としたり、企業や業界に特化した専門用語を使ったり、専門知識を前提としたりするものが多い。

金融機関や保険会社のウェブサイトでは、閲覧者が用語や業界、名称を理解していることが前提となっている。代理店や銀行員が事細かに教えてくれる時代でないのなら、デジタルエクスペリエンスがそれに代わって説明してくれるべきではないだろうか。

UIの複雑さ:自分の能力に基づいたインターフェースになっていないか?

障がいがあっても支援技術を使って操作ができるだろうか。またはUIの使用方法を学ぶ必要があるか。1ユーザーがインターフェイスを操作するために必要とする力量は、その人の能力や状況に応じて大きく異なる場合がある。

例えば高齢者向けのデザインでは、視覚的効果が控えめで文字の多いものが優先される傾向にあり、逆に若者は色分けや現在のデザイン規則を好む傾向にある。新型コロナウイルス(COVID-19)のワクチン用ウェブサイトでは、操作方法や予約方法を理解するのに皆苦労したのではないだろうか。また、各銀行のウェブサイトは同じような情報でも操作方法が大きく異なっている。かつて、スタートアップ企業のUIは非常にシンプルなものだったが、機能が追加されるにつれベテランユーザーにとってさえも複雑になってきている。Instagramの過去5年間での変化がその良い例である。

エコシステムの複雑さ:複数のエクスペリエンスをシームレスに操作する責任をユーザーに負わせていないか?

私たちのデジタルライフは単一のサイトやアプリを中心としているわけではなく、オンラインで行うことすべてにおいてあらゆるツールを使用している。ほとんどのデジタルビジネスやプロダクトチームは、ユーザーを自分たちの庭に閉じ込めておきたいと考えており、ユーザーが達成しようとしていることに基づいて、ユーザーが必要とするかもしれない他のツールを考慮してくれることなどほとんどない。

病気になれば、保険、病院、医師、銀行との連携が必要になるだろう。大学の新入生の場合は学校のさまざまなシステムに加えて、ベンダー、住宅、銀行、その他の関連組織と連携しなければならない。このように、ユーザーがエコシステムの中でさまざまなエクスペリエンスをつなぎ合わせる際に困難に直面しても、結局のところユーザーの自己責任となってしまうのである。

受け継がれるバイアス:コンテンツを生成するシステム、別の目的のために作られたデザインパターン、エクスペリエンスをパーソナライズするための機械学習を使用している場合。

このような場合、これらのアプローチがユーザーにとって正しいエクスペリエンスを生み出しているかどうかをどのようにして確認しているだろうか?コンテンツ、UI、コードを他のシステムから活用する場合、それらのツールに組み込まれたバイアスを引き継いでしまうことになる。例えば、現在利用可能なAIコンテンツやコピー生成ツールはいくつも存在するが、自身のウェブサイトのためにこれらのシステムからコピーを生成した場合、そのバイアスをエクスペリエンスに取り込んでしまうことになる。

よりインクルーシブで公平なエクスペリエンスエコシステムの構築を始めるには、新しいデザインと組織的なプロセスが必要だ。よりカスタマイズされたデジタルエクスペリエンスの生成を支援するAIツールは、今後数年間でフロントエンドデザインやコンテンツへの新しいアプローチにおいて大きな役割を果たしてくれることだろう。しかし、どんな組織でも今すぐ実行できる5つのステップがある。

デジタルエクイティをDEIアジェンダの一部とするということ:多くの組織がダイバーシティ、エクイティ、インクルージョンの目標を掲げているものの、それらが顧客向けのデジタル製品に反映されることはほとんどない。筆者は大企業でデザインチームを率いたり、デジタルスタートアップで働いたりした経験があるが、問題はどこでも同じで、組織全体の多様なユーザーに対して明確な説明責任を果たしていないということなのである。

大企業でも中小企業でも、各部門が影響力の強さやどちらが顧客に近いかを競い合っている。デジタルエクスペリエンスや製品の出発点は、ビジネスレベルで多様なユーザーを定義し、優先順位をつけるところから始まるが、上級職レベルでデジタルとエクスペリエンスの公平性の定義を作成することが義務付けられているのなら、各部門はそれらの目標にどのように貢献できるかを定義すれば良い。

デザインチームやプロダクトチームは、経営陣や資金面でのサポートがなければインパクトを与えることができないため、経営幹部レベルはこの優先順位を確保するという責任を負う必要がある。

デザインチームと開発チームの多様性を優先すること:これについてはこれまでにも多くの記事が書かれてきたが、多様な視点を持たないチームというのは、自分たちの恵まれた経歴や能力だけに基づいたエクスペリエンスを生み出してしまうということを強調しておく必要がある。

さらに、多様なユーザーに向けたデザイン製作を経験したことのある人材を採用することが不可欠であるということも付け加えておきたい。デザイナーや開発者のグループを改善するため、採用プロセスをどのように変えているのか。多様な人材を確保するためにどういった企業と提携しているか。DEI目標は採用用紙上のチェックボックスに過ぎず、すでに思い描いていたデザイナーを採用していないだろうか。使用しているエージェントは明確かつ積極的なダイバーシティプログラムを持っているか。そして、彼らはインクルーシブデザインにどの程度精通しているか。

Googleの取り組みには模範的なものがいくつかある。人材パイプラインにおける代表性を向上させるための取り組みとして、機械学習コースへの資金提供を白人の多い教育機関からより包括的な学校に移し、TensorFlowコースへのアクセスを無料にし、またBIPOC(黒人、先住民、有色人種)にあたる開発者にはGoogle I/Oなどのイベントへの無料チケットを送付している。

何を、誰にテストするかを再定義する:ユーザーテストが実施される場合、収益性の高いユーザー層や特に重要なユーザー層に限定してテストが実施されることがあまりにも多い。しかし、お年寄りやデスクトップコンピュータをまったく使用しない若いユーザーに対してそのサイトはどのように機能するだろうか?

エクスペリエンスにおける公平性と平等性の重要な側面として、複数のエクスペリエンスを開発し、テストすることが挙げられる。ほとんどの場合、デザインチームは1種類のデザインをテストして、ユーザーからのフィードバックに基づいて微調整を行っている(テストを行ってさえいない場合もかなり多い)。手間はかかるものの、高齢者やモバイルしか持っていないユーザー、異なる文化的背景を持つユーザーなどのニーズを考慮したデザインバリエーションを作ることで、デザインをデジタルエクイティの目標に結びつけることができるのである。

「1つのデザインをすべてのユーザーに」届けるのではなく「複数バージョンのエクスペリエンスを立ち上げる」ということにデザイン目標を変更する:通常、最も重要なユーザーのニーズに基づいて、あらゆるエクスペリエンスを単一バージョンに絞り込むというのがデジタルデザインや製品開発の常識である。アプリやサイトのバージョンを1つではなく、多様なユーザーに合わせて複数バージョンを用意するというのは、多くのデザイン組織のリソース確保や製作の方法に反するものである。

しかし、エクスペリエンスの公平性をもたらすためにはこの転換が不可欠だ。簡単な自問をしてみると良い。そのサイト / 製品 / アプリには、高齢者向けのシンプルで大きな文字のバリエーションが用意されているだろうか?低所得世帯向けのデザインに関しては、デスクトップに切り替えて作業する人と同様に、モバイルのみ使用のユーザーでも難なく作業を完了できるだろうか?

これは、単にレスポンシブバージョンのウェブサイトを用意したり、バリエーションをテストして最適なデザインを見つけたりすることに留まらない。デザインチームは、優先されるべき多様なユーザーや十分なサービスを受けていないユーザーに直接結びつくような、複数の視点を持ったエクスペリエンスを提供するという目標を持つべきなのである。

自動化を導入し、ユーザーグループごとにコンテンツやコピーのバリエーションを作成する:デザインのバリエーションを揃えたり、幅広いユーザーでテストしたりしていたとしても、コンテンツやUIのコピーは後回しにされているということがよくある。特に組織の規模が大きくなるにつれてコンテンツが専門用語で溢れ、洗練されすぎて意味をなさなくなることがある。

既存の言葉(例えばマーケティングコピー)からコピーを取ってアプリに載せた場合、そのツールが何のためにあるのか、どうやって使うのかなどの、人々の理解を制限してしまっていないだろうか。エクスペリエンスの偏りに対するソリューションが、個々のニーズに基づいたフロントエンドデザインのバリエーションを用意することであるならば、それを劇的に加速させるスマートな方法の1つは、どこに自動化を適用すべきかを理解することである。

私たちは今、UIやコンテンツの制作方法を根本的に変えてしまうであろう新たなAIツールが、静かな爆発のように広がり続けている時代にいる。ここ1年でオンラインに登場したコピー駆動型のAIツールの量を見てみると良い。こういったツールはコンテンツ制作者が広告やブログ記事をより速く書けるようにすることを主な目的としているが、大規模なブランド内でこのようなツールをカスタム展開し、ユーザーのデータを取得してUIのコピーやコンテンツをその場で動的に生成するということも容易に想像ができる。例えば、年配のユーザーには専門用語を使わないテキストによるサービスや商品の説明が展開され、Z世代のユーザーには画像を多用したコピーが表示されるという具合だ。

ノーコードのプラットフォームでも同様のことが可能である。WebFlowからThunkableまで、すべてが動的に生成されるUIの可能性を持ち備えている。Canvaのデザインは物足りなく感じるかもしれないが、すでに何千もの企業がデザイナーを雇う代わりに、ビジュアルコンテンツ作成のため、Canvaを利用している。

多くの企業がAdobe Experience Cloudを利用しているが、その中に埋もれているエクスペリエンスの自動化機能を蔑ろにしていないだろうか。デザインの役割は最終的に、カスタムメイドのエクスペリエンスを手作りすることから、動的に生成されるUIのキュレーションへと変化していくことだろう。過去20年間にアニメーション映画が遂げた進化が良い例である。

機械学習とAIがもたらすデザインバリエーションの未来

上記のステップは、組織がエクスペリエンスの偏りに対処し、現在のテクノロジーを使って変えていくための方法を示したものである。しかし、エクスペリエンスの偏りに対処する未来が、デザインやコンテンツのバリエーション作成に根ざしているとすれば、AIツールがかなり重要な役割を果たすようになる。すでにJarvis.aiやCopy.aiなどのAI駆動型コンテンツツールの波が押し寄せており、またFigmaやAdobe XDなどのプラットフォームに組み込まれた自動化ツールも存在する。

フロントエンドデザインやコンテンツを動的に生成できるAIや機械学習の技術は、多くの点でまだ初期段階にあるものの、今後の展開を物語る興味深い事例があるため以下に紹介したい。

1つ目は、Googleが2021年初めに発表したAndroid端末向けのデザインシステムのMaterial Youである。このシステムではユーザーが高度なカスタマイズを施すことができ、また高度なアクセシビリティも内蔵している。ユーザーは色やフォント、レイアウトなどを自由にカスタマイズでき、自在にコントロールすることができるが、機械学習の機能により、場所や時間帯などユーザーの変数に応じてデザインが変化するようになっている。

パーソナライゼーションは、ユーザーが自分でカスタマイズできるようにするためのものと説明されているが、Material Youの詳細を見てみるとデザインレイヤーにおける自動化と多くの可能性が交差していることが分かる。

人々がAIを体験する際のデザイン原則やインタラクションについて、これまで各企業が取り組んできたことも忘れてはいけない。例えばMicrosoftのHuman-AI eXperienceプログラムでは、AI主導のエクスペリエンスを構築する際に使用できる、インタラクションの原則とデザインパターンのコアセットを、人間とAI間のインタラクションの失敗を予測して解決策を設計するためのプレイブックとともに提供している。

これらの例は、インタラクションやデザインがAIによって生成されることを前提とした未来の指標となるものであり、これが現実の世界でどのように機能していくかについてはまだ実例がほとんどない。重要なのは、偏りを減らすためにはフロントエンドデザインのバリエーションとパーソナライゼーションを根本的に増やすというところまで、事を進化させる必要があるということであり、またこれはAIとデザインが交差するところで生まれつつあるトレンドを物語っている。

こうしたテクノロジーと新たなデザイン手法が融合すれば、企業にとってはユーザーのためのデザインのあり方を根本的に変えるチャンスになるだろう。エクスペリエンスの偏りという課題に今目を向けなければ、フロントエンド自動化の新時代が到来したときには、その問題に対処するチャンスがなくなってしまうだろう。

編集部注:本稿の執筆者Howard Pyle(ハワード・パイル)氏は、デジタルエクスペリエンスに公平性を持たせることを目的とした非営利団体ExperienceFutures.orgの創設者であり、これまでにMetLifeやIBMでブランドサイドのデザインイニシアチブを主導してきた。

画像クレジット:naqiewei / Getty Images

原文へ

(文:Howard Pyle、翻訳:Dragonfly)

コンピュータービジョンにとどまらず企業の非構造化データを管理するClarifaiが68億円調達

Clarifai(クラリファイ)は、開発者、ビジネスオペレーター、データサイエンティストの日常に人工知能を導入し、モデル開発の自動化と高速化を実現を目指している。

Matt Zeiler(マット・ザイラー)氏は2013年、ニューヨークを拠点とし、コンピュータービジョンに特化した同社を創業した。2016年の3000万ドル(約34億円)のシリーズB以来、画像、ビデオ、テキスト、オーディオデータファイルといった企業の非構造化データを対象とした新機能や製品を展開している。

新機能には、自然言語処理、音声認識、スキャン、そして2020年発表した自動データラベリング機能「Scribe」などがある。また、高出力サーバーからカメラ、ドローンまで、さまざまなローカルハードウェアを使用して、データストリームの上にAIを重ねる「Edge AI」機能も展開している。同社は、10月20日に開催される深層学習の年次カンファレンス「Perceive 2021」で、さらに多くの情報を公開する予定だ。

こうした活動の中で、またこれらを継続すべく、Clarifaiは10月15日に6000万ドル(約68億4000万円)のシリーズCラウンドを発表した。New Enterprise Associatesが主導し、既存の投資家からMenlo Ventures、Union Square Ventures、Lux Capital、LDV Capital、Corazon Capital、NYU Innovation Venture Fund、新規の投資家としてCPP Investments、Next Equity Partners、SineWave Ventures、Trousdale Capitalが参加した。今回のラウンドで、同社の資金調達総額は1億ドル(約114億円)に達した。

「私たちは、追加の資金調達をせずに、なんとか長い間を過ごしてきました」とザイラー氏はTechCrunchに語った。「当社は、コストを抑えて効率的に運用しながら、収益を大きく伸ばしてきました。そして、チャンスを迎え、資金を調達しました」。

そのチャンスには、優れた法人向け販売チームを立ち上げることも含まれていた。会社設立当初は市場が未成熟だったため、中小企業や個人への販売から始めた。現在では、市場の成熟化に伴い、フォーチュン500の企業と取引を行っている。

同社にとって「非構造化データ」とは、画像や動画、テキストなど、人間の脳は得意とするが、コンピューターは苦手とするデータのことだ。実際、企業のデータの95%は非構造化データであり、Clarifaiに「大きなチャンス」をもたらしているとザイラー氏は話す。

そうしたシグナルを大企業が市場に発するようになったタイミングで、シリーズCを実現した。また、同社はSnowflakeと提携し、Snowflakeが最近リリースした非構造化データ支援とClarifaiを連携させるための統合を行った。

「Snowflakeは、構造化データに関して1000億ドル(約11兆円)規模のビジネスを展開していますが、今は非構造化データにも取り組んでいます」とザイラー氏は付け加えた。「顧客がSnowflakeでデータを保存している場合、そこから価値を得ることができますが、それを意味のあるものにするためにはClarifaiのAIが必要です」。

Clarifaiの製品パイプライン。画像クレジット:Clarifai

一方、同社は2020年1年間で収益を2倍以上に伸ばし、ユーザー数も13万人を突破した。今回のシリーズCの資金調達により、現在100人のグローバルチームの規模を来年までに倍増させる計画だ。

また、営業やマーケティング、国際的な事業拡大にも投資する。同社は、すでにエストニアにオフィスを構えているが、ザイラー氏は多くの顧客を獲得しているオーストラリア、インド、トルコも視野に入れている。また、最初の顧客を獲得したばかりのEdge AI製品にも引き続き取り組む。

今回の投資の一環として、NEAのパートナーであるAndrew Schoen(アンドリュー・ショーン)氏がClarifaiの取締役会に加わる。同社は数年前から注目されていたが、ショーン氏は当時、投資には早すぎると感じていた。

「最初の頃、AIの風は構造化データを中心に吹いていました。データの90%は非構造化でしたから、これはすぐに手に入る果実だと言えました」とショーン氏は語った。「エコシステムが成熟した今、企業は構造化データからできる限りのことを絞り出したことがボトルネックになっていることに気づきました。今、企業の手元には使えない非構造化データが残り、それがきちんと整理されていません。Clarifaiは、この問題を解決することを目的としています」。

ショーン氏は、ClarifaiがAIと機械学習を解明し、民主化すると考えている。同社は早くから非構造化データに着目していたため、アーリーアダプターを獲得することができた。現在ではこの分野をリードしている。

さらにショーン氏は、同社の収益予測は過去12カ月の間に変曲点を迎え、ビジネスは「順調に成長している」という。

「Clarifaiはこれまで、顧客を獲得し、市場を教育しなければなりませんでした。今では市場に対して自社の製品をプッシュするのではなく、プル型になっています。企業側がソリューションを探し、Clarifaiが適切な製品だと見ているのです」と付け加えた。

画像クレジット:Yuichiro Chino / Getty Images

原文へ

(文:Christine Hall、翻訳:Nariko Mizoguchi

AIコピーライティングツールのCopy.aiが2021年2回目の資金調達を完了

Twitter(ツイッター)でCopy.ai(コピーエーアイ)を発表してから1周年を迎えた同社が、再び資金調達ラウンドを確保した。Copy.aiは、GPT-3 AIを搭載し、ビジネス顧客向けにコピーライティングツールを生成するプラットフォームだ。

同社は1100万ドル(約12億5000万円)のシリーズAラウンドを引き寄せた。Wing Venture Capitalがリードし、既存投資家からCraft VenturesとSequoia、新規投資家としてTiger GlobalやElad Gilなどが参加した。3月に発表した290万ドル(約3億3000万円)のシードに続くラウンドとなった。資金調達総額は1390万ドル(約15億8000万円)に達した。

Copy.aiのソフトウェアは月額35ドル(約4000円)かかる。例えば、数行の文章をもとにブログ記事のアウトラインを用意したり、Facebook広告用のリンク説明文を作成したり、さらには会社のモットーを作り出すこともできる。

CEOのPaul Yacoubian(ポール・ヤコビアン)氏とChris Lu(クリス・ルー)氏が共同で創業してから1年、まだ利益は出ていないが、年間経常収益はゼロから240万ドル(約2億7000万円)に増えた。また、従業員も3人から13人になったと、ヤコビアン氏はTechCrunchに語った。

2021年初めに資金を調達したものの、ヤコビアン氏とルー氏はシリーズAの時期がきたと感じていた。チームを拡大し、新しい製品機能実現に向けエンジニアを増員するためだ。最近の機能としては、ユーザーがアプリ内で直接、考えを整理したり、アイデアを保存したり、メモを編集したりすることができる「Editor」がある。Copy.aiは、長編コンテンツ制作のための製品も開発している。

「AIはパターンマッチングに長けており、ビジネスに関する情報を多く与えると、そのビジネスが何なのかを推定することができます。そのため、私たちはチーム製品も開発しています。AIがより多くを学習すると、他のビジネスユーザーを招待して登録することができます」とヤコビアン氏は付け加えた。

同社は、新たな資本を採用に投入する。完全なリモートチームで、全国に従業員がいる。eBay、Nestlé、Ogilvyなど、すでに30万人以上のマーケターがCopy.aiのツールを利用している。シードラウンド以降、25万人以上が無料トライアルに登録し、5000人以上のプレミアム顧客を抱える。

ヤコビアン氏によると、Copy.aiはAIによる自然言語生成に早くから取り組んでいる。まだ表面的なものにすぎないため、今後もアプリのコアとなる体験や生成するテキストの質を向上させていくとのことだ。

創業者らは、Wing Venture CapitalのパートナーであるZach DeWitt(ザック・デウィット)氏とも意気投合した。ヤコビアン氏によると、デウィット氏は、Copy.aiのビジョンと人工知能がどれほどマーケターの役に立つかを理解しているという。

「AIのクリエイティブな能力を前にして、自動化が仕事を奪うという話はよく聞きますが、自分や自分の会社のために価値を生み出すという語り口はあまり聞きません」とヤコビアン氏は話す。「AIが進化すれば、エンパワーメントの源となり、無限の可能性を秘めたもう1つのツールとなるでしょう。人的資本を解放し、フルタイムの代理店を雇う余裕のない小規模な企業に対し、迅速でシンプルな問題解決ツールを提供できる点が興味深いと思います」。

デウィット氏は、デジタル化の進展とともに、顧客はオンラインへ移行する一方であり、企業はニュースレター、ブログ、ソーシャルメディア、電子メールなど、顧客が読むものに合わせて対応する必要があると述べた。

同氏は、Copy.aiを利用する中小企業の顧客と話をする中で、書かれたコンテンツの量に圧倒されている人がいること、また、マーケターや創業者が優れたコピーを書けるようにするには、AIを利用するのが最適であることを感じたという。

デウィット氏自身、この製品を使って、最初の社内向けのメールを作成した。また、毎週ブログを書き、Twitterでも活動しているため、ブログ記事のアイデアやコンテンツのフォーマットを考える際にCopy.aiの製品を重宝しているという。

さらにデウィット氏は、Wing Venture Capitalが出会った若い会社の中でも、Copy.aiは最も急速に成長している会社の1つだと付け加えた。また、ソーシャルメディアを活用し、Copy.aiの諸数値を公開している。それがロイヤリティを生むとともに、当初Wingがこの会社に惹かれた側面を他の人も公に知ることができる。

「今回のラウンドは大幅な申し込み超過でした。会社への関心の高さ、チームの質の高さ、勢いの強さを感じていただけると思います」とデウィット氏は付け加えた。「クリスとポールには、将来の成功のために投資家を選ぶ贅沢がありました」。

画像クレジット:Copy.ai

原文へ

(文:Christine Hall、翻訳:Nariko Mizoguchi

Linked Idealがナレッジベース構築プラットフォーム「Toposoid」をオープンソースとして公開

Linked Idealがナレッジベース構築プラットフォーム「Toposoid」をオープンソースとして公開

人工知能を活用したデータ分析を行うLinked Ideal(リンクトイデアル)は10月10日、ナレッジベース構築プラットフォーム「Toposoid」をオープンソースソフトウェア(OSS)として公開した(GitHub)。ナレッジベース(知識ベース)とは、人の知識を可視化して蓄積し、検索可能にしたデータベースのこと。

Toposoidには次の3つの特徴がある。

文章を入力するだけでナレッジベース構築が可能

普通に文章を入力するだけで、文章が解析され、ナレッジグラフ(知識グラフ)構造としてデータベースに蓄積される。ナレッジグラフデータは、グラフデータベース「Neo4J」で管理している。

文章入力でナレッジベースを探索し説明可能性のある結果が得られる

ナレッジベースと照合したい文章をそのまま入力すれば、解釈、照合が行われ、真偽判定結果を得ることができる。同時に、その判定が論理的に支持される理由の説明も示される。

オープンソースを活用したプラットフォームで推論エンジンを拡張

OSSなので、開発者による拡張が可能。推論エンジンのプログラムは、開発者が使い慣れている言語で拡張や差し替えが自由に行える。

アメリカの市場調査会社IDCの2020年5月の調査では、2020年のデジタルデータ総量はおよそ59ZB(
ゼタバイト。59兆GB)に相当し、2000年から比べると1万倍に増えたとのこと。Linked Idealは、「ヒトは文章という情報に限ってもその膨大な情報の理解をコンピューターにサポートしてもらわざるを得ない時代に入った」と話す。そこで、文章を加工せずそのまま入力して知識の蓄積が行え、また文章で探索が行えて、説明可能性のある結果が得られるToposoidのようなツールがますます重要になるとしている。

今後は、OSSで提供される機能に加え、商用ライセンスの形でさらに高度な推論機能を備えたバージョンをリリースする予定だとLinked Idealは話している。さらに大規模なデータ処理機能、高負荷の耐用性および高可用性を持たせるために、クラウドから利用できるサービスを構築中。「社会課題に対してより安定したサービスを提供できるよう進化してまいります」とのことだ。