「常識」獲得に向け少しずつ進化するコンピュータービジョン、フェイスブックの最新研究

機械学習は、やり方を教えるデータさえあれば、あらゆることができる。これは必ずしも簡単なことではない。だから研究者は、AIに少々の「常識」を加える方法を常に模索している。常識があれば、AIが猫だと認識する前に500枚の猫の写真を見せる必要がなくなるからだ。Facebook(フェイスブック)の最新の研究は、データのボトルネックを減らす方向へ大きな一歩を踏み出した。

同社の強力なAI研究部門は、高度なコンピュータービジョンアルゴリズムなどの技術進歩や応用範囲拡大の方法に長年取り組んでいる。着実に前進しており、その成果は一般に他のリサーチコミュニティと共有されている。Facebookが特に追求している興味深い開発の1つは「半教師あり学習」と呼ばれるものだ。

一般にAIの訓練について考えるとき、上述の猫の500枚の写真のようなものを思い浮かべる。こうした画像はあらかじめ選り分けられ、ラベルが付されている(つまり、猫の輪郭が描かれていたり、猫の周りに四角い囲みをつけたり、単に猫が画像の中のどこかにいると示されていたりする)。こうして、機械学習システムが猫の認識プロセスを自動化するアルゴリズムを作れるようにする。当然のことながら、犬や馬で行いたい場合は、500枚の犬の写真、500枚の馬の写真などが必要となる。つまり、線形に応用範囲が広くなる。テクノロジーの世界では決して目にしたくない言葉だ。

「教師なし」学習に関連する半教師あり学習では、ラベル付けされたデータをまったく使用せずにデータセットの重要な部分を理解する。これで単純に明後日の方向に進んでしまうことはなく、そこにはまだ構造がある。例えばシステムに1000個の文(センテンス)を与えて学習させた後、いくつかの単語が欠落している10の文をシステムに提示する。システムはおそらく、最初に見た1000文に基づき空白を埋めるまともな仕事をすることができる。しかし、それを画像や動画で行うのはそれほど簡単ではないし、単純でも予測可能でもない。

だがFacebookの研究者は、簡単ではないかもしれないが可能であり、実際には非常に効果的であることを示した。DINOシステム(DIstillation of knowledge with NO labels「ラベルなしでの情報抽出」の略)は、ラベル付きのデータが皆無でも、人、動物、静物のビデオの中から目的のものを見つけるべく学習することができる。

画像クレジット:Facebook

AIは上記の処理を、1つずつ順番に分析される一連の画像として動画を捉えるのではなく「一連の単語」と「文」の違いのような複雑で相互に関連する集まりとして捉えることによって行う。動画の冒頭だけでなく、途中や最後にも注意を払うことで、AIエージェントは「この一般的な形の対象物が左から右に移動する」という感覚を得る。その情報は他の知識にも反映される。例えば右側にある物が最初の物と重なっている場合、システムは双方の輪郭をパッと見て同じではないと認識する。その知識は他の状況にも応用できる。言い換えれば、AIは「見たものの意味」という基本的な感覚を養う。そして新しい対象物に関して非常に少ない訓練で同じことを行う。

これによりコンピュータビジョンシステムは、従来の訓練を受けたシステムと比べて優れたパフォーマンスを発揮するという点で効果的であるだけでなく、関連づけや説明する能力が高まる。例えば500枚の犬の写真と500枚の猫の写真で訓練されたAIは犬と猫を認識するが、その類似性はまったく理解しない。だがDINOは、具体的にではないが、両者が視覚的に類似し、とにかく車よりも類似していることを理解する。そしてメタデータとコンテキストがメモリで見えるようになる。犬と猫は、犬と山よりも、その種のデジタル認知空間では「近い」のだ。こうした概念は小さな集まりとして見ることができる。下の画像で、ある種の概念同士がどのくらい近接しているのか見て欲しい。

画像クレジット:Facebook

これには、この記事では取り上げない技術的な利点がある。興味がある人は、Facebookのブログ投稿にリンクされている論文に詳細があるので参照されたい。

隣接する研究プロジェクトとしてPAWSと呼ばれる訓練方法もある。これは、ラベル付けされたデータの必要性をさらに減らす。PAWSは、半教師あり学習のアイデアの一部を従来の教師ありメソッドと組み合わせて、ラベル付きデータとラベルなしデータの両方から学習させ、訓練を飛躍的に向上させる。

Facebook自身はもちろん、多くのユーザー向け(そして秘密の)画像関連の製品のために、速く優れた画像分析を必要としている。だが、コンピュータービジョンの世界でのこうした一般的な進歩は、目的が異なる開発者コミュニティでも歓迎されることは間違いない。

カテゴリー:人工知能・AI
タグ:機械学習コンピュータービジョンFacebook

画像クレジット:Facebook

原文へ

(文:Devin Coldewey、翻訳:Nariko Mizoguchi

ウェブを閲覧しながら外国語を学べるToucanが約4.9億円を追加調達

ウェブを閲覧しながら新しい言語を学ぶことができるスタートアップのToucan(トゥーキャン)が、シード資金調達で450万ドル(約4億9000万円)を追加したと発表した。

2020年秋にお伝えしたように、カリフォルニア州サンタモニカを拠点とするこのスタートアップは、ユーザーが読んでいるウェブサイトのテキストをスキャンして、選ばれた単語を学習対象の言語に翻訳するChrome拡張機能を開発した。つまり、わざわざ勉強する時間を作ったり、日常的な行動パターンを変えることなく、外国語の語彙を増やすことができるのだ。

関連記事:ウェブをブラウズしながら外国語を学習できるToucanが3億円を調達

Toucanは現在、スペイン語、韓国語、フランス語、ドイツ語、イタリア語、ポルトガル語、日本語の7言語に対応している。同社共同設立者でCEOを務めるTaylor Nieman(テイラー・ニーマン)氏によると、同社の月間アクティブユーザー数は約6万人で、すべて有機的に獲得したものだという。

「Toucanは表面的にはおもちゃのように見えますが、その裏には大規模なエンジニアリング技術が存在します」と、ニーマン氏は付け加えた。

例えば、このスタートアップには人間の翻訳者チームがいるが、機械学習と自然言語処理を利用して、各単語の文脈を理解し、適切な翻訳になるように努めている。ニーマン氏によると、時間の経過とともに、表示される翻訳にインテリジェントでパーソナライズされたアプローチを適用することで、翻訳をより複雑にすることができ、ユーザーの意欲を維持するという。

画像クレジット:Toucan

Toucanは無料で利用できるが、ユーザーは月額4.99ドル(約544円)を支払って、より密度の高い翻訳が提供されるToucan Premiumに加入することもできる。Toucan Premiumの加入者は、広告の表示 / 非表示を選択することも可能だ。どうやら「Own The Word広告」(その単語が翻訳されるたびにスポンサーのメッセージが表示される機能)は人気があるため、有料ユーザーの中にはこの機能を失いたくない人もいるらしい。

Toucanは今回の追加によって総額750万ドル(約8億2000万円)を調達した。この投資ラウンドは、LightShed Ventures(ライトシェド・ベンチャーズ)が主導し、新規投資家となったNext Play Ventures(ネクスト・プレイ・ベンチャーズ)、Concrete Rose Capital(コンクリート・ローズ・キャピタル)、GingerBread Capital(ジンジャーブレッド・キャピタル)、Form Capital(フォーム・キャピタル)、Goodwater Capital(グッドウォーター・キャピタル)、Hampton VC(ハンプトンVC)、Spacecadet Ventures(スペースカデット・ベンチャーズ)、GTMfund(GTMファンド)、Baron Davis Enterprises(バロン・デイビス・エンタープライゼス)、Human Ventures(ヒューマン・ベンチャーズ)が、既存の投資家であるGSV Ventures(GSVベンチャーズ)、AmplifyHer Ventures(アンプリファイハー・ベンチャーズ)、Vitalize(ヴァイタライズ)とともに参加した。

LightShed VenturesのゼネラルパートナーであるRichard Greenfield(リチャード・グリーンフィールド)氏は、声明の中で次のように述べている。「若い世代は常にネットに接続した状態で生活しているため、画面を見ている時間は世界的に増加しています。Toucanは、シンプルなブラウザの拡張機能を介して、すでに利用しているウェブサイト(まもなくアプリも)に言語学習をシームレスに統合し、画面を見ている時間を学習する時間に変えることができます」。

ニーマン氏によると、Toucanは今回の資金調達により、チームを12人から16人に拡大する予定だという。また、英語からスペイン語への翻訳だけでなく、スペイン語から英語への翻訳など、さらなる国際化も計画している。新たにSafari(サファリ)の拡張機能もリリースされる(将来的には、より多くのブラウザをサポートする予定だ)。最終的なビジョンは、Toucanが「どこにいてもレイヤー化されている」ことである。

「私たちは、ウェブ、モバイルブラウジング、人気のソーシャルアプリ、さらには物理的な世界においても、学習の拡張レイヤーになりたいと思っています」と、ニーマン氏はいう。将来は「街中で目にする地下鉄の標識を翻訳し、あらゆるところで学習のマイクロモーメントを提供する超クールなコンタクトレンズを、人々が装着しているかもしれません」と、彼女は予測する。

カテゴリー:ネットサービス
タグ:Toucan語学学習資金調達翻訳機械学習自然言語処理

画像クレジット:Toucan

原文へ

(文:Anthony Ha、翻訳:Hirokazu Kusakabe)

材料研究を効率化するプラットフォーム開発するのイスラエルMaterials Zoneが約6.5億円を調達

テルアビブに拠点を置くスタートアップ企業で、AIを活用して材料研究の高速化を図るMaterials Zone(マテリアル・ゾーン)は、シードラウンドで600万ドル(約6億5000万円)の資金を調達したと、米国時間4月27日に発表した。この投資ラウンドはInsight Partners(インサイト・パートナーズ)が主導し、クラウドファンディングの「OurCrowd(アワークラウド)」も参加した。

Materials Zoneのプラットフォームはさまざまなツールで構成されているが、その中核となるのは、科学機器や製造施設、実験装置、外部データベース、発表された論文、Excelシートなどからデータを取り込み、それを解析して標準化するデータベースだ。このデータベースは必要に応じて可視化することができ、研究者にとってはこれがあるだけで恩恵になると、同社は主張する。

画像クレジット:Materials Zone

「新しい技術や物理的な製品を開発するためには、まずその製品を構成する材料やその特性を理解する必要があります」と、Materials Zoneの創設者でCEOを務めるDr. Assaf Anderson(アサフ・アンダーソン博士)はいう。「ゆえに、材料の科学を理解することがイノベーションの原動力となります。しかし、材料の研究開発や生産の背景にあるデータは、慣習的に管理が不十分で、構造化されておらず十分に活用されていませんでした。そのため実験が重複したり、過去の経験を生かすことができなかったり、効果的な共同作業ができなかったりして、莫大な費用と手間が無駄になっていました」。

画像クレジット:Materials Zone

アンダーソン博士は、Materials Zoneを設立する以前、バル=イラン大学のナノテクノロジー・先端材料研究所に在籍し、コンビナトリアルマテリアル実験室の責任者を務めていた。

Materials Zoneの創設者でCEOであるアサフ・アンダーソン博士(画像クレジット:Materials Zone)

「私は材料科学者の1人として、研究開発の課題を身をもって経験しているため、研究開発がどのように改善できるかということを理解しています」と、アンダーソン博士はいう。「私たちは長年の経験を元に当社のプラットフォームを開発し、革新的なAI(人工知能)/ML(機械学習)技術を活用して、これらの問題に対する独自のソリューションを生み出しました」。

例えば、新しい太陽光発電用の透明なウィンドウを開発するためには、適切なコア材料とそのパラメータを見つけるために何千回もの実験が必要になる。Materials Zoneは、このようなデータをすべて集約して標準化し、それを扱うためのデータおよびワークフロー管理ツールを提供することで、このプロセスをより速く、より安価に行えるようにすると、アンダーソン博士は説明する。その一方で、同社の分析・機械学習ツールは、研究者がこのデータを解釈するための支援をする。

 

カテゴリー:ソフトウェア
タグ:Materials Zone資金調達人工知能 / AI機械学習データベースイスラエル材料

画像クレジット:SEBASTIAN KAULITZKI/SCIENCE PHOTO LIBRARY / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Hirokazu Kusakabe)

アマゾンがML学習用カーレースDeepRacerデバイスソフトのオープンソース化を発表

Amazon(アマゾン)が2018年にAWS DeepRacerを発表した際、それは開発者が機械学習を学ぶのを助ける楽しい方法として意図されていた。その後進化を遂げ、DeepRacerのコンペを取り入れてきたが、米国時間4月27日に同社は新しい機能を追加することを発表した。それは、ミニカーを走らせるために同社が作成したソフトウェアをオープンソース化するというものだ。

DeepRacerは、Ubuntu LinuxとアマゾンのRobot Operating System(ROS)を搭載したミニコンピュータを中核としている。同社はデバイスソフトウェアを開発者に公開することで、クルマのデフォルト動作を変更できるようになり、よりクリエイティブな利用を促進できると考えている。

「AWS DeepRacerのデバイスコードがオープンソース化されたことで、現在トラックで使用されているレーシングカーのデフォルト動作を迅速かつ簡単に変更できます。対策を講じて他のクルマが追い越すのをブロックしたいですか?A地点からB地点まで自動車を速く走らせるために、独自のカスタムアルゴリズムを導入したいですか?あなたはそれを夢見てコードを書くだけでいいのです」と、アマゾンはオープンソース化を発表したブログ記事で述べている。

2018年に車両を導入した後、アマゾンはDeepRacerのリーグを展開し、最近ではバーチャルレースも実施している。実際に同社は2020年3月にリーグを再編し、新たな人々がこの技術に関わるのを奨励した。オープンソースのコンポーネントを追加することで開発者が自分で作る機会を得て、これまで不可能だった新しい利用層を車両に追加しさらに関心が高まる可能性がある。

AWSのMarcia Villalba(マルシア・ビラルバ)氏が3月のブログで述べたように、これは開発者に機械学習の基礎を教えることを目的としている。

「AWS DeepRacerはAWS DeepRacerコンソールで仮想的にレースをしたり、AWSや顧客のイベントで物理的にレースを行ったりすることで、『強化学習』モデルをテストするために設計された1/18スケールの自律的なレースカーです。AWS DeepRacerはMLの経験のありなしに関わらず、あらゆるスキルレベルの開発者を対象としています。AWS DeepRacerを使ってRLを学ぶ際には、AWS DeepRacer Leagueに参加して楽しくかつ競争の激しい環境で機械学習を体験できます」。

クルマのソフトウェアをカスタマイズしたい場合、プロジェクトのドキュメントはGitHubAWS DeepRacer Open Sourceページで入手でき、6つのサンプルプロジェクトから始めることができる。

関連記事
Amazonが開発者たちに機械学習を教えるために、縮小版自動運転車を発表
AWSがML学習用カーレースDeepRacer Leagueの敷居を下げて新人を歓迎

カテゴリー:人工知能・AI
タグ:AmazonDeepRacerAWS機械学習

画像クレジット:Amazon

原文へ

(文:Ron Miller、翻訳:塚本直樹 / Twitter

数百億円台のAIラウンドがあってもおかしくない理由

スタートアップとマーケットの週刊ニュースレター「The TechCrunch Exchange」へようこそ。

準備OK?ここではお金の話、スタートアップの話、IPOの噂話などをお伝えする。

先週、Scale AI(スケールAI)が3億2500万ドル(約353億5000万円)のシリーズE調達を行った。TechCrunchも書いたように、この会社はデータラベリングの分野で活躍している。そして、ここ数年は資金調達にも大いに力を入れてきた。2019年にTechCrunchは、同社の当時22歳のCEOが1億ドル(約109億円)のラウンドを組んだことを記事にしている。そして2020年12月には約35億ドル(約3807億3000万円)の評価額で1億5500万ドル(約168億6000万円)を調達した。今では70億ドル(約7兆6000億円)以上の価値がある。

すごい話だよね?さて、先週初めにわかったのだが、どうやら2021年は、AIスタートアップにとって、全般的にとんでもない年になっているようだ。PitchBookのデータによれば、2021年の初めから4月12日までに、米国でのAIスタートアップの取引は442件、金額にして116億5000万ドル(約1兆2672億9000万円)に達している。そして、最近発表されたMicrosoftによるNuance AI(ニュアンスAI)の買収は、さらにこうした事象を加速させるかもしれない。

Sapphire VenturesのJai Das(ジェイ・ダス)氏に、AIベンチャー市場についての意見を、The Exchangeに寄せてもらった。同氏は、この分野の第1四半期における競争状況に対する、私たちからの質問に対し、第1四半期における「AI/MLスタートアップへの投資活動は、絶対にトチ狂っていますね」と答えた。

ダス氏によれば「AI / MLスタートアップは、日常的に一流のVCファームから5、6通の条件規定書を受け取っていますし、ARR(年間経常収益)の150~250倍の資金調達ができています」とのことだ。

このことを少し考えて欲しい。2020年私たちは、公開ソフトウェア企業が新たな高みに達したのを目にしてきたが、たとえ積極的なスタートアップのラウンドであったとしても、上の数字は非常に大きなものだ。経常収益が100万ドル(約1億1000万円)に過ぎないAIに特化したスタートアップが、25億ドル(約2719億5000万円)の評価を受けることを想像してみて欲しい。なんてこった。

しかし、AI投資のペースはどうだろうか?聞くところでは、多くのスタートアップで、ラウンド開始から終了までの時間に対する短縮に次ぐ短縮が行われているという。ダス氏は、この状況を説明するために「ほとんどの企業は、投資が実際に行われるはるか前にデューデリジェンスを完了しています」とメールで述べている。つまり「投資を行う時点ではもはやデューデリジェンスを行う必要がない」ということだ。

それって本当に意味があるのだろうか?もしラウンドが先制的なものならば、事前に徹底調査をしなければならない(これはダス氏が後ほどコメントで強調したことだ)。そうでなければ、盲目的に投資したり、動きの速い他の企業に取引を先取りされてしまうことになる。

今週のThe Exchangeでは、国内のベンチャーキャピタル市場についても、シード案件やニュースで話題になるような超レイトステージ投資に焦点を当てつつ掘り下げてみた。アーリーステージのベンチャー投資に関するコメントとして、EYの米国Venture Capital責任者であるJeff Grabow(ジェフ・グラボウ)氏からのコメントが寄せられた。

そのプレシード、シード、ポストシードについてのコメントの中で、私たちの注意を特に引くものがあった。予測に関するものだ。グラボウ氏は次のように語る。

2021年第1四半期のプレシード資金調達は、例年と比較すると好調でした。現在利用可能な資金が豊富で、技術的なソリューションで新市場を開拓できる、投資可能なテーマが数多くあることから、全体的な環境は引き続き堅調に推移すると考えています。このことから新型コロイナウイルス後の環境は、バラ色に描かれています。

これは私たちの社内での予測と同じだ。2021年第1四半期は、少なくとも米国のベンチャーキャピタル活動は非常に活発だったため(近々、海外事情も伝わってくるだろう)、2021年は多くの点で記録的な年になると思われる。大きく減速する傾向もみられないので、記録は更新されることだろう。そしてグラボウ氏もこうして新型コロナウイルスの流行が終了した後のベンチャー環境が、かなり魅力的なものになることを、はっきりと予想している。

ということで、記録は更新されるだろう。問題はその大きさがどれくらいになるのかということだ。

Coinbaseの直接上場に関するその他の情報

終わった話をあれこれいうつもりはないが、Coinbase(コインベース)の直接上場について、いくつか情報を追加しておこう。

消費者向け取引アプリRobinhood(ロビンフッド)の、ライバルであるPublic.com(パブリックコム)が、The Exchangeに対して、Coinbaseの株式に対する小口取引の関心がどれほどのものだったかを教えてくれた。いつもの広報担当者であるMo(モー)氏によれば、米国時間4月14日、Coinbaseは取引数で「公開されている全銘柄の中で最も人気があった」という。そしてさらに特筆すべきは、同じ日に「(投稿数で計測した)ソーシャルアクティビティが前日に比べて70%増加した」ことだ。

消費者トレーディングのブームがいつまで続くかはわからないが、これはかなりすばらしい指標値だ。

また、Similarweb(シミラーウェブ)は、2021年1月のcoinbase.comへのアクセス数が8640万件に達したことなどの、いくつかのデータを紹介している。いやあ、こいつはすごい。また、この月は新規訪問者数が再訪問者数を上回っている。このデータは、Coinbaseが第1四半期に大きな結果を出した理由を説明している。ということで現在の疑問は、こうした強気の動きを維持できるのかどうか、あるいは率直に言って、特に暗号資産の取引に対する消費者の関心が、株式取引のブームよりも長持ちするかどうかという点だ。

先週ポッドキャストなどでも何度か話題に出た、CoinbaseのシリーズDを主導した投資家のTom Loverro(トム・ラベロ)氏は「私たちはまだ暗号資産の第2ラウンドに立ったに過ぎません」と語っている。ということで、これらの話題は何度も何度も繰り返し出てくるだろう。ということでもう1度。

その他のことなど

さて記事の文字数の目標に達することができるように、先週のIPO市場に関するメモをいくつか。

まず、AppLovin(アプラビン)のIPOは計画どおりには進まなかった。モバイルアプリケーションに特化したハイテク企業の同社は、範囲の中央値である1株あたり80ドル(約8702円)という控えめな価格がついた後、最初の2日間の取引で価値が下落した。金曜(米国時間4月16日)終了時点では、1株あたり61ドル(約6636円)になった。

The Exchangeは、AppLovin社のCFOであるHerald Chen(ヘラルド・チェン)氏に、IPO当日にインタビューを行った。チェン氏との会話からは、上場したことで買収をより加速できるのではないかと感じることができた。流動性のある株式を所有しているということは、これまで以上に買収されやすくなったということだ。またS-1ファイリングによれば、AppLovin社は、他の企業を買収し、そのビジネスプロセスを実行して、収益を得ることができると主張している。

もしそれが実現できるなら、公開市場から同社に対する見方は少し厳し過ぎるかもしれない。現在の状況下で、ソフトウェア会社がIPO後に苦労しているのを見るのは少し奇妙なことだ。

また、チェン氏はThe Exchangeに対し、公開に先立つ会社説明会の際にマルチクラスの株式構造(株式に議決権などの差をつけること)についての反発は見られなかったと語っている。マルチクラス株式の悪影響については、同僚のRon Millerと一緒に書いたことがある。チェン氏は、たとえ議決権の異なる複数クラスの株式を保有していても、1人の人間が会社を完全にコントロールすることはできないと述べている。率直に言って、それが問題なのだが。

AppLovinの取引には注目して行くつもりだ(その数字に関する以前の記事はこちら)。

最後に。自動運転トラック会社のTuSimple(トゥーシンプル)が先週上場し、Similarwebが上場を申請した。また、UiPath(ユーアイパス)が価格帯を引き上げるか否かといった、幅広いIPO市場の動向にも注目している。私たちはその点について予測を行っている

そして週の終わりになって、Squarespace(スクエアスペース)がS-1(上場目論見書)を公開した。記事はこちら、続報も予定している。

ではまた。

カテゴリー:VC / エンジェル
タグ:The TechCrunch ExchangeAI機械学習Coinbase新規上場資金調達

画像クレジット:Nigel Sussman

原文へ

(文:Alex Wilhelm、翻訳:sako)

データ品質の監視を自動化するBigeye(旧Toro)がシリーズAで約18.5億円調達

企業が機械学習モデルを作る際、オペレーションチームはモデルの作成に使うデータの品質に問題がないことを確認しなくてはならない。このプロセスには往々にして時間がかかる。Bigeye(旧社名Toro)はデータ品質の監視を自動化するアーリーステージのスタートアップだ。

米国時間4月15日、同社はSequoia Capitalが主導するシリーズAで1700万ドル(約18億5000万円)を調達したと発表した。このラウンドには以前に投資していたCostanoa Venturesも参加した。Bigeyeは2020年5月にシードラウンドで400万ドル(約4億3500万円)を調達しており、今回のラウンドでこれまでの調達金額の合計は2100万ドル(約22億8500万円)となった。

2020年5月、BigeyeのCEOで共同創業者のKyle Kirwan(カイル・カーワン)氏は、シードラウンドでは人材の雇用と自動化機能の追加に集中すると述べていた。現在、同社のスタッフは11人となり、同氏はシードラウンドのゴールは達成したとしている。

カーワン氏は「我々の製品でデータ品質のメトリクスとして何を収集する必要があるかを自動で示せるようになったため、SnowflakeやAmazon Redshiftなどのテーブルを指定すれば、そのテーブルを分析しデータ品質を監視するために収集するメトリクスを提案できます。また、アラートも自動化しました」と説明する。

Bigeyeはモデルに入力するデータオペレーションの問題に特化しているとカーワン氏はいう。例えばテーブルが想定通りに更新されていない、行が足りない、重複するエントリーがあるといった問題だ。同社の製品は、こうした問題に対するアラートを自動化し、トレーニングや本番環境で使えるデータを準備するプロセスをスピードアップする。

Sequoiaのパートナーで今回の投資をリードしたBogomil Balkansky(ボゴミル・バルカンスキー)氏は、Bigeyeは機械学習のパイプラインにおける重要な部分に取り組んでいると見ている。同氏は発表の中で「Uberでデータ品質チームを率いてきたカイルとエゴール【訳者注:CTOのEgor Gryaznov(エゴール・グリャズノフ)氏】は、すべての企業にデータ品質のインサイトを常に提供するという明確なビジョンを持っています」。と述べた。

創業者チームがBigeyeを始めるにあたり、多様性のあるチームにすることを重要なゴールとして掲げ、このことを強く意識しているとカーワン氏は話す。

同氏は「ある1つの型に合う人を大勢雇うのは簡単なことです。自分たちのネットワークの中で人を見つけるのは簡単ですが、さまざまなバックグラウンド、さまざまな視点、さまざまなタイプの人物を雇用していく必要があり、(このことをよく理解して)細心の注意を払って努力したいと思っています。これが最強のチームづくりにつながるからです」と述べた。

BigeyeにはオンプレミスとSaasのソリューションがあり、Instacart、Crux Informatics、Lambda Schoolなどに有料で提供しているが、一般に公開されるのは2021年後半の予定だ。

カテゴリー:人工知能・AI
タグ:Bigeye機械学習資金調達

画像クレジット:GelatoPlus / Getty Images

原文へ

(文:Ron Miller、翻訳:Kaori Koyama)

機械学習のフィーチャーストアTectonがオープンソースの同サービスFeastを併合

機械学習のフィーチャーストアという概念を開拓したTectonが、Feastと呼ばれるオープンソースのフィーチャーストアプロジェクトの創業者とチームを組んだ。そして米国時間4月15日、同社は、オープンソースツールのバージョン0.10のリリースを発表している。

「フィーチャーストア」は、Tectonの創業者たちがUberのエンジニアだったときに考えたコンセプトだ。その後、Willem Pienaar(ウィレム・ピエナール)という名前のエンジニアが創業者のUberのブログ記事を読んでフィーチャーストアの構築について知り、そのコンセプトのオープンソースバージョンとしてFeastの構築に着手した。

Tectonの共同創業者でCEOのMike Del Balso(マイク・デル・バルソ)氏は次のように説明する。「Tectonは、フィーチャーストアを産業界に持ち込んで、最上級のエンタープライズフィーチャーストアを作ることが狙いだ。それに対してFeastはウィレム(・ピエナール)が開発したもので、私たちがUberで公開した初期の設計からヒントを得たようだ。彼が作ったFeastは、オープンソースのフィーチャーストアのスタンダードのようなものに進化し、今ではLinux Foundationの一部となっている」。

Tectonはその後ピエナール氏を雇用し、現在、彼は同社のエンジニアとしてそのオープンソースチームを率いている。同社最初の事業計画にはオープンソースのプロダクトはなかったが、今では2つのプロダクトが密接な関係にある。ピエナール氏の雇用も、理に適っていた。

「2つのプロダクトは多くの点でとてもよく似ている。類似性があって両者が共生している、ともいえるだろう。意図的な整合作業は一切必要ない。Tectonのプロダクトは、Feastにあるもののスーパーセットだ。先進的な機能が多いTectonはいわばエンタープライズバージョンで、一方Feastには実戦で鍛えられたオープンソースのフィーチャーストアがある」とピエナール氏はいう。

TectonはシリーズBで3500万ドル(約38億円)を調達した。それを報じる本誌2020年12月の記事では、フィーチャーストアについて「それはエンド・ツー・エンドの機械学習管理システムであり、そこにはデータを特徴量というものに変換するパイプラインと、それら特徴データのすべてを保存して管理する機能、および整合性のあるデータ集合をサーブする機能がある」と説明している。

デル・バルソ氏によると、ビジネスとして見た場合には、オープンソースのフィーチャーストアに寄与貢献すると会社がこれまでとは違うユーザーグループに知られることになり、また商用製品とオープンソース製品が互いに補い合って作られていく。

「私たちが気に入っている非常に強力なものとは、Feastのコミュニティに深く入り込むことによって、極めて多様で興味深いユースケースから多くを学び、Tectonのプロダクトを改良できることだ。また同様に、エンタープライズの顧客から得たフィードバックでオープンソース製品を改良できる。それは一種の交叉学習であり、フィードバックのループが理想的に回っている」とデル・バルソ氏は語る。

計画ではTectonが、Tectonの中でFeastに専念するチームへの主要なコントリビューターであり続ける。本日、同社はそのプロダクトのバージョン0.10をリリースする。

カテゴリー:人工知能・AI
タグ:Tecton機械学習

画像クレジット:Andriy Onufriyenko/Getty Images

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)

機械学習モデルの作成とメンテナンスを支援するCometがシリーズAで14.1億円調達

機械学習のスタートアップへの投資が最近とても多いのは、多様な企業が多様な事業にその応用を見出そうとしているからだ。そうした顧客企業におけるモデルの長期の継続的開発を、最後にはプロダクション(本番稼働)に行き着く実験的なプロセスで支援するCometが、米国時間4月8日にシリーズAで1300万ドル(約14億1000万円)を獲得したことを発表した。

Scale Venture Partnersがそのラウンドをリードし、これまでの投資家であるTrilogy Equity PartnersとTwo Sigma Venturesがこの投資を支援した。Crunchbaseのデータによると、Cometの調達総額はこれで2000万ドル(約21億8000万円)近くになる。

投資家たちの目に映じたものは、売上が前年比で500%ほど伸びた企業だ。そう語る共同創業者でCEOのGideon Mendels(ギデオン・メンデルス)氏は、次のように述べる。「このところ、追い風が吹いていた。プロダクトに関しては、弊社が実験管理と呼んでいるものに注力して、実際にモデルの追跡調査を行ってきた。そこで調べるものは、モデルに入ってくるデータと、学習のプロセスをコントロールするハイパーパラメータであり、それらを調べることによってチームのデバッグとモデルの現状理解を助ける」。

今回の資金調達に加えて同社は、モデルをポストプロダクションまで見届ける同社プラットフォームの拡張プロダクト、Comet Model Production Monitoring(Comet MPM)を発表した。

これに関してメンデルス氏は「モデルのプロダクションをモニタリングするプロダクトは、要するにモデルのポストプロダクションにフォーカスするものです。私たちの最初のプロダクトは、訓練の間に複数のオフライン実験がモデルとしてどのようにして作られるかに着目したが、このMPMではこれらのモデルが初めてプロダクションに入って以降にフォーカスする」と説明する。

関連記事:機械学習のモデルの管理を効率化するComet.mlが約5億円を調達

Scale Venture PartnersのパートナーであるAndy Vitus(アンディ・ヴィータス)氏は、Cometのようなライフサイクルを管理するツールには今後、大きな市場があると考えている。「エンタープライズソフトウェアの未来を牽引するものは機械学習とAIだ。そうなれば、企業がモデルのライフサイクルに対する完全な視野とコントロールを確保することが絶対的に欠かせない」とヴィータス氏は声明で述べた。

同社は成長にともなって、ニューヨークのオフィスに加えてイスラエルに新たなエンジニアリングハブを開設した。オフィスは現在、閉鎖しているが、メンデルス氏によると、パンデミックが落ち着いたら、リモートと通勤の両方を混ぜたハイブリッドオフィスにしたいという。

「オフィスはニューヨークとテルアビブの両方に置く計画だが、オフィスで仕事するのが嫌な人はそれでも良いし、週に2日だけオフィスに来るのでもいい。いずれにしても、世界中からの雇用は続けていく」とメンデルス氏は語った。

カテゴリー:人工知能・AI
タグ:Comet機械学習資金調達

画像クレジット:Westend61/Getty Images

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)

少ない計算機資源で機械学習モデルをエッジで展開するためにDeepliteが6.6億円のシード資金を調達

機械学習アプリケーションを展開する際の問題点の1つは、高い計算能力を必要とし、コストがかかる傾向があることだ。モントリオールに拠点を置くスタートアップのDeeplite(ディープライト)は、モデル全体のサイズを縮小し、より少ないリソースのハードウェアで動作させる手段を提供することで、この状況を変えたいと考えている。

カナダ時間4月13日、同社は600万ドル(約6億6000万円)のシード資金調達を発表した。ボストンを拠点とするベンチャーキャピタルのPJCがこのラウンドを主導し、Innospark Ventures、Differential Ventures、Smart Global Holdingsが参加した。またSomel Investments、BDC Capital、Desjardins Capitalも参加している。

DeepliteのCEOで共同創業者のNick Romano(リック・ロマーノ)氏によると、同社の目標は、実行に大量の計算能力と大量のメモリを必要とし、速いペースで電力を消費する傾向のある複雑なディープニューラルネットワークを、少ないリソースでより効率的に実行できるようにすることだという。

「私たちのプラットフォームは、そうした学習モデルを新しいフォームファクターへと変換し、制約のあるエッジハードウェアに展開することができるのです」とロマーノ氏は説明する。それらのデバイスは、携帯電話やドローン、あるいはRaspberry Pi(ラズベリーパイ)のような小さなものにすることも可能だ。つまり、開発者は、現在のほとんどのケースでは不可能な手段でAIを導入することができるのだ。

同社が開発したNeutrino(ニュートリノ)というプロダクトは、モデルの展開の仕方や、モデルを全体のサイズを小さくし実運用に必要なリソースを削減するために、どの程度の圧縮を行うべきかを利用者が指定することを可能にする。基本アイデアは、極めて限られたリソースの下で、機械学習アプリケーションを実行しようというものだ。

最高製品責任で共同創業者のDavis Sawyer(デイビス・ソーヤー)氏は、同社のソリューションが活躍するのは、機械学習モデルが構築されてトレーニングが終わり、実運用の準備が整った後だという。ユーザーはモデルとデータセットを提供し、より小さなモデルをどのようにビルドするかを決めることができる。そのためには、許容範囲内で精度を多少落とす可能性もあるが、主に行われるのは、圧縮レベルの選択(すなわちどれだけモデルを小さくするか)だ。

「より安価なプロセッサーへ展開できるように、圧縮することでモデルのサイズを小さくすることができます。中には、200MBが11MBになったり、50MBが100KBになったりする事例もあります」とソーヤー氏は説明する。

PJCで今回の投資を担当しているRob May,(ロブ・メイ)氏は、チームならびに、スタートアップが開発しようとしている技術に感銘を受けたという。

「AI、特に深層学習をリソースに制約のあるデバイスに展開することは、AI人材やノウハウが乏しい業界で幅広い課題となっています。エッジAIが主要なコンピューティングパラダイムとして成長し続ける中で、Deepliteの自動化されたソフトウェアソリューションは、大きな経済的利益を生み出すでしょう」とメイ氏は声明の中で語っている。

この会社のアイデアは、モントリオールにあるインキュベーターTandemLaunch(タンデムローンチ)にルーツがある。Deepliteは2019年半ばに会社として正式に立ち上げが行われ、現在の従業員は15名だが、2021年中にその数を倍増させる予定だ。会社を創業するにあたり、創業者たちは多様性と包括性のある組織を作ることを重視していると、ロマーノ氏はいう。

彼は「私たちは、確実に多様で包括的な方法で、適切な人材を見つける戦略を採用しています。それが組織のDNAなのです」と語る。

この先可能になったときには、モントリオールとトロントに従業員同士のハブとなるオフィスを設置する予定だが、オフィスに出社する必要はない。

「私たちがすでに議論済ですが、基本的にはみんなが自由に出入りできるようにし、かつてのように大きなオフィススペースを必要とするとは考えていません。皆、自分の都合に合わせて、リモートやバーチャルで仕事をすることができるようになります」とロマーノ氏はいう。

カテゴリー:人工知能・AI
タグ:Deeplite機械学習資金調達エッジAIカナダ

画像クレジット:Andrii Shyp / Getty Images

原文へ

(文:Ron Miller、翻訳:sako)

AIにシンプルな可観測性を持たせるイスラエルのAporiaがシード資金5.5億円調達

機械学習のモデルは、与えるデータの量や質で良し悪しが決まる。特に訓練のときにそういえるが、モデルはプロダクションの質も左右する。現実の世界では、新たな事象が起きるたびにデータそのものが変わり、データベースやAPIの報告やデータ保存の小さな変化でも、モデルの反応に影響することがある。そんなときMLのモデルは平然と間違った予測を与え、エラーを投げないため、そういうシステムではデータのパイプラインを監視することが絶対に欠かせない。

そしてそこに、Aporiaのようなツールが登場する。テルアビブに本社のある同社は米国時間4月6日、同社のMLモデル監視プラットフォームに500万ドル(約5億5000万円)のシード資金を調達したことを発表した。投資家はVertex VenturesとTLV Partnersだ。

画像クレジット:Aporia

Aporiaの共同創業者でCEOのLiran Hason(リラン・ヘイソン)氏は、イスラエル国防軍に5年間在籍し、その後はずっとAdallomのデータサイエンスチームにいた。セキュリティ企業の同社を、2015年にMicrosoftが買収した。買収の後、彼はベンチャー企業Vertex Venturesに入り、2019年にAporiaを始めるまでそこにいた。しかし今、Aporiaが解決しようとしている問題に彼が初めて出会ったのは、Adallomにいたときだ。

Adallomでの経験に関して「私は機械学習のモデルのプロダクションアーキテクチャを担当していました。だから、モデルをプロダクションに持ち込んだときに起きるありとあらゆるサプライズを初めて体験したのは、そこででした」とヘイソン氏は語る。

ヘイソン氏の説明によると、Aporiaの目標はエンタープライズによる機械学習モデルの実装を容易にし、AIの力を責任あるやり方で利用することだという。

「AIはとても強力な技術だが、従来のソフトウェアと違いデータへの依存が極めて大きい。AIのもう1つのユニークなところは、とてもおもしろいことだが、失敗するときに黙って失敗することだ。例外もエラーも何も出ない。だからAIは実に厄介であり、特に一旦プロダクションに入れば、モデルの訓練時のようなデータサイエンティストによる完全なコントロールがないため、なおさら厄介です」とヘイソン氏は語る。

しかもヘイソン氏によると、プロダクションシステムはサードパーティーのベンダーからのデータに依存しているかもしれないし、そのベンダーがある日、誰にもいわずにデータのスキーマを変えるかもしれない。そうなると、モデルの信頼性は完全に壊れる。銀行の顧客のローンが債務不履行になるという予測もできなくなり、数週間か数カ月後に実際に不履行になってから気づくことになる。

Aporiaは絶えず、入ってくるデータの統計的特性を調べ、それが訓練セットからあまりにも乖離してきたらユーザーに警報する。

そしてAporiaがユニークなのは、ユーザーにほとんどIFTTTやZapier的なグラフィカルなツールを提供して、モニター(監視系)のロジックをセットアップさせることだ。納品時にはモニターの50ほどの組み合わせであらかじめ構成されており、それらの楽屋裏での仕事ぶりを完全に可視化する。また企業はこれらのモニターの振る舞いを、特定のビジネスケースやモデルに合わせて微調整できる。

最初チームは、ジェネリックなモニタリングソリューションを構築できると考えていた。しかしチームが悟ったのは、そんなものを目指したら非常に複雑な仕事になるだけでなく、これからモデルを構築するデータサイエンティストが、モデルの仕事の仕方と必要事項をモニタリングのソリューションから正確に知らなければならない。

TLV Partnersの創立パートナーであるRona Segev(ロナ・セゲフ)氏は、「プロダクション(本番時)のワークロードのモニタリングは、ソフトウェア工学の実践としてすでに確立しており、機械学習を同じレベルでモニタリングすることもかなり前に確立しています。Aporiaのチームには強力なプロダクションエンジニアリングの経験があり、そのために彼らのソリューションはシンプルで安全で堅牢なものとして傑出しています」と語る。

カテゴリー:人工知能・AI
タグ:Aporia機械学習イスラエル資金調達

画像クレジット:Aporia

原文へ

(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)

ハイテク不動業のDomaもSPACブームに乗って3250億円の大型上場を目指す

サンフランシスコに拠点を置くハイテク不動産事業のスタートアップ、Doma(以前のStates Title)はCapitol Investment Corp. Vと合併することによって上場する計画を発表した。Capitol VはSPAC(特別買収目的会社)であり、買収額は株式、社債を含めて30億ドル(約3250億円)規模となるという。

CEOのMax Simkoff(マックス・シムコフ)氏は、2016年9月にく「住宅ローンを即時に成立させるテクノロジー主導ソリューション」を生み出すことを目指してこのスタートアップを設立した。当初は不動産取引にともなくリスクをカバーするタイトル保険の処理を主な目的としていたためためStates Titleという社名だった。しかし契約処理全般、またこれにともなくエスクロ(預託保証)など「不動産取引のあらゆる側面」を扱うことなってため事業内容に拡大し、社名も変項した。

Domaは特許を取得済みの機械学習モデルを開発した。このテクノロジーは、タイトル処理にかかる時間を従来の5度からわずか1分程度に短縮した。これにより住宅ローンの契約に関する期間を苦痛きわまりない「50 日以上」からわずか1週間以内に短縮することができた。スタートアップはChase、Homepoint、Sierra Pacific Mortgageなどの有力な金融会社をユーザーに持っており、すでに80万件以上の不動産取引をクロージングしてきたという。

社名の変項は上場後の将来を考慮に入れたもので、タイトル保険以外に住宅ローンやその保証などの分野に事業を拡大する計画だ。

上場によって得られる資金は「企業規模の拡大、新たな市場への参入、新しいプロダクト開発」などへの投資を継続、拡大するために利用されるという。

PIPE(上場資金を私募により拠出した投資家)にはBlackRock、Fidelity Management & Research Company LLC、ソフトバンクグループのメンバーであるSB Management 、Gores、 Hedosophia、Wells Capital.が運用するファンドやアカウントなどが含まれている。またDOMAの以前からの株主であるLennarもPIPEに参加している。Ziillowの共同ファウンダーで元CEOのSpencer Rascoff(スペンサー・ラスコフ)氏も個人としてPIPEに加わっている。

さる2021年2月中旬、DomaはHSCM Bermudaから社債による1億5000万ドル(約162億8000万円)の資金調達を完了したことを発表した。HSCMは2020年5月にDomaに対して6億2300万ドル(約676億3000万円)の評価額で1億2300万ドル(約133億5000万円)のシリーズCの大型ラウンドによる投資を行っている。

更新:Domaのビジネスの現状

同社の成長は2019年から2020年にかけては緩やかなものだった。GAAP基準による収入は3億5810万ドル(約388億7000万円)から4億980万ドル(約540億4800万円)に増加した。不動産エージェントに支払った保険料を除いた収入(留保保険料および手数料)は2019年に1億7980万ドル(約195億1000万円)に落ち込んだが、2020年に1億8970万ドル(約205億9000万円)になると予想している。2020年の数字は決算報告では「推定」と警告されている(ただし2021年3月の時点では2020年の確定数字は「推定」に非常に近いものになるとしているので概数として利用するのはさしつかえないはず)。

他のいくつかの指標もネガティブだ。Domaは調整後EBITDAが2021年に赤字幅が2020年の1900万ドル(約20億6000万円)から6660万ドル(約72億3000万円)に拡大すると予想している。しかし2023年については大幅に改善されると楽観的な見通しを立てている。

同社では2021年のGAAPベースの収入は4億1640万ドル(約451億9000万円)エージェントへの支払い後は2億2640万ドル(約245億7000万円)という緩やかな成長を見込んでいる。2022年と2023年にはさらに大きな大きな成長を予測している。だいぶ先の予想なので今のところこれらの数字は割り引いて考る必要があるだろう。

Domaはまた、2021年には決算数字が悪化すると予想している。保険料・手数料収入に占める調整後粗利益は、2020年の48.3%から2021年は39.5%に低下ししている。GAAP会計基準からだいぶ離れた数字を問題にすることになる点は注意しなければならないが、同社が財務実績の悪化が差し迫っていると公表している点には注目すべきだろう。

2020年のDomaの純損失は3510万ドル(約38億1000万円)だったが、費用支出が同等なら、2021年は1億310万ドル(約142億2000万円)に拡大する見込みだ。SPAC経由で株式上場を目指す他のスタートアップ同様、ビジネスに調整が必要な要素を残したまま市場にデビューすることになる。しかしDomaは新型コロナワクチンの入手が順調になってきたことにより近くパンデミックが抑え込まれると見ている。同社は将来展望については非常に強気だ。

つまり現在はプロップテック(proptech、ハイテク不動産事業)を始めるのに非常に良いタイミングだと考えている。

更新:SPACフェスティバル

Domaは株式公開を目指す多数のプロップテック企業の仲間入りを果たした。最近も16億ドル(約1737億1000万円)のベンチャー資金を調達した不動産仲介ビジネスのスタートアップCompassS-1上場申請書を提出している。

関連記事:ソフトバンクなどから総額約1710億円調達した不動産仲介スタートアップ「Compass」が上場申請

2020年にベンチャー投資家のChamath Palihapitiya(チャマス・パリハピティヤ)が創立した白紙委任会社(SPAC)、Social Capital Hedosophia IIはOpendoorとの合併を発表し、これによって非公開の不動産スタートアップであったOpnendoorを上場させた。

Porch.comも2020年12月にSPACを利用して上場している。また日本のSoftBankが支援するシリコンバレーのViewはSPACとの合併で米国時間3月9日にNASDAQに上場している。同社は、テクノロジーを利用した窓ガラスの製造と交換などを行うスマートウィンドウ企業の1つで時価総額16億ドルを目標として上場を開始した(Yahoo Financeでは時価総額はまだ判明していない)。

【追記】トップの小切手のイラストはSPAC企業が事業目標を示さないことから「白地小切手会社」と呼ぶことにかけたもの。

カテゴリー:ネットサービス
タグ:Doma不動産SPAC機械学習

画像クレジット:Lawrence Anareta / Getty Images

原文へ

(文:Mary Ann Azevedo, Alex Wilhelm、翻訳:滑川海彦@Facebook

AI利用の雇用市場分析でイスラエルのRetrain.aiが約14億円調達

イスラエルを拠点とするretrain.aiは、AI(人工知能)とマシンラーニングを利用して求人掲示を大量に調査し雇用市場の動向を分析しているが、今回はSquare Peg率いるシリーズAでは900万ドル(約9億8000万円)を調達した。2020年の400万ドル(約4億3000万円)のシードラウンドは未発表(Hetz Venturesが主導し、TechAvivと.406 Venturesが参加)だったため、retrain.aiは合計1300万ドル(約14億円)を調達したことになる。ライバルには5660万ドル(約61億円)を調達したPymetricsや、1億7680万ドル(約190億円)を調達したEightfold.aiなどがある。

今回の資金調達に加えて、retrain.aiはイスラエル労働省との間で最初の契約を結び、パンデミックにより変化する同国の雇用市場の変化について調査を行う契約を結んだ。

テクノロジーが従来の労働市場を侵食する中、retrain.aiのプラットフォームはどのような仕事が広告されているか、あるいはどのような仕事の人気が下がっているかを調べ、新しい仕事がどこから現れるのかを早期に警告できるという。これは、大規模な組織や政府の政策形成に役立つ。

retrain.aiのCEOはShay David(シェイ・デイビッド)博士で、同氏はビデオエンタープライズのリーダーであるKalturaを共同設立したことで知られており、2007年にはTehcCrunch初のカンファレンスにも登壇した。COO(最高執行責任者)にはIsabelle Bichler-Eliasaf(イザベル・ビヒラー・エリアサフ)氏、CTO(最高技術責任者)にはAvi Simon(アヴィ・サイモン)氏が就任している。

デイビッド博士は「かつては労働力の定期的な変化が大きな流れに発展し、特に新型コロナウイルスがその労働市場への大きな影響を顕著に示し、警鐘となりました。失業と不完全雇用は、今後数十年のうちに世界中で10億人もの人々に影響を及ぼすでしょう。私たちのビジョンは、2025年までに1000万人の従業員が適切な職に就けるよう支援し、組織が変化の波の中を効率的に進むのを支援することです」と述べた。

retrain.aiは、Square Pegによる4億5000万ドル(約490億円)規模の新ファンドによる最初の投資となる。同VCはこれまでにCanvaやStripe、Fiverr、Airwallexに投資していた。

カテゴリー:人工知能・AI
タグ:retrain.ai機械学習資金調達

原文へ

(文:Mike Butcher、翻訳:塚本直樹 / Twitter

山火事の消火活動を機械学習と過去データを駆使して効果的なものにするCornea

ありがたいことに、まだ山火事シーズンではない。米国西部の火事を予防したり対処したりするという、年々複雑にそして対応しにくいものになっているタスクにどう立ち向かうか、消防士や救急隊員が計画を立てる小休止の時間となっている。米国西部の山火事は近年、カリフォルニアなどの州にとって喫緊の課題だ。ほとんどが気候変動による高温、火花発生につながる朽ちつつある送電インフラ、木が生い茂る危険な地域や大火災につながる群葉によるものだ。

過酷な消防活動が何年も展開され、いくつかのスタートアップは消防をいかに改善できるかを模索している。そうしたスタートアップの1つがCornea(コーニー)だ。公共部門にフォーカスしているベンチャースタジオHangar(ハンガー)の一種のスピンアップだ。Hangarは2020年、政府をターゲットとした新しいスタートアップを立ち上げるために1500万ドル(約16億円)を調達した

関連記事:GovTechのスタートアップ育成するベンチャースタジオのHangarが15億円超を調達

Hangarにとって最初の企業の1つが数年前に登場したCorneaで、ポテンシャルという点で最も興味深い1社であり続けている。どこで消火活動を積極的に行い、炎が燃え盛る状況でいつ退却すべきか誘導して最前線の消防士たちをサポートできる機械学習に、地理、天候、歴史上重要な火事のデータを融合させるのがCorneaが取り組んでいることだ。

Corneaは2021年2つの主要プロダクトを立ち上げようとしている。1つは、消防士たちの間で「Suppression Difficulty Index(鎮圧困難インデックス)」として知られるものに関するより良い状況認識の提供にフォーカスしている。これらは本質的に、かなり特定の地理的ロケーションで消火の危険を消防士に伝える重要な地図だ。例えば特定のロケーションでは、風や水の状況が火を勢いづかせたり注意しなければ隊員を危険な目に合わせるかもしれない。

もう1つのプロダクトは「Potential Control Lines(潜在的制御ライン)」にフォーカスしている。これは防火帯やその他の活動が火を押し戻すかもしれないロケーションのことだ。植生、無数のその他データを使うことで、Corneaは消火活動でかなり成功を収められそうな場所を特定できる。

Corneaの消防責任者はTom Harbour(トム・ハーバー)氏で、同氏は以前、米森林局で火災対応責任者を10年務めた。「50年前、私は『なぜ』という言葉を知らないカルチャーの中で育ちました。現場での消防の決定では、ただ命令に従っていました」と同氏は話した。「頭の中で言葉が回っていました」。Corneaと同社が手がけているプロダクトで、我々は「『なぜ』を元に、目にしている情報を消防士が感じ取れるようにし始めました」。

ハーバー氏は、今日現場で最も一般的なツールは紙の地図とマーカーだと話す。というのも、単に「何も壊したりできないときに壊れないと知っているから」だ。Corneaのプロダクトは活動中の消防士をサポートするかもしれないが、どこに消火活動のリソースを向けるべきか戦略的決定を下す消防作戦センターにより大きな影響を及ぼす。

Hangarの創業者でマネジングパートナーのJosh Mendelsohn(ジョッシュ・メンデルゾーン)氏は、CorneaがHangarの投資テーマの中心にあると話す。「Corneaはこれらの大きなデータセットに取り組んで効果的に処理し、(消防士に)可能な限りシンプルに多くの分析的影響を与えることにフォーカスしています」と述べ「このマーケットでは最も良いユーザーエクスペリエンスはPDFであることも明らかになっています」と指摘した。

実際、このマーケットにおける大きな課題はエンタープライズのSaaSなどと比べて災害対応の他に類を見ないダイナミックさだ。「Corneaは顧客と話し、必要とされるかどうかを検証を行うプロセスを経なければなりませんでした」とメンデルゾーン氏は話した。「すべて必要だと感じますが、すぐさま影響を及ぼすために行動の変化を最小限にする正しいこととは何でしょうか」。消火に関して特に問題なのは、火災現場からチームへのフィードバックループだ。「火災は季節性であり、我々は漸進的に改善しなければなりませんでした」と同氏は述べた。

Corneaのチームは現在、3人のフルタイムとコンサルタントがいる。Hangarが同社のスタッフでCorneaのチームを支えている。Corneaは消火のサイエンスを深めるために連邦研究助成金を部分的に使っているプロダクトを構築した。そして2021年、このモデルを現場に持ってくるために森林局や州消防当局と協業することを願っている。「人間の対応能力には限界があります。そうしたモデルを効果的に使うことで消防士がさらに活動するのをサポートするために、限られたリソースをどのように使うのでしょうか」とメンデルゾーン氏は述べた。

カテゴリー:ソフトウェア
タグ:Cornea自然災害機械学習

画像クレジット:David McNew / Getty Images

原文へ

(文:Danny Crichton、翻訳:Nariko Mizoguchi

マイクロソフトのマルチクラウドプラットフォームAzure Arcが機械学習のワークロードに対応

Microsoft(マイクロソフト)はコンテナのクラスターがどこでホストされているかに関わらずあらゆるKubernetes環境でAzureを実行できるサービスをAzure Arcで提供している。Arcは登場当初から幅広いユースケースに対応していたが、サービス開始時には残念ながら対応していない機能があった。それが機械学習だ。しかしArcのようなツールの利点の1つは企業がデータに関するワークロードを実行できることであり、それは現在ではそのデータを使って機械学習モデルをトレーニングするという意味であることが少なくない。

米国時間3月2日、Microsoft IgniteカンファレンスでMicrosoftは、Azure Machine LearningをArc対応のデータサービスに追加することでまさにこの機能をAzure Arcで利用できるようになると発表した。

AzureのGMであるArpan Shah(アルパン・シャー)氏は同日の発表で「機械学習の機能をハイブリッドやマルチクラウドの環境に拡大することにより、お客様は既存のインフラストラクチャへの投資を生かしつつ、データのある場所でトレーニングモデルを実行できます。データの移動やネットワークの遅延が減り、セキュリティやコンプライアンスの要件を満たすこともできます」と記した。

この新機能はArcの利用者にすでに公開されている。

Arcに機械学習機能が追加されたことに加え、MicrosoftはAzure Arc対応KubernetesがGAになったことも発表した。これによりユーザーは標準的なKubernetesの構成をあらゆる場所にあるクラスターにデプロイできる。

Azureのハイブリッドサービスの世界で新しい点としては、Azure Stack HCI上でのAzure Kubernetes Serviceのサポートがある。解説すると、Azure Stack HCIは顧客のデータセンター内にある標準化されたハイパーコンバージドなハードウェアセット上でAzureを実行するマイクロソフトのプラットフォームだ。このアイデア自体はAzure Arcより前からあるものだが、自社データセンター内でAzureを実行したい企業にとっては今でも妥当な代替策で、DellやLenovo、HPE、富士通、DataOnなどのベンダーがサポートを継続している。

Arcのオープンソースの面では、MicrosoftはArcがCNCF(Cloud Native Computing Foundation)の標準に適合するあらゆるKubernetesディストリビューションと連携して動作するように構築され、RedHat、Canonical、Rancherそして現在ではNutanixと連携してAzure Arc上でKubernetesの実装に関してテストと検証を実施していると強調した。

Microsoft Ignite 2021

カテゴリー:ネットサービス
タグ:MicrosoftMicrosoft Ignite 2021Microsoft AzureKubernetes機械学習

画像クレジット:Akio Kon/Bloomberg / Getty Images

原文へ

(文:Frederic Lardinois、翻訳:Kaori Koyama)

顔交換も簡単にできる中国のマシン動画生成スタートアップSurrealが創業3カ月で資金調達

もし動画を作るためのカメラが不要になり、数行のコーディングで動画を生成できるようになったとしたらどうだろう?

機械学習の進歩が、そのアイデアを現実のものにしつつある。私たちも、ディープフェイク技術が家族写真で顔を入れ替えたり、自撮りを有名なビデオクリップに変えたりする例を見てきた。現在、AI研究のバックグラウンドを持つ起業家たちが、アルゴリズムを使って超リアルな写真や音声、動画を生成するためのツールを考案している最中だ。

関連記事
MyHeritageが古い家族写真をディープフェイク技術でアニメーション化
口コミで大流行の顔交換ビデオアプリRefaceにa16zなどの有名投資会社が約6億円を出資

こうした技術を開発しているスタートアップの1つが、中国に拠点を置くSurreal(サーリアル)だ。同社は設立からわずか3カ月しか経っていないが、Sequoia ChinaとZhenFundという2つの著名な投資家からすでに、シードラウンドで200万~300万ドル(約2億1000万〜3億2000万円)の資金を調達している。創業者でCEOのXu Zhuo(シュウ・チョウ)氏はTechCrunchに対して、Surrealは今回のラウンドで10件近くの投資オファーを受けたと語っている。

Surrealを創業する前、シュウ氏はSnap(スナップ)に6年間在籍していて、同アプリの広告レコメンデーションシステム、機械学習プラットフォーム、AIカメラ技術の開発に携わっていた。この経験はシュウ氏に、合成メディアが主流になると確信させた。なぜならそのツールは「コンテンツ制作のコストを大幅に下げることができる」からだと、シュウ氏は、深圳(シンセン)にある Surreal社の十数人規模のオフィスで行われたインタビューで語っている。

とはいえ、Surrealには、人間のクリエイターやアーティストを置き換えようという意図はない。実際、シュウ氏は、今後数十年の間に機械が人間の創造性を超えることはないと考えているのだ。この信念を体現しているのが、同社の中国名である「诗云」(シーユン、詩雲)だ。これは、SF作家の劉慈欣(リュウ・ジキン)氏の小説のタイトルから取られたもので、その小説は技術が古代中国の詩人李白に勝てないという物語だ。

「私たちの方程式は『視覚的なストーリーテリングは、創造性プラス制作力に等しい』というものです」とシュウ氏は目を輝かせながら語る。「私たちはその『制作力』の部分に注力しているのです」。

ある意味、マシン動画生成とは、Douyin(抖音、ドウイン、中国版TikTok)やKuaishou(快手、カイショウ)を人気の高いものにしたビデオフィルターを、ステップアップしたような強化版ビデオツールなのだ。既存のショートビデオアプリはプロ並みの動画を作るための障壁を大幅に下げてくれるものの、それでもカメラは必要だ。

「ショートビデオのキモは、決してショートビデオの形式そのものではありません。肝心な点はより良いカメラ技術を手に入れることができるかどうかです。これによってビデオ制作コストが下がります」とシュウ氏は語る。彼はSurrealを、TikTokの親会社ByteDance(バイトダンス)のベテランであるWang Liang(ワン・リエン)氏とともに設立した。

ディープフェイクの商品化

Google(グーグル)、Facebook(フェイスブック)、Tencent(テンセント)、ByteDanceなどの世界最大のテック企業の中にも、GAN(敵対的生成ネットワーク)に取り組んでいる研究チームがある。シュウ氏の戦略は、大型契約へと向かっている重量級のアプリとは直接対決しないことだ。むしろ、Surrealは中小の顧客を狙っている。

eコマース販売者向けのSurrealの顔交換ソフト

Surrealのソフトウェアは現在のところ企業顧客にのみ提供されていて、顧客はアップロードされたコンテンツの顔を変更したり、まったく新しい画像や動画を生成したりするために使用することができる。シュウ氏はSurrealを「動画用Google翻訳」と呼んでいる、なぜならそのソフトウェアは人間の顔を交換するだけでなく、登場人物が話す言語を同時に翻訳し、声と唇を一致させることができるからだ。

ユーザーは動画や画像ごとに課金される。今後、Surrealは顔だけでなく、人の服や動きをアニメーション化することも目指している。Surrealは財務状況の公表を拒んだが、シュウ氏によれば、同社は約1000万件の写真と動画の注文を受け付けたという。

現在、多くの需要があるのは、中国のeコマース輸出企業だ。彼らはマーケティング素材に西洋人のモデルを登場させるためにSurrealを使っている。本物の外国人モデルを雇うのはコストがかかるが、アジア人モデルを採用しても効果があるかどうかはわからない。Surrealの「モデル」を使用することで、一部の顧客は2倍の投資収益率(ROI)を達成することができたとシュウ氏はいう。数百万ドル(数億円)のシード資金を手にした Surreal は、アルゴリズムの改善のために大量のデータを収集できるように、オンライン教育などのより多くのユースケースを模索することを計画している。

未知の領域

Surrealを支えている技術は、敵対的生成ネットワーク(GAN)と呼ばれる比較的新しい技術だ。機械学習研究者の Ian Goodfellow(イアン・グッドフェロー)氏が2014年に発表したGANは、画像を生成する「ジェネレーター」と、画像が偽物(フェイク)か本物(リアル)かを判別する「ディスクリミネーター」のペアで構成されている。このペアは、ジェネレーターが満足のいく結果を出せるようになるまで、敵対的な役割として訓練を行う。

GANが悪意ある者の手に渡った場合には、詐欺やポルノなどの違法行為に利用される可能性がある。Surrealが個人ユーザーの利用ではなく、エンタープライズでの利用から始めている理由の一部はその点にある。

Surrealのような企業はまた、新たな法的課題を提起している。機械が生成した画像や動画の所有者は誰なのだろう?著作権を侵害しないようにするために、Surrealでは顧客に対して、アップロードするコンテンツに対して権利を持つことを求めている。誤用を追跡し防止するために、Surrealは生成したコンテンツの各部に暗号化された目に見えない透かしを追加し、所有権を主張する。Surreal が作成した「人物」がたまたま実在の人物と一致する可能性もあるため、同社は生成したすべての顔とオンラインで見つけた写真を照合するためのアルゴリズムを実行している。

「倫理問題に対してはSurreal自身が解決することはできないと思っていますが、私たちはこの問題を探求していきたいと思っています」とシュウ氏は語っている。「根本的に、(合成メディアは)ディスラプティブなインフラを提供すると思っています。それは生産性を高めます。生産性がこのような応用にとっての重要な決定要因となっているのですから、マクロレベルでは避けて通ることはできません」。

カテゴリー:人工知能・AI
タグ:SurrealGAN中国機械学習資金調達ディープフェイク

画像クレジット:Surreal

原文へ

(文:Rita Liao、翻訳:sako)

AWSがML学習用カーレースDeepRacer Leagueの敷居を下げて新人を歓迎

AWSは2018年に、デベロッパーに機械学習を楽しく教える方法としてDeepRacer Leagueを立ち上げ、その後さまざまなアップデートを重ねてきた。米国時間3月1日、同社はOpenとProという2つの部門がある2021年の新しいリーグシーズンを発表した。

Marcia Villalba(マルシア・ビラルバ)氏が書いているこの新しいリーグを発表するブログの記事によると「AWS DeepRacerは1/18スケールの自動運転レースカーで、AWSのDeepRacerコンソールでバーチャルにレースをしたり、あるいはAWS自身や顧客のイベントでトラックを実際に走ったりして、強化学習のモデルをテストする。AWS DeepRacerはスキルレベルの高低に関わりなく楽しめるし、機械学習の経験のない人でもよい。AWS DeepRacerを利用して強化学習を勉強するときはAWS DeepRacer Leagueに加わり、競走を楽しみながら機械学習を体験する」。

同社は最初、1/18サイズの実際のクルマを人が操縦するレースを構想していたが、パンデミックのおかげで2020年はバーチャルなイベントになった。しかし、その新しいかたちは新人の参入を難しくしたようだ。目標は人びとに機械学習を教えることであるため、新人が気軽に参加できることが同社にとっても重要ではないか。

そこで同社が開発したのがオープンなリーグ、Open Leagueだ。その名のとおり誰に対してもオープンで、このリーグでは自分のスキルを試せるし、上位10%入賞の常連になったらPro Leagueで競走できる。賞もあるし、クルマをカスタマイズすることもできる。

各月のPro Leagueで16位以内になった人は、AWS re:Invent 2021で行われる決勝に出場できる。決勝もバーチャルになるかどうか、それはパンデミックからの回復次第だ。

関連記事:AWSが開発者向けの機械学習キーボード 「DeepComposer」 を発表

カテゴリー:人工知能・AI
タグ:AWS機械学習

画像クレジット:AWS

原文へ

(文:Ron Miller、翻訳:Hiroshi Iwatani)

Sentropyがソーシャルメディア上の攻撃から人々を守るツールをローンチ、Twitterを皮切りに展開

2020年、米国大統領選挙キャンペーンが特に激しさを増していた中、人々をオンライン上の会話に集結させるソーシャルメディアや企業に向けてAIベースのプラットフォームを提供するSentropyというスタートアップが現れた。

Sentropyは自然言語処理と機械学習を利用して一連のアルゴリズムを構築し、これらのプラットフォーム上で暴言や嫌がらせなどの有害なコンテンツが出現してきたときにそれを検知し、問題になる前に対処できるように支援している。

同社が米国時間2月9日、コンシューマー向けの新製品を発表した。

Sentropy Protectは、同社のエンタープライズプラットフォーム用に開発されたものと同じ技術を使用した無料のコンシューマー向け製品だ。個人のソーシャルメディアのフィード上で有害なコンテンツを検出し、ダッシュボードを介してそうしたコンテンツとそれを生成する人々を適切に制御できるようにしてくれる。

当初はTwitterからスタートし、徐々にソーシャルフィードの数を増やしていく計画で、初期段階ではSentropyとソーシャルフィードを統合するためのAPIを提供するサービスをベースに展開する(すべてのソーシャルメディアがそういったAPIを提供しているわけではない)。

SentropyのCEOであるJohn Redgrave(ジョン・レドグレイブ)氏は、コンシューマー向け製品のローンチは方向転換ではなく同社が構築しているものの拡張であると述べている。

Sentropyは今後もエンタープライズ顧客と協働していく考えで、同分野では2つの製品を展開している。Sentropy Detectは、APIベースの悪用検知技術へのアクセスを提供する。Sentropy Defendは、モデレータのエンドツーエンドのモデレーションワークフローを可能にするブラウザベースのインターフェースだ。

しかし一方で、コンシューマー向け製品であるProtectは人々に新たな選択肢を提供する。Sentropyが特定のプラットフォームで利用されているかどうかに関わらず、制御を握り、ハラスメントのグラフを実質的にコントロールできるようにしてくれるというものだ。

「私たちはエンタープライズをスタート地点として一貫して追い求めていく強い信念を持っていましたが、Sentropyはそれ以上のものになっています」と同氏はいう。「サイバーセーフティには企業向けとコンシューマー向けの両方のコンポーネントが必要です」。

何百万もの人々に影響を与える可能性のあるサービスを構築し、かつ個人の自己決定の要素を維持しようとする姿勢のあるスタートアップの誕生は実に爽快である。

単に「サービスXを利用するかしないかはあなた次第です」ということだけではない。特に人気のサービスにおいては、プラットフォームがユーザーの最善の利益を常に考慮してくれているという期待感だけでなく、ユーザーにも自身でコントロールできるようなツールを提供すべきだという概念が重要なのだ。

これは消えつつある問題ではなく、複雑なコンテンツを処理する方法を模索し続けている現在最もホットなプラットフォームだけでなく、新興のプラットフォームにも共通する問題といえるだろう。

関連記事:TikTokがコミュニティガイドラインを拡張、「ウェルビーイング」の新機能を展開

例えば、Clubhouseの最近の人気はソーシャルプラットフォームにおける新たな領域として注目されているが、Clubhouseは会話のための「room」をベースとし、やりとりのためテキストではなく音声に依存する新しいモデルであるため、嫌がらせやハラスメントの問題にどう対処しているかという点を浮き彫りにしている。いくつかの注目すべき例は、これまでのところ、問題が大きくなる前に対処する必要があることを示している。

Protectは現在無料で利用できるが、Sentropyはその有料化の方法と可能性を検討中だとレドグレイブ氏は語っている。考えられるシナリオとしては、強化されたツールを備えた「プロ」サービスを持つ個人向けの無料限定版製品となるフリーミアムの層と、1人または複数のハイプロファイルの個人に代わってアカウントを管理する企業向けの層で提供される可能性がある。

もちろんTwitter、Reddit、Facebook、YouTubeなどのサービスはここ数年(特に最近)、より多くのルール、モデレーター、自動化されたアルゴリズムを導入し、トラック内の不正なコンテンツを特定して阻止したり、ユーザーがコンテンツを入手する前にレポートして阻止したりできるようにすることで、大きな成果を上げている。

しかし、もしあなた自身が定期的あるいは時折ターゲットにされたりするような経験を持っていれば、それだけでは十分ではないと感じるだろう。Sentropy Protectもそのような考え方に基づいて構築されているようだ。

実際、レドグレイブ氏によると、同社は当初からコンシューマー向け製品のロードマップを作成していたが、2020年6月にエンタープライズ向け製品を発表して以降その戦略は加速したという。

「私たちは『オンラインで虐待を受けています。御社のテクノロジーにアクセスするにはどうすればよいですか?』という人々からの問い合わせを受けるようになりました」。同氏はSentropyが企業のリストを精査して顧客として彼らを勝ち取り、製品の統合を成功させるだけでは解決できない問題があることに気づいたと振り返る。

「私たちは難しい決断を下しました。100%の時間を企業のために費やすのか、それともチームの一部を使って消費者のために何かを作り始めるべきなのか」。同社は後者の道を選んだ。

エンタープライズ分野では、Sentropyはソーシャルネットワークをはじめ、ゲーム体験や出会い系アプリに接続されたメッセージボードなど、人と人の交流をホストする企業との提携を続けている。現時点では顧客名を公表していないが、大手の有名プラットフォームではなく、主に小規模で急成長中の企業だとレドグレイブ氏は説明している。

Sentropyのプロダクト担当バイスプレジデントであるDev Bala(デヴ・バーラ)氏(アカデミックな経験を持ち、Facebook、Google、Microsoftで働いていた)は、より大きなレガシープラットフォームもSentropyの範疇外ではないと説明している。しかし大抵の場合、そうした企業はより大きな信頼と安全戦略に取り組み、少数のエンジニアを社内に配置して製品開発に取り組んでいることが多い。

大手ソーシャルネットワークがサービスの特定の側面にサードパーティーの技術を導入することもあるが、それらの契約が完了するまでには、たとえオンライン上での不正行為に対処しなければならないような緊急性の高い場合であっても、通常は長い時間がかかる。

「虐待や嫌がらせは急速に進化しており、Facebook、Reddit、YouTubeやその他の企業にとっては実存的な問題になっていると思います」とバーラ氏はいう。「これらの企業は、信頼と安全だけを考えている1万人の組織を持つことになり、世界はそれを実行しないことの弊害を目にしています。外部の人々にはあまり明らかにされていませんが、彼らは多数のモデレーターとあらゆるテクノロジーを持つポートフォリオアプローチを採用しています。すべてが社内で構築されているわけではありません」。

「Sentropyには大きな企業にとっても価値があると信じていますが、私たちのような製品を使っている企業の周りには多くの世論が存在していることも認識しています。ですから、対象となっている企業がFacebookではなく、あまり洗練されていないアプローチを採用していない場合、より先に進むチャンスがあると考えています」。

市場の潮流とセンチメントの変化の兆候である。虐待やコンテンツへの取り組みがビジネスコンセプトとして真剣に受け止められ始めているようだ。このビジネス機会に取り組んでいるのはSentropyだけではない。

Spectrum LabsL1ghtという2社のスタートアップも会話が行われているさまざまなプラットフォームを対象としたAIベースのツールセットを開発しており、これらのプラットフォームが有害性、ハラスメント、虐待を検知し、より適切な事例を検出できるようにしている。

関連記事:有害コンテンツと戦うAIプラットフォーム開発のSpectrum Labsが1000億円超を調達

もう1社のBlock Partyは、さまざまなソーシャルプラットフォームでユーザー自身が有害性への接触をコントロールできるようにしたいと考えているが、Sentropy同様、まずTwitterにフォーカスしている。

関連記事:SNSでのオンラインハラスメントや虐待に対抗するBlock PartyがTwitterでサービス開始

Protectを使用すると、コンテンツが検出されてフラグが設定された後、ユーザーは特定のユーザー(Protectを使用してミュートすることも可能)またはテーマに対してより広範で恒久的なブロックを設定したり、フィルタリングされた単語を管理したり、悪用の可能性があることを示すフラグが自動的に設定されたコンテンツを監視したりできる。これらのフラグを無効化して「信頼できる」ユーザーを作成することも可能だ。身体的な暴力の脅威、性的な攻撃、アイデンティティ攻撃などのように、Sentropyによって捕捉されたツイートにはラベルが付けられる。

機械学習プラットフォームをベースにしているため、Sentropyはフラグの付いたツイートを含むすべてのシグナルを収集し、Protectにそれらを使って将来のコンテンツを識別させている。このプラットフォームは他のプラットフォームでのチャットも常時監視しており、それが検索結果やモデレートに反映される。

Twitter自体の不正利用防止策を知っている人なら、Twitterが提供するコントロールよりもこれがさらに一歩進んでいることが分かるだろう。

ただし、これはまだ初期バージョンに過ぎない。今のところ、Protectではタイムライン全体を見ることはできず、実質的にはProtectとTwitterクライアントを切り替えることになる。面倒だと思う人もいるかもしれないが、一方でバーラ氏は、Sentropyの成功の兆候はバックグラウンドで動作させて人が常にチェックする必要性を感じなくなることだという。

レドグレイブ氏はまた、ダイレクトメッセージをフィルタリングする機能など、他の機能を追加する方法についてもまだ検討中だと語っている。

カテゴリー:パブリック / ダイバーシティ
タグ:Sentropyハラスメント機械学習SNSソーシャルメディア

画像クレジット:Towfiqu Photography / Getty Images

原文へ

(文:Ingrid Lunden、翻訳:Dragonfly)

性的嗜好や支持政党が顔認識アルゴリズムでわかる研究が物議を醸す

顔の特徴だけで個人の支持政党をかなりの精度で判別できるという機械学習システムが研究者によって構築された。この研究は、性的嗜好も同様にして推測できる可能性があることを示したグループによって行われたものだが「現代版骨相学」であることを率直に述べ、その罠に陥らないよう慎重を期した上で、外見は我々が思っているよりも多くの個人情報を表している可能性があるという心地の悪い結論に到達している。

先のNature journal Scientific Reportsに掲載されたこの論文は、スタンフォード大学のMichal Kosinski(マイケル・コジンスキー)氏によって執筆された。個人の性的嗜好は顔データから推測できるという内容の同氏の論文は、2017年にもトップニュースを飾ったことがある。

この研究は批判を招いたが、その理由はその手法ではなく、概念上非身体的な(見た目ではわからないはずの)ことをこのような方法で検出できるという考え方にある。そもそもコジンスキー氏は、本人もずっと説明しているとおり、そうしたことは不可能だということを証明しようとしたのだが、結果は他の人にとっても、コジンスキー氏自身にとっても驚くべき、困ったものとなってしまった。この研究目的は、ゲイかどうかを識別する能力をAIで実現することではない。その反対である。研究チームが発表当時に寄稿したように、このようなテクノロジーが研究以外の目的で関心を持つ者によって開発されるリスクがあることを一般の人たちに警告する意味で、今回の研究結果を公開する必要があった。

この結果には本当に困惑しており、この事実を公開すべきかどうか判断に迷いました。公開することにより、我々が警告しているリスクが現実になってしまうのを避けたいと考えました。性的指向を公表するタイミングと相手をコントロールできることは、その人の幸福だけでなく、安全性のためにも極めて重要です。

政治家とLGBTQコミュニティに今直面しているリスクを早急に認識してもらう必要があります。我々はプライバシーを侵害するツールを開発したのではなく、広く利用されている基本的な方法が重大なプライバシー侵害を招くことを示したのです。

所属政党についても同様の警鐘を鳴らすことができるだろう。少なくとも現時点の米国では所属政党は性的嗜好ほど敏感または個人的な問題ではないが、敏感で個人的な問題であることは確かだ。政治的または宗教的に「反体制派」であるという理由で逮捕または殺害された人たちのニュースを1週間以上聞かないことはまずない。たとえばメッセージを傍受するといった方法ではなく、単に「アルゴリズムによって過激主義者と特定された」というだけで、抑圧的な政府が(逮捕または捜索するための)相当な理由を得られるとなると、そうした圧政的行為を非常に簡単かつ大規模に行えるようになってしまう。

このアルゴリズム自体は決して最先端のテクノロジーというわけではない。コジンスキー氏の論文では米国、カナダ、英国の出会い系サイトや米国のフェイスブックのユーザーの100万件を超える顔写真を収集し、機械学習システムに取り込んで学習させるというごく通常のプロセスが説明されている。顔写真が使用された人たちは、そのサイトのアンケートで政治的に保守派かリベラル派であることがわかっている。

このアルゴリズムは、オープンソースの顔認識ソフトウェアに基づいて開発されたもので、まず、顔だけを切り出す基本的な処理を行った後(これにより背景がアルゴリズムの処理対象から除外される)、さまざまな特徴を表す2048個のスコアで顔を単純化する。他の顔認識アルゴリズムと同様、この特徴は必ずしも「眉毛の色」とか「鼻のかたち」といった直感的なものではなく、よりコンピューターネイティブな概念だ。

画像クレジット:Michal Kosinski / Nature Scientific Reports

上述のユーザーから収集した所属政党データをこのシステムに取り込むと、保守派とリベラル派の顔に関する統計データの違いを細かく分析し始める。実際、両者の間には明らかな違いがある。

もちろん、これは「保守主義者は眉毛が濃い」とか「リベラル派にはしかめっ面が多い」といった単純なものではない。かといって、人口統計でもない。それではあまりに簡単で単純過ぎる。結局、支持政党が年齢や肌の色と関係があるなら、簡単な推測アルゴリズムができあがるはずだ。しかし、コジンスキー氏が使用したソフトウェアのメカニズムは極めて標準的なものであるが、この研究が前回のように疑似科学として片づけられないように同氏の考えたあらゆるケースを慎重に網羅するようにした。

これを実現する最も明白な方法は年齢、性別、人種が同じ人たちの支持政党をシステムに推測させるというものだ。このテストでは、2つの顔と2つの支持政党を提示し、どちらの顔がどちらの政党を支持しているか推測させた。偶然当たる確率は当然50%だ。人間はこの種の作業が苦手であり、結果は確立よりもわずかに高い55%程度であった。

このアルゴリズムで、年齢、性別、人種が一致する2人の支持政党を推測させた場合、正解率は71%の高確率となり、年齢、性別、民族性が任意の2人について推測させた場合(ただし、どちらかが保守派でどちらかがリベラル派という点は同じ)、正解率は73%に達した。

画像クレジット:Michal Kosinski / Nature Scientific Reports

4分の3という正解率は最近のAIにしては大成功とは言えないかもしれないが、人がやるとコイン投げより少し高い程度の正解率しか得られないことを考えると、検討するに値する何かがあるように思える。コジンスキー氏はその他のケースについても慎重に網羅した。確かに、この数字は、統計に現れた変則性や分離された結果の誇張ではないように思う。

支持政党が顔に現れるという考え方にはドキッとさせられる。ある人が右寄りか左寄りかということは最も個人的な情報とはいえないが、実体のない情報とみなされるのも当然だ。帽子、ブローチ、Tシャツなどで政治的信条を表現することはあるかもしれないが、人の顔というのは一般に無党派(政治的信条とは無関係)だと考えられてる。

顔のどの特徴に特に政治的信条が現れるのか知りたいと思うかもしれないが、残念ながらこのシステムではそこまで説明されることはない。コジンスキー氏は副次的な研究で、顔の特徴(顔の毛、凝視の程度、さまざまな感情)を数十個取り出し、それらに政治的信条がよく現れているかどうかをテストしたが、どの特徴も確率や人が推測したときよりも少し正解率が上がる程度だった。

「顔の向きや感情表現は際立った特徴だった。リベラル派は顔をカメラにまっすぐ向ける傾向があり、驚きの表情をする可能性が高いが、嫌悪感を見せることは少なかった」とコジンスキー氏は論文の執筆者ノートに書いている。しかし、こうした点を考慮しても、正解率の10%以上は説明がつかないままだった。「つまり、顔認識アルゴリズムは政治的志向を示す顔の特徴を他にもたくさん見つけたということだ」。

「そんなことがあるはずがない。骨相学はインチキだった」という反射的防御反応はここではあまり意味がない。これが真実であると考えるのは怖いが、極めて重要な真実である可能性があることを否定しても有益ではない。このアルゴリズムは人に対して非常に簡単に使える可能性があるからだ。

性的指向の研究と同様、ここでの問題は、こうした情報の完璧な検出システムを開発することではなく、それによって生まれるリスクを人々が認識し始めるような方法で実装できることを示すことである。例えば圧政的な神権体制が、性的指向がストレートでない人たちや特定の政治信条をも持つ人たちを厳重に取り締まる必要があると考えた場合、このようなテクノロジーは、そうした取り締まりを「客観的に」実施するための妥当な技術的手法を為政者に与えてしまうことになる。そのうえ、このやり方ならほとんど作業することなく、また、対象者に関する情報を取得することなく実施できてしまう。ソーシャルメディアの履歴を探ることや、購入品(ここにも政治的信条がよく現れる)を分析するといった作業も不要だ。

中国が追い詰められたウイグル族の宗教的少数派を見つけるための顔認識ソフトウェアを配備するというニュースが流れている。米国でも、当局はこの種のAIを信頼している。警察がこうした「最新のテクノロジー」を使って抗議行動の参加者の顔を分類し「この10人はシステムによって最もリベラルであると判定された」などと言っている様子は容易に想像できる。

数人の研究者がオープンソースソフトウェアと中規模の顔データベースを使うことで(政府にとって、この程度のシステムを構築するのは造作もないことだ。というより、おそらくすでに構築してしまっているだろう)世界中のどこでも、目的が何であれ、顔認識システムを実現できてしまうというのはゾッとする話だ。

「お門違いな非難は止めて欲しい。私は論文で、広範に利用されている顔認識アルゴリズムのリスクについて警鐘を鳴らしている。こうしたAI人相システムがすでに、性的指向の判別に使用されているのは懸念される。学者、政治家、市民は目を光らせる必要がある」とコジンスキー氏は語る。

関連記事:ポートランド市の顔認識技術禁止条例は民間企業も対象になる

カテゴリー:パブリック / ダイバーシティ
タグ:顔認証機械学習

画像クレジット:Design Cells / Getty Images

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)

AtlassianがY Combinator出身のデータ視覚化プラットフォームChartioを買収

Atlassianはエンタープライズの運営とコミュニケーションに関するサービスを提供するプラットフォームだ。同社は2020年秋、機械学習レイヤーのAtlassian Smartsを立ち上げた。これは機械学習を利用して膨大な情報を検索して会社内外の共同作業を効率化するサービスだ。同社はChartioを買収すると発表したが、これはファミリーのプロダクトに新しくデータ分析および視覚化のコンポーネントを追加するためだ。買収金額は明らかになっていない。

同社はソフトウェアの開発、運用のクラウドJiraをはじめとするプラットフォーム全体にChartioテクノロジーを組み込む計画だ。買収以前にChartioのプラットフォームには28万人のユーザーに利用されており、54万種類のダッシュボード上で10万を超えるデータソースから1050万種のグラフが作成されていたという。

Atlassianはプラットフォームにデータの可視化コンポーネントを導入し、プラットフォーム内のデータをダイナミックに活用するためにChartioを利用する計画だ。同社のプラットフォームプロダクトエクスペリエンスの責任者であるZoe Ghani(ゾーイ・ガーニ)氏は、今回の買収を発表したブログ記事の中で「我々のプラットフォームはデータの宝庫です。そこで私たちの目標は、データのの潜在的力をフルに利用し、ユーザーがありきたりのレポートの体裁を超えて、組織のニーズに合わせてカスタマイズされた強力なアナリティクスを生成きるようにすることです」と述べている。

関連記事:Atlassianの2年にわたるクラウドへの旅 ―― AWSへの大幅な移行

Chartio の共同ファウンダーでCEOのDave Fowler(デイブ・ファウラー)氏は自分のサイトのブログ記事で「我々は2020年末から話し合いを始め、今日の発表に至った」と書いている。こうした買収の説明として標準的だがファウラー氏は「我々はスタンドアローンで運営を続けるよりも膨大なリソースを持つAtlassianのような大規模な組織のメンバーになったほうが良い結果が得られる」と考えたと述べている。

私たちは長年独立企業として運営されてきましたが、巨大なプラットフォームと膨大なリーチを持つAtlassianと協力できる機会が得られた信じられない幸運でした。プロダクトを重視した市場戦略、ユーザーニーズ、教育訓練を重視したマーケティングはChartioにとっても常にインスピレーションの源でした。

ただしChartioのユーザーにとっては残念なことに同社のプロダクトは2021年をもって終了する。まだ十分な時間があるし、他のツールにデータをエクスポートすることは可能であり同社のサイトにはその方法が詳しく記されている

Chartio2010年に創立され、Y Combinatorの2010年夏のクラスを卒業している。Pitchbookのデータによると調達した資金は総額で803万ドル(約8億6000万円)とささやかなものだ。

カテゴリー:ネットサービス
タグ:AtlassianY Combinator機械学習買収

画像クレジット:Chartio

原文へ

(文:Ron Miller 翻訳:滑川海彦@Facebook

機械学習で中小企業の会計経理を自動化するDocytが拡張シードで1.5億円調達

会計は、多くの人が興奮するような話題ではない。たぶん、当の会計士にとってさえも。でも、会社を経営している人なら、それから逃れることはできない。サンタクララのDocytは、財務データの収集や領収書のデジタル化、分類、そしておそらく最も重要な会計調整(帳尻合わせ)などのルーチンを機械学習で処理し、中小企業(と彼らの会計事務所)の人生をやや楽にしてくれる。

同社は米国時間2月25日、First Rays Venture Partnersがリードする拡張シードラウンドで150万ドル(約1億6000万円)を調達したことを発表した。これには、Morado Venturesと一群のエンジェル投資家たちが参加した。Docytは「ドケット」と発音し、以前Morado VenturesやAME Cloud Ventures、Westwave Capital、Xplorer Capital、Tuesdayおよびエンジェル投資家から220万ドル(約2億3000万円)のシード資金を調達している。新たな資金は、顧客をさらに増やすことに使われる計画だ。

 

中小企業の会計処理といえばQuickBooksがデファクトスタンダードだが、Docytは彼らと競合するのだろうか。共同創業者でCTOのSugam Pandey(スガム・パンディ)氏によると、DocytはむしろQuickBooksなどのパートナーになるものだ。

画像クレジット: Docyt

「Docytは、会計や経理を難題だと感じている中小企業のオーナーのためのプロダクトで、彼らは経営においてはベテランの名人であっても、会計の専門知識はありません。また、会社がやや大きくなって中規模になってくると、QuickBooksを卒業してNetSuiteやSageのような高度な会計経理システムを使いたくなるものです。Docytはそんな企業のためにQuickBooksの寿命を延ばすことができるため、経営者はシステムを変えずに済みます」とパンディ氏はいう。

創業当時のDocytは、モバイル向けの安全な文書共有プラットフォームだった。同社のDNAには、その頃の名残が残っており、財務文書を銀行の取引勘定と調整する作業を得意とする。他のシステムは主に取引データを重視するが、Docytは多様な文書を重視する。例えばメールによる領収書をDocytのサービスに送ると、それがクレジットカードや銀行の勘定通知に自動的に入れられる。そのような処理に、同社はPlaidを利用している。

画像クレジット: Docyt

新しい取引があると、その情報を手入力して訓練しなければならないシステムが多いが、Docytはその多くを自動的に行い、データをQuickBooksと同期できる。

First Rays Venture Partnersの創業時からのゼネラルパートナーであるAmit Sridharan(アミット・スリダラン)氏は「Docytは、会計という仕事の全スタックにAIを適用した初めての企業です。DocytのAIを利用するデータ抽出や自動分類、自動調整などのソフトウェアは、他に類がありません。しかもエンタープライズ級の強力なソリューションでありながら、費用的にも中小企業が十分利用できます」という。

関連記事:会計分野のマーケットプレイスAgerasが260億円のバリュエーションで77億円獲得

カテゴリー:ソフトウェア
タグ:Docyt会計機械学習

画像クレジット:Docyt

原文へ

(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)