機械学習のモデルの管理を効率化するComet.mlがシードに次いで5億円相当を調達

いろんな仕事の新しいやり方、いわゆるニューノーマルを取り入れていくとき、新しいソフトウェアサービスを導入しようとする企業にとっては、あらゆることのもっと効率的な方法を探すことが何よりも重要になる。機械学習も、その例に漏れない。そこで、より効率的な機械学習プラットホームを作ろうとしているスタートアップComet.mlは今日(米国時間4/22)、450万ドルの新たな資金調達を発表した。

同社は以前、230万ドルのシード資金を調達しているが、今回の投資家もそのときと同じく、Trilogy Equity PartnersとTwo Sigma VenturesおよびFounder’s Co-opだ。

同社の共同創業者でCEOのGideon Mendels氏は次のように語る: 「われわれはセルフホストでクラウドベースの、メタ機械学習プラットホームを提供し、データサイエンスのAIチームと組んで、自分たちの実験とモデルを試行し説明し最適化しようとする彼らの作業を管理する」。

競合他社がどんどん増えている分野だが、Mendelsによると、複数のプラットホーム間を容易に移動できる能力が、同社のいちばん重要な差別化要因だ。

彼はこう説明する: 「われわれは基本的に、インフラストラクチャを特定しない。だから顧客は自分のモデルの訓練を、ラップトップでも、プライベートなクラスターでも、あるいは、あまたあるクラウドプロバイダーのどれかでも、どこでやってもよい。どこでやるかは関係ないし、それらを切り替えてもよい」。

同社のプロダクトにはコミュニティバージョンともっと高度なエンタープライズバージョンがあり、後者はBoeingやGoogle、Uberなどが顧客だ。両プロダクト合わせて、同社プラットホームのユーザーはおよそ1万だ。

Mendels氏によると、Cometはそのプラットホームの人気を利用して、顧客が一般公開しているデータをベースにモデルを構築できた。その最初のものは、モデルが訓練疲労をいつ見せ始めるかを予測した。コメットのモデルはそれがいつ起きるかを当てることができ、データサイエンティストたちに、そのような疲労が通常起きるタイミングよりも30%早く、モデルをシャットダウンするよう合図することができた。

同社は2017年にシアトルで行われたTechStars/Alexaでローンチした。コミュニティバージョンのプロダクトがデビューしたのは、2018年だ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

ファイザーの元科学主任が設立したUnlearn.AIは「デジタルの双子」で臨床試験の高速化と改善を目指す

医療研究の分野では、双子は昔から重要な役割を果たしてきた。特に臨床試験では、遺伝的に近い2人の片方に処置を施すという方法で、双子は治療の有効性の測定に寄与している。米国時間4月20日、Pfizer(ファイザー)の元科学主任が設立し、AIを使ってこのコンセプトをデジタル化する方法を開発したスタートアップが、その研究をさらに進めるための資金を得たと発表した。臨床試験の検査に使用する患者の「デジタルツイン(デジタル上の双子)」のプロファイルを構築する機械学習プラットフォームUnlearn.AI(アンラーンAI)が、シリーズAラウンドで1200万ドル(約13億円)を調達した。

このラウンドは8VCが主導し、前回の投資企業であるDCVC、DCVC Bio、Mubadala Capital Venturesも参加している。

DiGenesis(ダイジェネシス)というこのスタートアップのプラットフォームは、当初は神経疾患、具体的にはアルツハイマー病と多発性硬化症に適用するためのものだったのだが、これらは有効な治療方法がいまだ確立されておらず、既に発症している患者を対象にした臨床試験の実施が非常に難しい。

Unlearn.AIは新型コロナウイルス(COVID-19)パンデミック関連の医療にはほとんど関わっていないものの、臨床試験の改善がなぜ重要なのかを知るいい機会を与えてくれた。この新型ウイルスに対抗するワクチンや治療法をみんなが緊急に競い合う中で、臨床試験のより効果的なアプローチの必要性が注目されている。そこはAIが力を発揮できる分野だ。

Unlearnは、現在のビジネスにおける提携先を公表していない。また実践的な臨床試験を、実際にどこまで実現できているのかも不明だ。今回の資金は、商業的展開に少しだけ近づくためのものと思われる。

「今回の資金調達は、私たちの成長にとって重要な布石だ。既にデジタルツインの研究を開始し、強力なエビデンスでその価値を実証し、臨床試験での成功の可能性を高めつつある規制当局との協力関係を大幅に前進させる力となります」とUnlearn.AIの創設者でCEOのCharles K. Fisher(チャールズ・K・フィッシャー)博士は声明の中で述べている。

「臨床試験は非常に困難な局面にあり、ここ数週間は深刻化する一方です。未来志向の投資家や提携企業の支援をいただき、極めて有能な私たちの人材をさらに成長させ、世界初のデジタルツインのアプローチを支える科学技術をさらに発展させられることを、とてもうれしく思っています」。

フィッシャー博士は、まさにテクノロジーと医療研究の集合体の中を歩んできた。製薬大手のファイザーで科学主任を勤めた経歴に加え、Leap Motion(リープモーション)で働いていたこともある。それ以前には、長年にわたり学術界にて生物物理学の勉強と研究を重ねていた。

Unlearnは昔ながらの機械学習の課題のひとつとして、いわゆるデジタルツインを構築するというアイデアに取り組んでいる。そこでは「デジタルツインを生み出すための疾病専用の機械学習モデルと仮想診療記録を構築するための、患者数万人分もの臨床試験のデータセット」が使われている。

これらは、単なる患者プロファイルとは異なる。デモグラフィック、臨床検査、生体指標に従って人と人とをマッチングさせてある。臨床試験と検査に必要な類似の人間、できれば双子を探す手間を、AIベースの双子を作ることで削減したいという考えに基づくものだ。

Unlearnは、2017年からこのプラットフォームの開発に取り組んできたが、双子(そして医療研究において遺伝子構造が類似した1組の人たち)を使った病理学や治療法の研究は、もう数十年前から始まっている。面白いことに、ある大人気の新型コロナウイルス監視アプリは、ロンドンのキングズ・カレッジ病院と、アメリカのスタフォード大学とマサチューセッツ総合病院が共同で行った長期にわたる双子の調査から生まれている

AIで「人」を作り出し、薬の有効性をテストする研究が広がっているが、それはコンピューターとアルゴリズムを使って薬品の組み合わや治療法を割り出しテストするという、さらに大きな課題へとつながる。以前は、長い時間と大きな資金を費やし、手で行ってきたであろうことだ(医療とは別の応用例として、製品開発がある。一般消費財のメーカーは、新しい石鹸やさまざまな製品の調合をAIプラットフォームで行っている)。

「Unlearnによるデジタルツインの先駆的な利用により、プラシーボを与えられる患者の数を減らすことができ、臨床試験にかかる全体的な時間も短縮できます」と8VCのプリンシパルFrancisco Gimenez(フランシスコ・ヒメネス)博士は声明の中で述べている。「医療とテクノロジーの交差点の投資家として、私たちは、最先端のコンピューター技術と革新的なビジネスモデルを組み合わせて医療の有意義な改善に取り組む企業に情熱を注いでいます。8VCはUnlearnをパートナーに迎え、無作為化臨床試験以来となる薬品の認可プロセスへの大きな挑戦に乗り出せたことで、大変に興奮しています」。ヒメネス氏は今回のラウンドにより、Unlearnの役員に加わった。

画像クレジット: Emsi Production Flickr under a CC BY 2.0 license.

新型コロナウイルス 関連アップデート

[原文へ]

(翻訳:金井哲夫)

今後の経済を支え続けるために重要なエネルギーグリッド向け予測ソフトのAmperonが約2.2億円を調達

エネルギー需要が世界的に減少している。原油価格も急落している。エネルギーの世界は全体的にかなり厳しいように見える。ただ、明かりをつけて電子を動かし続けることは、混乱に陥った経済の世界を維持していくためにも依然として重要だ。

データ分析に基づく予測ツールを電力小売業者やグリッドオペレーターに提供するAmperon(アンペロン)のようなスタートアップが今でも存在感を放ち、資金を調達し続けているのはそのためだ。

Amperonは、パンデミックが米国の両海岸を襲う前の2020年2月に終了したラウンドで200万ドル(約2億1500万円)を調達した。共同創業者のAbe Stanway(アベ・スタンウェイ)氏は、このような状況でも同社のサービスは現在も重要だという。

「当社は電力小売業者やグリッドオペレーターに、彼らの顧客が使用する短期・長期の電力量を伝える」とスタンウェイ氏は自社のサービスについて語った。「外因性ショックが加わり、滅多に起こらないブラックスワンな事案が発生すると、当社の価値は高まる。グリッドがどのように動作するか理解するために機械学習が必要になるからだ」。

Amperonの価値提案は、ラウンドをリードしたBlackhorn Venturesのような投資家だけでなく、ラウンドに参加したGaruda VenturesIntelis CapitalPowerhouse VenturesSK VenturesV1.VC.といった投資家にとっても明らかだった。

Powerhouse Venturesの創業者兼最高経営責任者であるEmily Kirsch(エミリー・キルシュ)氏は「Amperonは電力会社、電力小売業者、グリッドオペレーター、機関投資家向けにスマートメーターとAIを介したリアルタイムの運用グリッドインテリジェンスツールを構築している。Amperonの反復的な需要予測は、世界的なパンデミック、気候災害、ますます複雑化するグリッドに起因する、これまでにないグリッドの不安定性を説明することができる」という。

Amperonは4つの広域組織と協業している。豪州の主要なグリッド地域2つ、テキサスをカバーするERCOT(テキサス電気信頼度協議会)地域送電機関、中部大西洋のグリッドを管理するPJM(ペンシルバニア、ニュージャージー、メリーランドの略)だ。

スタンウェイ氏は「新しい資金は米国内で会社のリーチをもっと多くのグリッドオペレーターに拡げるために使う」という。

Amperonのテクノロジーは、危機的状況下の電力会社やグリッドオペレーターにとって非常に有用だが、平時でも支出削減に役立つ。同社によると、長期的な電力計画では通常、予算が毎年1%超過しており、不要な余剰発電容量に何十億ドル(何千億円)も費やしている。

支出削減は、消費者にとっては電気料金削減を意味する。同社によると、電力供給者の問題解決に役立つもう1つの点はグリッド管理の複雑化だ。電力会社やグリッドオペレーターがまだ効果的に管理できていないグリッドに再生可能エネルギーが加わると変動性が高まってしまう、と同社は話している。

画像クレジット:ArtisticPhoto

[原文へ]

(翻訳:Mizoguchi

セキュリティーの欠如で顔認識スタートアップClearviewのソースコードがすべて漏洩

2020年1月、ある新聞社の調査によってその衝撃的な存在が明らかになった、顔認識スタートアップのClearview AI(クリアビュー・エーアイ)は、たちまちハイテク系スタートアップ界の最も捉えどころがない隠蔽体質の嫌われ者になってしまった。

物議を醸している同社は、法執行機関が人の顔写真を撮りアップロードすると、30億人分の画像を保管しているとされる同社のデータベースで照合ができるサービスを提供しているが、その画像とは、一般のソーシャルメディアから集めたプロフィール写真だ。

だがしばらくの間、サーバーの設定ミスにより、同社の内部ファイル、アプリ、ソースコードが、インターネット上の誰もが見られる形で漏洩してしまった。

ドバイのサイバーセキュリティー企業SpiderSilk(スパイダーシルク)の最高セキュリティー責任者を務めるMossab Hussein(モサブ・フセイン)氏は、Clearviewのソースコードが保管されていたレポジトリーを突き止めた。そのレポジトリーはパスワードで守られてはいたが、設定ミスにより誰でも新規ユーザー登録ができ、ソースコードが保管されているシステムにログインできる状態になっていた。

レポジトリーには、コンパイルすればアプリとして実行できるClearviewのソースコードが保存されていた。さらにそこには、Clearviewのクラウド・ストレージのバケットにアクセスできる秘密の鍵と認証情報もあった。そのバケットの中には、Windows版とMac版とAndroid版のアプリの完成品が収められていて、さらにはApple(アップル)が規約違反としてブロックしたiOS版アプリもあった。また、通常はテスト用にのみ使われる開発者向けの初期のリリース前バージョンのアプリも保管されていたと、フセイン氏は言う。

しかもフセイン氏によれば、そのレポジトリーでは、ClearviewのSlackのトークンも晒されていた。これを使えば、同社の内部メッセージや会話がパスワードなしで誰にでも読めてしまう。

Clearviewには、ニューヨーク・タイムズによってその隠密活動を暴かれて以来、ずっとプライバシーの懸念が付きまっている。だがその技術はまだほとんどテストされておらず、顔認証の精度も実証されていない。Clearviewでは、この技術は法執行機関にのみ使用を許すものだと主張しているが、同社はMacy’s、Walmart、NBAといった民間企業にも声を掛けていたと報道されている。だが今回のセキュリティー上の失態により、セキュリティーとプライバシーへの取り組みに関して、同社にはさらに厳しい目が向けられることになりそうだ。

コメントを求めると、Clearviewの創業者であるHoan Ton-That(ホアン・トンタット)氏は、彼の会社は「常に大量のサイバー侵入攻撃に晒されているが、セキュリティー強化には多額の投資を行ってきた」と主張した。

「私たちは、HackerOne(ハッカーワン)の協力で賞金付きのバグ探しプログラムを立ち上げました。Cleaview AIの欠陥を発見したセキュリティー研究者には報酬が支払われます」とトンタット氏。「SpiderSilkは、このプログラムには参加していませんが、Clearview AIの欠陥を見つけて私たちに連絡してきました。今回の漏洩事件では、個人が特定されるような情報、検索履歴、整体認証情報は一切漏れていません」。

iOS用Clearview AIはログインする必要がないとフセイン氏は言う。彼は、このアプリの仕組みがわかるスクリーンショットをいくつか取り込んだ。ここではフセイン氏は、マーク・ザッカーバーグ氏の写真で試している。

トンタット氏は、SpiderSilkの行動を恐喝だと非難しているが、ClearviewとSpiderSilkとの間で交わされた電子メールから見えてくる様子は違っている。

これまでMoviePassRemineBlindといった数々のスタートアップのセキュリティー上の問題を報告してきたフセイン氏は、Clearviewの欠陥を報告はしたが、賞金は遠慮したと話している。受け取りにサインすれば、この一件を世間に公表できなくなるからだ。

賞金付きでバグ探しプログラムを実施する企業は、よくこうした契約を求める。セキュリティー上の欠陥を修復した後にその件を公表されないよう、秘密保持契約を結ばされることもある。だが、研究者たちには賞金を受け取る義務も、秘密保持契約を守る義務もないのだと、TechCrunchは専門家たちから聞いている。

トンタット氏は、Clearviewは「ホストの完全な犯罪科学検査を実施し、不正なアクセスは他に一件もなかったことを確認した」と話す。秘密の鍵は既に変更され、もう使えないとのことだ。

フセイン氏の発見により、普段はほとんど見ることができない秘密主義的な企業の業務が垣間見えた。同氏が公開したスクリーンショットには、トンタット氏が「プロトタイプ」だと説明した同社のInsight Camera(インサイト・カメラ)を参照するコードとアプリがわかるものがある。このカメラはもう開発が中止されている。

Clearview AIのmacOS版アプリのスクリーンショット。APIを使ってClearviewのデータベースに接続される。またこのアプリは、Clearviewの以前のカメラ・ハードウェアのプロトタイプInsight Cameraを参照するようにもなっていた。

BuzzFeed Newsによると、そのカメラをテストした企業に、ニューヨーク市の不動産会社Rudin Management(ルーディン・マネージメント)があると伝えている。同社が所有する2つのマンションに試験的に導入したという。

フセイン氏は、Clearviewのクラウド・ストレージのバケットの中に、およそ7万本もの動画を発見した。マンションのロビーに、人の顔の高さに設置されたカメラの画像だ。その動画には、建物を出入りする住人の顔が映されている。

トンタット氏は「防犯カメラ製品の試作段階で、私たちは、厳密にデバッギングを目的とした生の映像を収集していました。建物の管理会社から許可を得ています」と説明する。

TechCrunchが調べたところによると、Rudinが所有する建物はマンハッタンのイーストサイドにあった。物件リストとロビーの映像からも、それが確認できた。この不動産会社の担当者にメールを送ったが、返事は来ない。

マンションのロビーに設置し、通り過ぎる住人を撮影したカメラの映像のひとつ(顔のぼかしはTechCrunchが加工)。

Clearviewは、1月に世間に知られるようになってから、厳しい監視の目に晒されている。さらにハッカーたちの標的にもなっている。

2月にClearviewは、データ漏洩の際に顧客リストが盗まれたことを顧客に報告した。だが、同社のサーバーには「アクセスの形跡はない」と主張している。Clearviewはまた、Android版アプリを保管したものを含むクラウドストレージの複数のバケットをプロテクトせずに放置していた。

バーモント州の検事当局は、消費者保護法違反の疑いで、すでに同社の捜査を開始し、ニュージャージーサンディエゴを含む各警察署にはClearviewを使わないよう通達を出した。Facebook、Twitter、YouTubeをはじめとするハイテク企業の一部も、Clearview AIに対して停止通告書を送っている。

CBS Newsのインタビューで、トンタット氏は自社の事業をこう弁護していた。「もしそれが公共のもので、使える状態になっていて、Googleの検索エンジンで見られるものなら、それは私たちが所有しているとも言えます」。

[原文へ]
(翻訳:金井哲夫)

騙されない機械学習を米軍とインテルが共同開発へ

機械学習のモデルに対する騙し攻撃を防ぐ、サイバー防衛技術の改良を目指している米軍の研究開発機関DARPAは、チップメーカーのIntel(インテル)をその研究のリーダーとして選んだ。

人工知能技術の一種である機械学習(Machine Learning)は、新しいデータや経験を「学習」するたびに賢くなっていく。現在のところ最も一般的な用途は物の認識で、写真を見てそれが何か、誰かなどを当てる。目の不自由な人の視覚能力を助けたり、あるいは自動運転車が路上の物や状態を識別するのに利用している。

しかし、まれにある騙し攻撃は、機械学習のアルゴリズムに干渉する。例えば、自動運転車に普通の安全な物のようだけど実は違うという物を見せて、大きな事故を起こさせることもありえる。

数週間前にMcAfee(マカフィー)の研究者がTesla(テスラ車)を騙し、速度制限標識にわずか5cmのテープを貼っただけで、時速80kmという違反速度まで加速させることができた。その研究は、自動車などのデバイスの機械学習アルゴリズムを騙すMcAfee社の初期的な研究例の1つだった。

そこでDARPAは、その対策に乗り出した。同研究機関は今年の初めに、GARD(Guaranteeing AI Robustness against Deception、騙しに対して強いAIを保証する)と名付けたプログラムを発表した。機械学習に対する現在の防犯技術は、既定のルールを利用するものが多いが、DARPAが望むのは、ルールがあらかじめないような、さまざまな種類の犯行に対応できる幅広い防衛システムだ。

インテルは米国時間4月9日、同社はジョージア工科大学と共にその4年計画の事業の中心的契約企業になると発表した。

IntelのGARDチームを率いる主席エンジニアを務めるJason Martin(ジェイソン・マーティン)氏によると、同社とジョージア工科大が共同して「物を認識する能力を強化して、AIと機械学習の、敵対的な攻撃への対応を学習できる能力を高める」という。

インテルによると、プログラムの最初の段階はオブジェクト検出技術の強化にフォーカスし、空間(場所)とか時間、意味(セマンティクス)などが整合した物を正しく見つけるようにする。対象は静止画と動画の両方だ。

またDARPAによると、GARDは生物学などさまざまな異なる設定で使えるようにする。

DARPAのInformation Innovation Officeでプログラムマネージャーを務めているHava Siegelmann(ハバ・シーゲルマン)博士は「我々が作り出そうとしている幅広いシナリオに基づく防衛は、たとえば免疫系にもある。そこでは、攻撃を見つけ、それに勝ち、将来の遭遇においてより有効な反撃を作り出すためにその攻撃を記憶する」と語る。

「我々は機械学習を、確実に安全で、騙されることのありえないシステムにする必要がある」と同博士と語る。

関連記事: セキュリティにおけるAIへの要求(未訳)

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

Googleの研究でロボット犬の小走りが簡単に

ロボットが優れていればいるほど、その設計の際に参考にされたオリジナルの動物の方が、はるかに優れていることが多い。その理由の一部は、犬のように歩く方法を犬から直接学ぶことが難しいためだ。だがGoogleのAIラボによるこの研究が、その学習をかなり簡単にしてくれるだろう。

カリフォルニア大学バークレー校との共同研究であるこの研究の目的は、対象(模範的な犬)から、軽い小走りや方向転換のような「敏捷な行動」を、効率的かつ自動的に四足歩行ロボットに取り入れる方法を見つけることだった。この種の研究はこれまでも行われてきたが、研究者のブログ投稿が指摘しているように、確立されたトレーニングプロセスを実施するためには「しばしば多くの専門家の洞察を必要とし、多くの場合、望ましいスキルごとに時間のかかる報酬調整プロセスを伴う」ことがあった。

もちろんこのやり方はうまくスケールアップすることはできず、動物の動きがロボットによって十分に近似されることを確実にするためには、手動調整が欠かせなかった。どんなに犬っぽいロボットであっても、実際には犬ではない。そして実際の犬の動き方はロボットが動くべきやり方とは異なっている可能性があり、そのことでロボットが倒れたり、ロックしたり、その他の失敗が引き起こされる。

Google AIプロジェクトは、通常の手順に制御されたランダム性を追加することで、これに対処している。通常は犬の動きがキャプチャされて、足や関節などの重要なポイントが注意深く追跡されている。そうしたポイントは、デジタルシミュレーションの中で、ロボットの動作として近似される。ロボットの仮想バージョンは、犬の動きを自分自身で模倣しその過程で学習を行う。

そこまではまあ上手くいく。だが真の問題は、そのシミュレーションの結果を使用して実際のロボットを制御しようとするときに発生する。現実の世界は、理想化された摩擦法則などがを持つ2D平面ではないからだ。残念ながらそれが意味することは、修正されていないシミュレーションベースの歩行では、ロボットが地面に転倒してしまう傾向が出るということなのだ。

これを防ぐために、研究者たちは仮想ロボットの重量を増やしたり、モーターを弱くしたり、地面との摩擦を大きくしたりして、シミュレーションで使用する物理パラメータにランダム性の要素を加えた。これにより、どのように歩くかを記述する機械学習モデルは、あらゆる種類の小さなばらつきや、それらがもたらす複雑さを考慮しなければならなくなり、それらを打ち消す方法も考えなければならなくなった。

そうしたランダム性に対応するための学習を行ったことで、学習された歩行方法は現実世界でははるかに堅牢なものとなり、目標とする犬の歩き方をまあまあのレベルで真似ることができ、さらには方向転換や回転のようなより複雑な動きも、人の手による介入なしに、少しばかりの追加の仮想トレーニングで行うことができるようになった。

当然のことながら、必要に応じて手動で微調整を動きに追加することもできるが、現状ではこれまで完全に自動で行うことができたものよりも、大幅に結果は改善されている。

同じ投稿に記載されている別の研究プロジェクトでは、他の研究者グループが、ロボットに指定された領域の外を避け、転倒したときには自分で起き上がるようにさせながら、自律的に歩くことを教えたやり方を説明している。これらの基本的なスキルが組み込まれたロボットは、人間の介入なしに連続してトレーニングエリアを歩き回り、その結果かなり満足できる歩行スキルを習得できた。

動物から敏捷な行動を学習することに関する論文はこちらで読める。また、ロボットが自律的な歩行を学習することに関する論文(バークレー大学とジョージア工科大学との共同研究)は、こちらで読むことができる。

原文へ

(翻訳:sako)

機械学習モデルをさまざまなハードウェアに合わせて最適化するOctoMLが16億円相当を調達

OctoMLは機械学習のコンパイラースタックプロジェクトApache TVMのチームが創ったスタートアップだ。米国時間4月3日に同社は、Amplifyがリードし、90万ドル(約4億2000万円)のシードラウンドをリードしたMadrona Venturesが参加したシリーズAのラウンドで1500万ドル(約16億円)を調達した。OctoMLとTVMの中核的なアイデアは、機械学習を使って機械学習モデルを最適化し、さまざまなタイプのハードウェアでより効率的に動くようにすることだ。

OctoMLのCEOでワシントン大学の教授Luis Ceze(ルイス・セズ)氏は「機械学習モデルの開発はかなり進歩しているが、モデルを手にした時点から例えば、それを実際にエッジやクラウドで有効に使うためにはどう活用するのかという大きな苦労が始まる」と語る。

そのためにセズ氏と彼のワシントン大学のアレンコンピューターサイエンススクール(Paul G. Allen School of Computer Science & Engineering)の仲間たちがローンチしたのが、TVMプロジェクトだ。今やそれはApacheのインキュベイティングプロジェクトであり、AWS、ARM、Facebook、Google、Intel、Microsoft、Nvidia, Xilinxなどの企業からの利用、サポートが多いことから、チームは本格的な商用化が必要と考えた。そこで生まれたのがOctoMLだ。今日では、Amazon Alexaのウェイクワードの検出にもTVMが使われている。

セズ氏はTVMを、機械学習のモデルのための新しいオペレーティングシステムだ、と説明する。「機械学習のモデルはコードではないため、そこにコンピューターが実行する命令はない。そこにあるのは、統計的なモデリングを記述する数字だ。そんなモデルを特定のハードウェアプラットフォーム上で効率的に動作させるには非常に多くの問題があります。実行性能の良い方法を決めるのは非常に困難なで、人間の直観を必要とする重要な作業です」。

そのためOctoMLと、そのSaaSプロダクト「Octomizer」が登場した。ユーザーは自分のモデルをこのSaaSへアップロードすると自動的にモデルはユーザーが指定したハードウェアとフォーマットに基づいて最適化され、ベンチマークされ、パッケージされる。さらに高度な使い方として、このサービスのAPIをCI/CDの工程中に加えるやり方もある。そうやって最適化されたモデルは、それが動くハードウェアを完全に有効利用するよう最適化されているため相当速いが、多くの企業にとってさらにありがたいのは、効率化されたモデルがクラウドの利用コストを下げてくれること。そして性能の低い安価なハードウェアを使っても、これまでと同じ結果が得られることだ。ユースケースによっては、TVMはすでに80倍のパフォーマンス向上を達成している。

現在、OctoMLのチームは約20名だ。今回の新しい資金で増員を予定している。採用されるのは主にエンジニアだが、エバンジェリストも雇いたいとセズ氏は言う。また彼によると、SaaSプロダクト「Octomizer」は出だしとしては良いが、本当の目標は機能がもっと完全に揃ったMLOpsのプラットフォームだとのこと。「OctoMLのミッションは、MLOpsを自動化する世界で最良のプラットフォームを構築することだ」とセズ氏は語っている。

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

新型コロナ対策として空港の混雑などを監視するZensorsのコンピュータビジョン

新型コロナウイルスの感染が広がる中、商用のコンピュータビジョン技術が人々の行動を観測する有益なツールになりつつある。機械学習でレストランの空き状況や行列などを追跡するスタートアップのZensorsは、感染拡大防止のために測定のシステム化を必要としている空港などで、このプラットフォームを無料で利用できるようにする。

Zensorsが創業したのは2年前の2018年だが、TechCrunchは2016年に防犯カメラの映像などから有用なデータを抽出するコンピュータビジョンのアーリーアダプターの1つとして同社を紹介した。レストランを映すカメラでテーブルの空きを数え、時間の経過に伴うデータの変化を追跡するのは可能で当然のことのように思えるかもしれないが、数年前にはなかなか思いつかないことで、実現も簡単ではなかった。

それ以来Zensorsは、空港、オフィス、小売店などそれぞれの環境に合わせたツールを作ってきた。座席の埋まり具合やゴミ、行列の見込みなどを調べることができる。偶然ではあるが、人と人との距離を注意深く監視する必要がある現在の状況において、このようなデータは空港などの管理者にとってまさに必要なものだ。

Zensorsはカーネギーメロン大学から生まれた企業だ。Zensorsの共同創業者であるAnuraag Jain(アヌラーグ・ジェイン)氏は同大学に対し、Zensorsの技術を公衆衛生に生かしたいと考える空港などから多くの問い合わせを受けたと語っている

例えば、何人が行列に並んでいるかを数えるソフトウェアを応用すれば、簡単に人々の密集具合を推計し、人が集まり過ぎていたり狭い場所に集中したりしているときにアラートを送信できる。

「これで利益を得るのではなく、無償で支援しようと考えた」とジェイン氏は言う。そこで最短でも今後2カ月間、Zensorsは同社のプラットフォームを「我々のクライアントである空港など、現在の危機に最前線で対応している一部の組織」に対して無償で提供する。

特定のエリアにいる人が多すぎないか、ある場所が最後にいつ清掃されたか、急いで清掃する必要があるか、ある集団の中で何人がマスクをつけているかなど、新型コロナウイルスに関連して知りたい情報を提供する機能がすでに強化されている。

空港ではおそらくこうした情報をすでに追跡しているが、あまり体系化されてはいないだろう。このようなシステムは、清潔な環境を維持しリスクを減らすのに役立つはずだ。Zensorsとしては無償で試用した組織の一部が料金を支払うクライアントになることを期待していると思われる。関心を持った組織は、Zensorsの通常の問い合わせフォームから相談できる。

トップ画像クレジット:Zensors

新型コロナウイルス 関連アップデート

[原文へ]

(翻訳:Kaori Koyama)

AIとビッグデータが新型コロナとの戦いで奇跡を起こすことはない

かなづちを持っている人には、あらゆる問題が釘のように見える。予想通り、テクノロジーセクターは目に入るすべての釘を一生懸命かなづちで叩いている。だが、現代のデータエコシステムの分析力は、新型コロナウイルス治療への対応の点では非常に限られている。

企業が持つ莫大な量のコンピューティングリソースを、何らかの形でウイルスと戦うための世界的な取り組みに向けることは、もちろん期待すべきことであり、称賛すべきでもある。

うまく使えば非常に価値ある取り組みができる。例えば、既知のコロナウイルスに関する何千もの記事Semantic Sc​​holarのコンテキスト認識テキスト分析を適用すれば、世界中の研究者が検索できる。研究所や保健当局が世界中で利用できるデジタルコラボレーションツールは、最後にこの規模の公衆衛生上の危機があった際に利用可能だったものをはるかにしのぐ。

だが、進歩に関して誤った印象を与えかねない分野もある。AIとテクノロジーが大きく進歩した分野の1つに創薬がある。数多くの企業が設立され、数億ドル(数百億円)の資金を集めたのは、AIを使用すれば特定の条件下で効果を発揮する新物質を発見するプロセスを高速化できるという期待があったからだ。

当然、新型コロナも研究の対象となる。すでに複数の企業や研究機関が新型コロナに10とか100の有効な物質を発見したと喧伝している。そうした発表は見出しを飾りやすい。「AIが新型コロナに効く可能性がある10個の物質を発見」といった類いだ。

AIを応用することが悪いわけではないが、実用的な結果はほとんど得られていない。例えば交通手段の選択肢を絞るという政策提案に対して、交通量のビッグデータを分析し、提案を支持したり低評価を付すというのは1つのあり方だ。 だが分析によって多数の選択肢が提示されても、いずれも行き詰まってしまったり、現在の取り組みに有害でさえあるなら、話はまったく異なってくる。

これは、AIを応用するのがハイテク企業であり、解決策を提案した後は必然的に彼らの手を離れてしまうからだ。治療の手がかりというものは、選択肢から除外する場合でさえ、過酷なテストを必要とする。有効性を確認するならなおさらだ。すでに他の用途に承認されている薬でさえ、責任を持って大規模に展開しようとするなら、新しい適用方法について再び審査する必要がある。

さらに、この種の創薬プロセスを経て新物質を発見したとしても、何十億という製造量はおろか、何千という規模でさえも、製造にこぎつける保証はない。それはまったく別問題だ。(断っておく必要があるが、取り組んでいるAI企業もある

リード(新薬候補となる化合物)を生成するメカニズムとして非常に重要なアプローチだが、問題はリードがないということではない。リードを発見し、フォローアップする体制は世界中にある。繰り返すが、新薬候補の探索活動を誰も行うべきではないと言っているのではない。仕事の内容をよく考えるべきだと言っているのだ。不確実な結果を伴う一連の課題にもっとふさわしい人々がいる。

同様に、例えば胸部X線をアルゴリズムによって自動的に分析する「AI」による手法は、将来的には価値がある可能性もあるため追求する必要があるが、期待を現実に合わせることが重要だ。今から1〜2年後に、AI分析を行う遠隔医療研究施設が設立されるかもしれない。だがこの春の時点で、新型コロナの診断を提供する「AIドクター」はまだ存在しない。

将来、アルゴリズムがもたらす予測と効率化が歓迎される分野であっても、現在の緊急事態では使えない。求められるのは賢さや斬新さではない。緊急事態では物事が慎重に進められ、三重にチェックされる必要がある。動きの速いスタートアップにとって最も魅力的で人気のあるアプローチは、数百万もの命がかかり、数千もの物事が相互作用するような世界的な危機にはほぼ適さない。

自動車メーカーがマスクや人工呼吸器の製造に工場を活用するのはありがたいが、新薬発見は期待していない。同様に、創薬に取り組んでいる人々がそれ以上のものであると期待するべきではない。AIは原理的に超人的な結果を出すという点から、魔法のようにとらえられる向きがある。以前にも述べたが「より良い」プロセスは、間違った答えをより早く出すだけということもある。

バイオテクノロジー産業におけるデジタル分野の最先端の研究は、基本的にはなくてはならない。だがその性質から、迫り来るヘルスクライシスの緩和には向いていない。見出しだけを読む一般市民も、テクノロジーの進歩がもたらす成果を当て込むテクノトピアンも、そのような期待を持つべきではない。

画像クレジット:Peter Zelei Images / Getty Images

新型コロナウイルス 関連アップデート

[原文へ]

(翻訳:Mizoguchi

公共スペースを自律的に監視するFluSenseシステムが病気の動向を追跡

総人口に対する有病率を正確に推定する際の障害の1つは、データのほとんどが病院からのもので、99.9%を占める病院以外の世界からのものではないことだ。FluSense(フルーセンス)は、公共スペースにおける人間の数や咳の回数を数えて保健当局に情報を提供するシステムだ。プライバシーを尊重し、自律的に動作する特徴を持つ。

もちろん、風邪やインフルエンザの季節は毎年やってくる。だが今年は深刻だ。例年のインフルエンザの季節と変わらないのは、患者数推定が病院やクリニックからの統計数値の分析に頼っている点だ。「インフルエンザ様疾患」や特定の症状を有する患者の統計については一元的に集計、分析される。一方で、多くの人が自宅にとどまったり、病気にもかかわらず通勤したりしている。そうした人々は捕捉されているのか。

こうした状況では「何がわかっていないのか」がわからないため、病気の動向に関する推定値の信頼性が低くなる。推定値はワクチンの生産や病院のスタッフ数の判断などに利用される。それだけでなく、推定値がバ​​イアスを含んでしまう可能性もある。病院に行く可能性が低く、病気でも仕事をせざるを得ない可能性が高いのはどんな人たちか。それは低所得で医療の恩恵を受けられない人々だ。

マサチューセッツ大学アマースト校の研究者らは、FluSenseと呼ぶ自律的システムでデータの問題を軽減しようと試みている。このシステムは公共スペースを監視し、人間を数え、咳に耳をすます。公共スペースにこのシステムをいくつか戦略的に配置すれば、広く蔓延するインフルエンザのような病気に関して多くの貴重なデータと洞察が得られる可能性がある。

Tauhidur Ra​​hman(トーヒジュール・ラーマン)氏とForsad Al Hossain(フォーサッド・アル・ホサイン)氏は、ACMジャーナルに掲載された最近の論文でこのシステムについて説明している。FluSenseの基本構成はサーモカメラ、マイク、人間と咳の音を検出するよう訓練された機械学習モデルを搭載したコンパクトなコンピューティングシステムだ。

まず明確にしておきたい点は、これは1人ひとりの顔を記録、認識するシステムではないということだ。焦点を合わせる目的で顔を検出するカメラのように、このシステムは顔と体が存在することだけを確認し、視野に入った人数情報を作成する。一方、検出された咳の数は人数、くしゃみ、発話の長さなどの数値と比較され、一種の「病気指数」すなわち1人1分あたりの咳の数の計算に利用される。

配置例(上)、FluSenseのプロトタイプのハードウェア(中)、サーモカメラからのサンプルアウトプットで、人間がアウトライン化された上でカウントされる(下)

これは確かに比較的簡単に計算できる値だが、病人が集まるクリニックの待合室のような場所でさえ、現状このような数値は手に入らない。病院のスタッフは、毎日咳の数を集計、報告するようなことはしない。このシステムはどんな種類の咳か識別するだけでなく、人がどれだけ密集しているかなどの視覚的なマーカーや、場所別の病気指数などの位置情報を提供することができる。

「FluSenseの健康監視ツールは、新型コロナウイルス感染症(COVID-19)やSARSなどのウイルス性呼吸器疾患や、季節性インフルエンザの感染拡大予測に用途を拡張できると考えている」とラーマン氏はTechCrunchに語った。「さまざまな場所での症状の動態を理解することで、新しい感染症の重症度を把握し、社会的距離の確保(social distancing)やワクチン接種などのターゲットを絞った公衆衛生上の介入実行につなげられる」

こうしたシステムにおいて、考慮すべき明らかな重要事項としてプライバシーがある。ラーマン氏は「独自のハードウェアを開発すると決めた理由の1つはプライバシーの問題だ」と説明した。「一部の人は既に理解しているかもしれないが、我々のシステムは既存のカメラシステムに統合することができる。これは決して小さくない利点だ」。

「研究者らは現場の医療従事者と大学の倫理審査委員会から意見を聴取し、センサープラットフォームが許容可能であること、患者保護の視点とも十分整合していることを確認した」とラーマン氏は語った。「すべての関係者がためらいがあると語ったのは、患者がいる空間で高解像度視覚画像を収集することだった」。

同様に音声分類器も、人間が発した音声そのものを超えるデータを保持しないように特別に開発された。そもそも機密データを収集しなければ漏洩することもない。

当面の計画は、マサチューセッツ大学アマースト校のキャンパスの「複数の大きな公共スペース」にFluSenseを設置してデータを多様化することだ。「我々は複数の都市にまたがる試験実施のための資金も求めている」とラーマン氏は述べた。

こうした病気指数はいずれ、インフルエンザの予測に使用される他の直接的または間接的な指標と統合される可能性がある。新型コロナウイルスの管理には少し間に合わないかもしれないが、保健当局が次のインフルエンザシーズンへ向けた計画改善に非常に役立つ可能性はある。

画像クレジット:Irina_Strelnikova / iStock / Getty

[原文へ]
(翻訳:Mizoguchi

GoogleがCloud Nextのオンライン開催を日程未定で延期

数週間前にGoogleは、同社の2020年最大のカンファレンスであるCloud Nextの実会場における開催を中止した。現在、他の大きなイベントの新型コロナウイルス流行による中止が相次いでいる。Cloud Nextは当初、4月6日から8日までに延期され、他の企業と同じくオンラインでの開催になっていたが、米国時間3月17日の発表でそれもまた延期されることになった。新たな日程は発表されていない。

Google Cloudのチーフ・マーケティング・オフィサーであるAlison Wagonfeld(アリソン・ワゴンフェルド)氏は、再度の延期を発表するブログ記事の中で次のように記している。「目下、私たちにできる最も重要なことは、私たちの顧客とパートナー両者のサポートに集中することである。『Google Cloud Next’20: Digital Connect』の実施に対して今でも全精力を傾けているが、それは正しいタイミングで行うべきだ。状況が好転次第、その新たな日程をシェアしたい」

おそらくこれからの数週間は、これと似た発表が次々に行われるのではないだろうか。企業がリモートワークへ移行し、州が外出禁止を指示し、社会的距離(social distancing)という言葉を突然多くの人が知るようになり、基調講演をストリーミングでやることも難しくなっている。皮肉な見方をすれば、重要な疾病に関するニュースがひっきりなしに飛び込んでくる中、テクノロジー企業の発表の影が薄いことは注目に値するだろう。最近の数日で、複数の企業が延期の延期を発表しているが、今後さらに発表されることは確実だ。

関連記事:Googleは新型コロナの影響で同社最大のカンファレンスCloud Nextをオンラインで開催

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

コンピュータービジョンを利用して製品写真を重要な属性へと分解するGlisten

今日この時代になっても、新しい服を探すための最善の方法が、いくつかのチェックボックスをクリックして、果てしなく続く写真をスクロールしていくやり方だというのには驚かされる。どうして「グリーンの模様のスクープネックドレス」と検索して、結果をみることができないのだろうか? Glistenは、まさにこの課題を解決しようとしているスタートアップだ。その技術はコンピュータービジョンを使用してどんな写真からでも、写っている製品の最も重要な属性を理解して抜き出すことができる。

えっ、そんな機能もうあるのではと思ったかもしれない。ある意味それは正しいが、それほど役に立っているとは言えない。共同創業者のSarah Wooders(サラ・ウッダース)氏は、MITに通い自分のファッション検索プロジェクトに取り組んでいる最中に、この問題に遭遇した。

「オンラインショッピングを先延ばしにしていた私は、そのときVネックのクロップシャツを探していたのですが、まず見つかったのは2着だけでした。しかし、ずっとスクロールしていくと、さらに20着ほど見つかりました」と彼女は言う。「そのとき私は商品が極めて一貫性のない方法でタグ付けされていることに気づきました。消費者が見るデータが非常に煩雑な場合、おそらくその裏側はもっと悪い状況になっています」。

明らかになっているように、コンピュータビジョンシステムは、犬種の識別から表情の認識まで、あらゆる種類の画像の特徴を非常に効果的に識別するように訓練されてきている。ファッションやその他の比較的複雑な製品に関しても、似たようなことを行うことができる。画像を見て、信頼レベルを付加された属性のリストを生成することが可能なのだ。

そのため、特定の画像に対して、次のようなタグリストが生成できる。

想像できるとおり、これは実際とても便利だ。しかし、それはまだ多くの望ましい結果を置き去りにしたままなのだ。システムは「maroon」(栗色)や「sleeve」(袖)が、この画像に存在していることは認識しているが、それが実際に何を意味するのかは理解していない。システムにシャツの色をたずねてみても、人間が属性のリストを手作業で整理して、タグのうち2つは色の名前、これらはスタイルの名前、そしてこちらはスタイルのバリエーションのことといった具合に教えてやらない限り、システムはうまく答えることはできないだろう。

1つの画像だけならそうした作業を手で行うのは難しくないものの、衣料品の小売業者は膨大な製品を扱い、それぞれに複数の写真が関連し、毎週新しいものが入荷してくる状況なのだ。そうしたタグをコピー&ペーストで延々と整理し続けるインターンに、あなたはなりたいだろうか? そんなことはまっぴらだろうし、実際誰もやろうとはしないだろう。この点こそが、Glistenが解決しようとしている問題だ。コンピュータービジョンエンジンのコンテキスト認識を大幅に向上させて、その出力をはるかに便利にするのだ。

同じ画像をGlistenのシステムで処理すると、以下のような結果になるだろう。

ずいぶん改善されていないだろうか。

「私たちのAPIのレスポンスは実際に、ネックラインはこれ、色はこれ、パターンはこれという形式で返されるのです」とウッダース氏は説明する。

この種の構造化データは、データベースに容易に挿入することができ、高い信頼性とともに問い合わせを行うことができる。ユーザー(ウッダース氏が後ほど説明したように、必ずしも消費者である必要はない)は、「長袖」(long sleeves)と指定すれば、システムが実際に衣服の「袖」(sleeves)を見て、それが「長い」(long)ものを選ぶことを知っているので、組み合わせてマッチングを行うことができるのだ。

今回のシステムは、成長を続ける約1100万種類の製品イメージと、それに対応した説明文ライブラリでトレーニングされた。システムは自然言語処理を使用してそれらの説明文を解析し、何が何を参照しているかを把握する。こうすることで、学習モデルが「formal」を色のことだと思ったり、「cute」が利用されるシーンのことだと思ったりすることを防ぐための、重要なコンテキスト上の手がかりが与えられる。だが、データを単に投入してモデルにそれを判断させれば良いといえるほど、物事は単純ではないのではと考えるあなたは正しい。

以下に示したのは、説明のために理想化されたバージョンの概要だ。

「ファッション用語には多くのあいまいさがあって、それは間違いなく問題です」とウッダーズ氏は認めるものの、それは克服できない種類のものではない。「顧客に出力を提供するときには、各属性にスコアを付けています。そのため、それがクルーネックなのか、それともスクープネックなのかがあいまいな場合には、正しくアルゴリズムが機能している限り、双方にスコアとして大きな重みを付加します。確信が持てない場合には、信頼性スコアが低くなります。私たちのモデルは、現場の人たちがどのように製品にラベル付けしたか、その結果の集合で訓練されていますので、みんなの意見の平均値を得られることになります」。

当初のモデルは、ファッションと衣類全般を対象としていたが、適切なトレーニングデータを使用すれば、他の多くのカテゴリーに適用することもできる。同じアルゴリズムで、自動車や美容製品などの特徴を見つけることができるのだ。例えばシャンプーボトルを探す場合な、袖(sleeves)の代わりに適用シーン、容量、髪質、そしてパラベン(防腐剤であるパラオキシ安息香酸エステル)含有の有無などを指定できる。

普通の買い物客たちは放っておいてもGlistenの技術のメリットを理解してくれるだろうが、同社は自分たちの顧客が、販売の現場の手前にいることに気がづいた。

「時間が経つにつれて私たちが気づいたのは、私たちにとって理想的な顧客とは、乱雑で信頼性の低い製品データを持っていることに、苦痛を感じているような人たちだということでした」とウッダース氏は説明する。「それは主に、小売業者たちと協力しているハイテク企業なのです。実際、私たちの最初の顧客は価格の最適化を行う会社で、また別の顧客はデジタルマーケティング会社でした。これらは、アプリケーションとして当初私たちが考えていたものよりも、かなり外れた場所にある応用なのです」。

ちょっと考えてみれば、その理由が理解できるだろう。製品についてよく知れば知るほど、消費者の行動や傾向などと関連づける必要があるデータが増えていく。単に夏のドレスの売上が戻ってきていることを知っているよりも、七分袖の青と緑の花柄のデザインの売上が戻ってきていることを知っている方が良い。

Glistenの共同創業者サラ・ウッダース氏(左)とAlice Deng(アリス・デング)氏

競争相手は主に、企業内のタギングチーム(私たちが誰もしたくないような手作業のレビューを行う)や、Glistenが生成するような構造化データの生成を行わない汎用コンピュータービジョンアルゴリズムである。

来週行われるY Combinator のデモデー前にも関わらず、同社はすでに月々5桁(数万ドル、数百万円)の定常収益を得ているが、現時点では彼らの販売プロセスは、彼らが役に立つと思った人々への個別のコンタクトに限定されている。「ここ数週間で、非常に多くの売り上げがありました」とウッダーズ氏は語る。

ほどなくGlistenは多くのオンライン製品検索エンジンに組み込まれることになるだろうが、理想的には利用者がそれに直接気がつくことはないだろう。ただ単に探しものがはるかに見つかりやすくなったように思えるようになるだけだ。

関連記事:いまさら聞けないコンピュータービジョン入門

原文へ
(翻訳:sako)

Amazonがキャッシャーレス店舗技術を他の小売業者に販売開始

Amazonは3月9日、「Just Walk Out(ジャスト・ウォーク・アウト)」と呼ばれるキャッシャーレス店舗技術を販売すると発表した。この技術はカメラ、センサー、コンピュータービジョン、深層学習を使い、買い物客が支払いの列に並ぶことなく、そのまま店を出られるようにするものだ。現在、キャッシャーレスコンビニのAmazon Goと、シアトルに新しくオープンしたAmazon Go Grocery(食品)ストアでも、同じ技術が使われている。

Amazonの公式発表に先駆けて最初に報道したロイターは、さらにAmazonはJust Walk Outを導入したい最初の顧客と「複数の」契約を交わしたと話していることも伝えている。だが、その顧客が誰なのかは同社は明かしていない。

Amazonはまた、Just Walk Outの仕組みを解説するWebサイトもオープンし、この新事業に関する質問に答えている。

Webサイトでは、この技術には何年も前から他店舗が興味を示していたため、Just Walk Outの販売に踏み切ったと書かれている。Amazonが提供するシステムには「会計不要な買い物を可能にするために必要なあらゆる技術」が含まれるとサイトでは説明されている。つまり、同社はソフトウェア技術の他にも、カメラのハードウェアやセンサー技術も提供するということだ。価格は示されていないが、このシステムには電話と電子メールによる年中無休24時間体制のサポートが付く。

Amazonによると、システムの設置はAmazonが店舗を視察してからわずか数週間以内に完了するという。新店舗の場合は、建設段階からAmazonが参加し、店舗側と協力してJust Walk Outの設置を進めることができる。店舗改装の際にも、同じように対応できる。既存の店舗に設置する場合でも、営業への影響を最小限に抑えつつ、この技術を設置するという。

間違いのないように言っておくが、これはあくまで、客がレジに並ばずに買い物ができるようにするために店舗にその技術を販売するというものだ。その店舗をAmazon Goコンビニエンスストアのフランチャイズにすることは意図していない。

客の側からすれば、キャッシャーレスの店ではレジに並ぶ必要がないため、時間の節約になる。買い物の時間も惜しむ客が利用するコンビニや、カートに商品を山積みにした客が長い列を作る食料品店においてこのシステムは理に適ったものだ。しかし棚に商品を陳列していない、または売り場面積が非常に広い大型のデパートには向かない。

AmazonのJust Walk Outでは、客はクレジットカードを使って入店すると、Amazonのウェブサイトでは説明されている。客はアプリをインストールする必要も、Amazonのアカウントを作る必要もない。店内の客の動きをカメラが追跡し、商品が棚から取られたとき、または棚に戻されたとき、棚のセンサーがリストに記録する。客が商品を手に取ると、それが仮想カートに入れられる。店を出ると、買った品物の代金がその人のクレジットカードに請求される。紙のレシートが欲しい場合は、店内のキオスクで印刷できるとAmazonは話しているが、いずれにせよレシートは自動的にメールで送られてくる。

ただし、このシステムが結果的に店舗側の増収につながるか否かは定かではない。これによって必要経費が削減できたとしても、設置費用と管理費はかかる。当然のことながら、Amazonも店の従業員を減らすための技術として売り込みをかけているわけではない。従業員は、別の仕事に専念できるようにできるとAmazonでは話している。例えば、客をもてなしたり、質問に答えたり、商品を補充したりなどだ。こうした仕事には、通常の店舗ならすでに人が割り当てられているものだが、そうでないケースもある。とりわけ、オンライン販売のハブに移行しつつある店舗がそうだ。

こうしたシステムへの客の反応も、まだ未知数だ。Amazonの店舗はいまだに目新しい存在であり、こんな人を監視するような技術が一般化されるとしたら、または実際にそうなったとき、客は敬遠するかもしれない。

キャッシャーレスシステムを売り出している企業はAmazonだけではない。Amazonはいち早く自社店舗にこの技術を導入した先駆者ではあるが、それ以来、いくつもの技術系スタートアップが同様のシステムの販売を始めている。AiFi、Grabango、Standard Cognition、Zippinなどがそうだ。米セブンイレブンやWalmartのSam’s Clubなど、独自の自動支払い技術やキャッシャーレス技術のテストを開始する小売り店も現れている。

[原文へ]
(翻訳:金井哲夫)

Nvidiaが高速コンピューティングのためのデータストレージと管理プラットホーム開発のSwiftStackを買収

Nvidiaは米国時間3月5日、SwiftStackを買収したことを発表した。同社はソフトウェアを中心にデータを保存し管理するプラットホームで、パブリッククラウドとオンプレミス、そしてエッジへのデプロイをサポートしている。

その最新のバージョンはAIとハイパフォーマンスコンピューティングおよびGPUなどによる) 高速コンピューティングのワークロードをサポートしており、Nvidiaの関心はもっぱらそこにあると思われる。

SwiftStackの共同創業者でCPOのJoe Arnold(ジョー・アーノルド)氏は、本日の発表声明で「SwiftStackのチームはAIコンピューティングの構築に傾注してきた。Nvidiaの有能な人びとと共に仕事をすることは、そんな我々にとって最高に素晴らしいことだ。同社の世界最高の高速コンピューティングのソリューションに貢献できる日が、待ち遠しい」と述べている。

買収の価額は公表されていないが、SwiftStackはこれまでシリーズAとBのラウンドで約2360万ドル(約25億円)を調達している。それらのラウンドをリードしたのはMayfield FundとOpenView Venture Partners、ほかにStorm VenturesとUMC Capitalが参加した。

2011年設立のSwiftStackは、ごく初期のOpenStack企業でもある。その大規模なオープンソースプロジェクトは、企業のデータセンターにAWSのようなプラットホーム管理能力を与えた。SwiftStackはOpenStackの中でもとくにオブジェクトストレージSwiftの最大のコントリビューターで、そのさまざまな関連サービスを提供した。しかし近年ではOpenStackの人気の衰えと共に、その関係も薄れていた。

現在のSwiftStackは、PayPalやRogers、データセンターのプロバイダーDC Blox、Snapfish、TechCrunchの親会社Verizonなどが主な顧客だ。Nvidiaも顧客である。

SwiftStackによると、今後もSwiftやProxyFS、1space、およびControllerのような既存のオープンソースツールのメンテナンスは継続する。

アーノルド氏は「SwiftStackの技術はすでにNvidiaのGPUによるAIインフラストラクチャの重要な部分であり、買収によってさらにその関係が強まるだろう」と説明した。

関連記事:OpenStackのストレージプラットホームSwiftによるオブジェクトストレージサービスSwiftStack1600万ドルを調達

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

アフリカのZindiは、同地の複雑な諸問題をAIと機械学習で解決する

アフリカでAIと機械学習を使ってクラウドソーシングで複雑な問題を解決するケープタウンのZindiにはデータサイエンティストが1万人登録している。

2018年に創業されたまだ若いスタートアップである同社を利用して、企業やNGO、政府機関などが、ネット上でデータ指向の課題のコンペを主催できる。

Zindiはコンペに参加するアフリカのデータサイエンティストに対して、同社サイト上でコンテンツをオープンにしている。彼らはソリューションを提出し、スコアボードを這い上がり、優勝すると賞金を獲得する。

Zindiの共同創業者Celina Lee(セリーナ・リー)氏によると、これまでの賞金の最高額は1万2000ドル(約130万円)だった。コンペの主催者には入賞作の所有権が生じ、それらを新製品開発や既存システムへの統合に利用できる。

データサイエンティストは同社のサイト上に無料でプロフィールを作れるが、コンペの出資者はZindiに料金を払う。これがZindiの収益源になる。すでにアフリカ以外の有名企業も関心を示し、これまでMicrosoft(マイクロソフト)やIBM、Liquid Telecomなどもコンペを主催した。

南アフリカ国立道路庁は2019年に、同国の交通事故死亡者を減らすという課題でコンペを行なった。その目的は「次にいつどこで交通事故が起きるかを正確に予測する機械学習のモデルを作り、関連政府機関の交通安全対策の効果を数量化してより確実な政策にすること」だった。

リー氏によると、現状の1万名というデータサイエンティストの登録者数は、2019年に比べて100%の増加、すなわち倍増しているという。同社は今シリーズAの資金調達を準備しており、今後は人材を増やして新しい企画にも取り組みたいという。例えば現在温めている大学を対象とするハックコンペ、UmojoHack Africaは10カ国を対象として3月に開催する。

リー氏は「社内にハッカソン専門のセクションを作りたい。企業や大学がサービスを利用して学生やチームのスキルアップを図れるようにしたい」という。

サンフランシスコ出身のリー氏は、南アフリカ人のMegan Yates(ミーガン・イェーツ)氏やガーナ人のEkow Duker(エコウ・デューカー)氏らとともにZindiを立ち上げた。チームのオフィスはケープタウンにある。リー氏によると、同社は彼女のこれまで体験したことの2つの側面を合体させたものだという。「私の学歴は数学やテクノロジーが主だけど、非営利団体やソフトウェア開発の仕事をした経験がある。いつも、この2つの世界を合体させたいと考えていた」と彼女は語っている。

Zindi

その願いがZindiで実現した。同社は完全な営利企業だが、スタートアップの競争のほぼ80%には、社会に何らかのインパクトをもたらす側面があるとリー氏は言う。「特にアフリカでは、営利企業のための問題解決でも、必ず社会的なインパクトがある」のだそうだ。

アフリカでは多くのVCがフィンテックとeコマースにフォーカスしているが、Zindiを支援するAndelaやGebeyaはかなりユニークで、データサイエンティストやソフトウェアエンジニアなどテクノロジー方面の人材をアフリカで育てようとしている。

Zindiに集まるデータサイエンティストが取り組む問題とソリューションに全アフリカ的な普遍性があるなら、同社の市場は一気に拡大するだろう。しかも南アフリカやナイジェリアやケニアなど、アフリカの経済大国では特に、スタートアップが提供するソリューションは多くのプロジェクトにおいて、高価なコンサルティング企業を利用するやり方の代替手段になる可能性がある。

関連記事: Africa-focused Andela cuts 400 staff as it confirms $50M in revenue…売上5000万ドルを稼いだAndelaが人材需要の高度化で400名をレイオフ(未訳)

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

ハイブリッドITのオペレーションを助けるOpsRampが40億円超を調達

企業のITチームによる、ハイブリッド環境の理解と監視、管理、そして最も重要な項目である自動化を支援するOpsRampが米国時間1月30日、Morgan Stanley Expansion Capitalがリードする3750万ドル(約40億9100万円)の資金調達ラウンドの完了を発表した。これには、前からの投資家であるSapphire Venturesと新たな投資家Hewlett Packard Enterpriseが参加した。

OpsRampのこの前の資金調達は2017年で、そのときはSapphireが2000万ドルのシリーズAをリードした。

OpsRampのサービスの中核は、そのAIOpsプラットホームだ。このサービスは機械学習とそのほかの技術を利用して、近年ますます複雑性を増しているインフラストラクチャのデプロイとその管理を支援し、インテリジェントなアラートを提供するとともに、最終的にはチームのタスクの多くを自動化する。同社のプロダクトにはさらに、クラウドのモニタリングやインシデント管理のツールも含まれている。

同社によると、その年商は2019年に前年比で300%増加した(ただしその額は非公表)。顧客は1400社あり、またAWSやServiceNow、Google Cloud Platform、およびMicrosoft Azureなどのクラウドベンダーをパートナーにしている。

OpsRampの共同創業者でCEOのバルマ・クナパラジュ氏

共同創業者でCEOのVarma Kunaparaju(バルマ・クナパラジュ)氏によると、顧客企業の多くは大企業と中規模企業だ。同氏によると「これらの企業のITチームは大きくて複雑なハイブリッド環境を抱えていて、その単純化と一元化に苦労している。しかも、そういう思いとは裏腹にシステムとインフラストラクチャはますます分断化し、バラバラになっている。それでもなお、彼らは弊社のパートナーであるクラウドベンダーたちの成功に倣って、自分もFortune 5000社のグローバル企業の一員を目指したいと願っている」。

クナパラジュ氏によると、同社は今回の資金をマーケティングと製品開発の拡充に充てたいと考えている。「資金は主に、ヨーロッパ、中東、アフリカ、アジア太平洋などへの市場拡大に使いたい。ただしもちろん、北米におけるプレゼンスの拡張も重要だ。また、さまざまな方向性の製品開発にも力を入れたい」と続ける。

ハイブリッドクラウドは企業のITの負荷を増大し、利用するツールも増えるから、それを助けるOpsRampのようなスタートアップに投資家が着目するのも当然だ。今後このような投資案件は、さらに増えるだろう。

Hewlett Packard Pathfinderのトップで副社長のPaul Glaser(ポール・グレイザー)氏は 「我々も顧客企業のハイブリッドインフラストラクチャへの移行が増えている。そういう傾向に合わせて、OpsRampはITのオペレーションを管理するサービスとして差別化を図っており、それは弊社HPEの中核的戦略にもよく沿うものだ。OpsRampのプロダクトのビジョンと顧客企業からの支持を見ると、今は彼らの成長と拡大に投資すべき絶好のタイミングだ」と語る。

[原文へ]

(翻訳:iwatani(a.k.a. hiwa

合成データでMLを訓練し機械学習へのエントリーを容易にするRealityEngines

元Googleの役員たちが作ったAIと機械学習のスタートアップであるRealityEngines.AIが米国時間1月28日、ステルスを脱して最初の製品を発表した。

同社が2019年に525万ドル(約5億7300万円)のシードラウンドを発表したとき、CEOのBindu Reddy(ビンドゥ・レディ)氏はミッションについて、機械学習を企業にとってやさしくすると言うだけで、詳しい話は何もなかった。しかし今日チームは、エンタープライズにおけるMLの標準的なユースケースに伴う問題を解決する一連のツールをローンチして、サービスの具体的な内容を明らかにした。それらの問題とは、ユーザーチャーン(中途解約)の予測、不正の検出、営業の見込み客予測、セキュリティの脅威の検出、クラウド支出の最適化などだ。これらにあてはまらない問題には、もっと一般的な予測モデルサービスが提供される。

RealiyEnginesの前は、レディ氏はGoogleでGoogle Appsのプロダクトのトップを、AWSでは業種別AIのゼネラルマネージャーを務めた。共同創業者のArvind Sundararajan(アービンド・スンダララジャン)氏はかつてGoogleとUberに在籍し、Siddartha Naidu(シッダールタ・ナイドゥ)氏はGoogleでBigQueryを作った。同社の投資家は元Google会長Eric Schmidt(エリック・シュミット)氏、Ram Shriram(ラム・シュリラム)氏、Khosla Ventures、そしてPaul Buchheit氏(ポール・ブッフハイト)だ。

レディ氏によると、これら一連の製品を支える基本的な考え方は、企業に機械学習への容易なエントリーを提供することだ。企業自体にデータサイエンティストがいなくてもよい。

人材以外の企業にとっての問題は、ネットワークを有効に訓練するために必要な大量のデータが、往々にして存在しないことだ。AIを試してみたいという企業は多くても、この問題が前途に転がっている巨大な落石のような障害になっていた。RealityEnginesはこの問題を、本物そっくりの合成データを作ることによって解決。それで企業の既存のデータを補うことができる。その合成データがある場合は、ない場合に比べてモデルの精度が15%以上アップするそうだ。

レディ氏は次のように主張する。「敵対的生成ネットワーク(Generative Adversarial Networks、GANS)の最も強力な使い方は、ディープフェイクを作ることだった。ディープフェイクは、部分的に手を加えたビデオや画像で誤った情報を広めることが極めて容易であることを世間に知らしめたから、大衆の心にも訴えた。しかしGANSは、生産的な善用もできる。たとえば合成データセットを作って元のデータと合わせれば、企業に大量の訓練用データがなくても、堅牢なAIモデルを作れる」。

RealityEnginesの現在の社員は約20名で、その多くはML/AI専門の研究者または技術者だ。

[原文へ]
(翻訳:iwatani、a.k.a. hiwa

ドイツのプロサッカーリーグがAWSと組んでファン体験の向上を目指す

ドイツのサッカーのトップリーグであるBundesliga(ブンデスリーガ)は米国時間1月24日、ゲーム中のファン体験をもっと面白くするためにAWSとパートナーして人工知能を利用すると発表した。

ブンデスリーガなどを運営する上位団体ドイツフットボールリーグ(DFL)のデジタルスポーツ担当執行副社長であるAndreas Heyden(アンドレアス・ヘイデン)氏によると、これはファンがゲームの放送を見ているだけか、それともオンラインの対話性があるかによって異なるかたちになる。

ヘイデン氏は「ファンがもっとエキサイトするようにテクノロジーを使いこなしたい。ファンの参加性(エンゲージ)が増すことによって、ファン体験のレベルを上げ、放送では適切なタイミングで適切なデータを見せ、アプリやWebでは体験を個人化したい」と語る。

それには個人化されたコンテンツを届けることも含まれる。同氏は「今の時代は一般的に、人々の注意力や関心が長続きしないから、ユーザーがアプリを開いたときの最初のメッセージは、その時のコンテキスト(状況)とその特定のユーザーに最も合ったメッセージでなければならない」と説明する。

ファンにリアルタイムで高度な統計データを見せたり、あるいは応援しているチームにとって重要な瞬間にゴールの可能性を予言してもいい。ヘイデン氏によると、それは数字でストーリーを語ることであり、事後データの報道ではないという。

同氏はさらに「テクノロジーを利用して、テクノロジーがなければ不可能だったストーリーを語りたい。人間の記者ならシュートが入る確率を当てることはできないが、AWSならできる」と続ける。

Amazon(アマゾン)のCTOであるWerner Vogels(ヴェルナー・フォーゲルス)氏によると、AWSのプラットホーム上で機械学習などの技術を利用して観戦体験の質を上げ、若いファン層を引きつけることはどんなスポーツにも有効だ。フォーゲルス氏は「次世代のファンが参加性のある熱心なファンに育つためには、ありとあらゆる手段による拡張ファン体験が必須だ」と語る。

同氏によると、テクノロジーがない時代にはそんな体験は不可能だった。「10年前には不可能だったが、今では機械学習を初めAWSが提供している先進的な技術と、それらの急ピッチな成長進化により、スポーツファンにリアルタイムで新しい体験を届けることができる」とフォーゲルス氏。

ブンデスリーガは単なるサッカーリーグではない。売上ベースでは世界第2位のプロサッカーリーグであり、スタジアムへの観客動員数では世界一だ。DFLとAWSの関係は2015年に始まり、そのときヘイデン氏がリーグのオペレーションをAWS上のクラウドへ移行した。本日の発表は、そこからの流れだ。

同氏によると、ほかのクラウド企業でなくAWSを使うことにしたのは偶然ではない。サッカーの大ファンであるフォーゲルス氏はハイデン氏の長年の知己だ。AWSはDFLに入る前から10年以上使っている。本日の発表は、そんな長い関係の延長線上にある。

関連記事:AWS is sick of waiting for your company to move to the cloud(AWSはあなたの会社がクラウドに移行しないことにしびれを切らしている、未訳)

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

Google Calendarというコロンブスの卵に目をつけたClockwiseのAIアシスタント

スタートアップ企業は、職場のコラボレーションを一層充実させるために、さまざまなサブスクリプションサービスを有料で使っている。しかし、Slackのブームが本当に本物だとしても、もっと圧倒的な真実は、会議漬けで1日の仕事が台なしになることが多いということだ。時間管理のソフトウェアやシステム手帳のようなアプリはすべて個人の努力に依存しているが、でも1日に数時間も会議があれば、個人にコントロールできることには限界がある。

しかしAccelが投資しているClockwiseのCEOであるMatt Martin(マット・マーティン)氏によれば、個々の社員のスケジュールはチーム全体というレンズを通して見るべきであり、そして会議は「集中時間」を最大化するよう運営すべきだ。集中時間(Focus Time)とは、彼の定義では少なくとも2時間の邪魔の入らない時間ブロック(時間の塊)のことだ。

Clockwiseはすでに、LyftやAsana、Strava、Twitterなどが顧客だ。同社は、最初はプロダクトを無料で提供して顧客を広げようとしている。資金は二度のラウンドで1300万ドル(約14億3000万円)あまりを調達した。投資家はAccel、Greylock、そしてSlack Fundだ。

Googleカレンダーに統合される同社のソフトウェアは、人々をグループ化して彼らに合わせて会議の日程や時間を移動し調整するが、そのClockwise Calendar Assistantの最新のアップデートでは一部の困難な作業を自動化できるようになった。

カレンダーのこのような集団的管理はともすれば不平のタネになりがちだ。それを防ぐためのClockwiseの工夫はテスターたちに好評だった。

職種によって、例えばエンジニアは仕事に邪魔の入らない時間が長いことを好む。そこでClockwiseは、週にどれぐらいの集中時間が必要か指定できるようにした。また個人的カレンダーの要素も加えて、これだけは動かせないという私用の時間も指定できる。また会議の場所が会社の外のときは、そこまでの往復時間を考慮に入れる。

そのように動かせない会議もあるし、別の時間にオフサイトの人びとに頼る場合もある。役員の出席を必要とする会議は、彼らのスケジュールを優先する。柔軟性を必要としない会議もあるが、チーム会議の軋轢を自動的に解決できれば、ただ待ってるだけの30分という無駄な時間の発生を防げる。

今回のClockwise Calendar Assistantのアップデートでは、ClockwiseはSlackとの互換性を向上させた。ユーザーが指定した集中時間には、自動的に「do-not-disturb」にチェックが入る。そしてSlackのステータスには、その人が今参加している会議を入れられる。

メールやチャットを車輪のように再発明したアプリが多い中で、カレンダーという平凡なものを利用するClockwiseの着眼点は面白い。「豪華な」カレンダーと言われるGoogleカレンダーの需要は増えているが、そのユーザー数に見合った開発努力はまだ乏しい。その点でもClockwiseは興味深いが、今後は後続がどんどん出てくると考えられる。

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

アップルがエッジAIのXnor.aiを約220億円で買収か

2017年に、非営利団体のAllen Institute for AI(Ai2)からスピンオフしたXnor.aiが、約2億ドル(約220億円)でApple(アップル)に買収された。同社に近い筋が、今朝のGeekWireの記事を確証した。

アップルは、このような非公表の買収に関するかねてからの常套句でその記事を確認した。「アップルはときどき、小さなテクノロジー企業を買収しており、一般的にその目的や計画は明かしていない」。念のため、コメントを求めてみたが無駄だった。

Xnor.aiは、機械学習のアルゴリズムを高度に効率的にするプロセスの開発から始まった。 高度に効率的とは、そこらのもっとも低性能なハードウェアでも動くという意味だ。例えば、ごくわずかな電力しか使わないセキュリティカメラの組み込み電子回路などだ。そんなハードウェアでもXnorのアルゴリズムを使えば、オブジェクトの認識のような通常は強力なプロセッサーやクラウドへの接続を必要とするタスクをやってのける。

関連記事:エッジコンピューティングを再定義するXnorのクラッカーサイズの太陽電池式AIハードウェア

CEOのAli Farhadi氏と彼の創業チームはAi2で同社を作り、同団体がインキュベーター事業を公式に立ち上げる直前に独立した。そして2017年の前半には270万ドル、2018年には1200万ドルを、いずれもシアトルのMadrona Venture Groupがリードするラウンドで調達し、その後もアメリカ籍の企業として着実に成長した。

情報筋によると、2億ドルという買収価額はあくまでも概算だが、仮に最終額がその半分だったとしてもMadronaとそのほかの投資家にとっては大きなリターンだ。

同社は、Appleのシアトルのオフィスへ引っ越すようだ。GeekWireが悪天候下で撮ったXnor.aiのオフィスの写真からは、引っ越しがすでに始まっていることが伺われる。Ai2は、Farhadi氏が同団体にもはやいないことを確認し、しかしワシントン大学の教授職にはとどまる、と言った。

Appleのこれまでのエッジコンピューティングへの取り組み方を見れば、この買収は完璧に理にかなっている。機械学習のワークフローをさまざまな状況で実行できるために、専用のチップまで作ったAppleは明らかに、顔認識や自然言語処理、拡張現実などのタスクを、iPhoneなどのデバイスの上でクラウドに依存せずにやらせるつもりだ。それはプライバシーよりも、パフォーマンスが目的だ。

特に同社のカメラのソフトウェアは、撮像と画像処理の両方で機械学習のアルゴリズムを広範囲に利用している。その計算集約的なタスクは、Xnorの効率化技術によってかなり軽くなるだろう。結局のところ、写真の未来はコードにあるのだから。そして短時間かつ省電力で多くのコードを実行できれば、さらにもっと高度なことができる。

関連記事:コードが写真の未来を創る

また、アップルはHomePodでスマートホームの分野にも踏み込んでおり、応用範囲が非常に広いXnorの技術の未来をアップルのような巨大企業に関して正しく予測するのは本当に難しい。

画像クレジット:Bryce Durbin / TechCrunch

[原文へ]

(翻訳:iwatani、a.k.a. hiwa