グーグルがPixel 6用にカスタムチップを開発、AIとMLを自社スマホの差別化要因にする

Google(グーグル)はさきほど、もうすぐ発売されるスマートフォン「Pixel 6」のニュースをぶちまけた。米国時間8月11日にSamsungの大規模なイベントがあるため、その前に行いたかったのだろう。それとも、秋の大々的な発表に数カ月先駆けて、多くの人の関心を集めたかったのかもしれない。今後のさまざまなリーク情報の、先手を打つという意味もあるだろう。

いずれにしても、Googleが次に出すAndroidスマートフォンの外観の第一印象としては、背面にあるカメラシステムの大きな新デザインが目立つ。これまでの正方形の構成が大きな黒いバーに変わり、ハードウェアの大型アップグレードへの強い意志を感じることができる。前バージョンと前々バージョンでのメインのポイントはソフトウェアとAIだった。

関連記事:グーグルが正式に新スマホPixel 6を公開、専用チップにTnsorを搭載

さらに興味深いのは、TensorがPixel 6とPixel 6 Proで新たにデビューするカスタムのSoCで登場したことだ。同社はこれまでずっと、混雑したスマートフォン市場で自らを差別化することに苦戦してきた。そのための同社の決定打が未だに出てこない現状において、Tensorを実装したカスタムチップは重要な持ち玉かもしれない。

それは、ハイエンドのシステムにおいてQualcommのチップを捨て、Appleに倣ってカスタムチップの道を進むということだ。ただしそのチップはベースがARMのアーキテクチャだ。それは今や世の中の至るところにあるQualcommのSnapdragonチップのベースでもある。そしてGoogleもその低価格製品A Seriesでは、コンポーネントのサプライをサンディエゴの企業(Qualcomm)にこれまで同じく依存している

画像クレジット:Google

「Tensor」という名前は明らかに、これまで多くのプロジェクトを牽引してきたGoogleのML(機械学習)システムであるTensorFlowに由来している。当然ながら、同社はAIとMLを、来るべきスマートフォンにおけるチップの基礎として位置づけている。Pixelのチームはこれまで長年、差別化要因として、コンピュテーショナルフォトグラフィー(計算写真学)といったソフトウェアによるソリューションを追究してきた。

「私たちのシリコンを設計してきたチームは、Pixelをもっと有能にしたいと考えました。例えばTensorがすべてのチップにあれば、すべてのチップをGoogleのコンピュテーショナルフォトグラフィーのモデルを動かせるようにカスタム化できるでしょう。ユーザーにとってそれは、まったく新しい機能であり、同時にまた既存機能の改善でもあります」とGoogleは述べている。

Tensorは、カメラシステムのアップグレードだけでなく、発話認識や言語学習などの改善でも主役となる。当然ながら、その詳細は秋の正式発売までは一般には発表されないが、今回の発表はPixelチームの刷新された未来の姿の紹介に終止していたようだ。スマートフォンにおいてもAIとソフトウェアにフォーカスすることは、まさにスマートフォン分野でGoogleがやるべきことの中心にあるはずだ。

2020年の5月に、Pixelチームの主要メンバーがGoogleを去り、それはチームの今後の変化の方向性を示していたようだ。当時、ハードウェア部門のトップであるRick Osterloh(リック・オスターロー)氏が、厳しい言葉を述べていたらしい。

「AIは私たちのイノベーションの未来ではありますが、今の問題は、私たちがコンピューティングの限界にぶつかっていることです。そのために、ミッションを全幅的に追究することが阻まれています」とオスターロー氏は本日のポストで書いている。「そこで私たちが挑戦したのは、私たちの最も革新的なAIと機械学習をPixelのユーザーに提供できるためのモバイルのテクノロジープラットフォームの構築でした」。

関連記事
Google Pixel開発チームから2人の主要エンジニアが離脱、チーム内の争いが原因か
グーグルがAndroid 12の開発者プレビュー最新版を公開、触覚フィードバックなど拡張
中止の噂を否定するためグーグルがPixel 5a 5G販売を突然発表、2021年中に米国と日本で

カテゴリー:人工知能・AI
タグ:GoogleGoogle PixelPixel 6スマートフォンAndroidTensor機械学習人工知能

画像クレジット:Google

原文へ

(文:Brian Heater、翻訳:Hiroshi Iwatani)

サブウェイ店舗でAIが表情・視線を基にメニュー提案、OKIがAI用いた感情推定技術を活用した提案型注文システムの実証実験

サブウェイ店舗でAIが表情・視線を基にお勧めメニュー提案、OKIがAI用いた感情推定技術を活用した提案型注文システムの実証実験

OKI(沖電気工業)と日本サブウェイ(サブウェイ)は8月2日、OKIの「AIを用いた感情推定技術」(感情AI技術)を活用した「提案型注文システム」の実証実験を開始したと発表した。場所はサブウェイ渋谷桜丘店。検証期間は2021年8月6日まで。同実証実験では、注文客の興味・関心が高そうな「オススメ」メニューを提案して注文時の迷いを軽減する機能の有効性と、店舗における接客業務の効率化、さらにウィズコロナ時代に求められる非対面・非接触操作による注文の有用性を検証する。

実証実験の概要

  • 目的:興味・関心推定技術を用いた提案型注文システムの有効性の検証
  • 期間:2021年8月2日~6日
  • 場所:サブウェイ 渋谷桜丘店
  • 実施方法:当該システムの使用後、アンケート回答
  • 実験参加者:当日募集(先着順)

感情AI技術は、深層学習(ディープラーニング)を用いて、人の自然な表情や振る舞いから潜在的な感情を推定する技術という。提案型注文システムは、OKIの接客支援ミドルウェア「CounterSmart」搭載の感情AI技術の1つ「興味・関心推定技術」を用い、セルフ注文端末のカメラから得た表情データと視線センサーから得た視線データから、独自のアルゴリズムにより、注文客の興味・関心が高そうな「オススメ」メニューを提案し注文をサポートする。

注文客にとっては、メニュー選択の迷いを解消できることに加えて、注文方法がわからないことによる焦り・緊張の緩和、また店舗スタッフにとっては、注文時間の短縮とスムーズな注文による生産性向上、ストレス軽減などが期待できるといしている。

同実証実験では、サブウェイの実店舗において、実験に同意した来店客に実際に注文をしてもらい、その使用感をアンケートにより収集して、サブウェイの注文スタイルに不慣れな場合でも容易に、かつ非接触操作で安心して注文ができるかを検証する。また1人あたりの接客対応時間の短縮など、効率化を検証するとしている。

OKIは、注文を完全に自動化した端末において、視線入力や音声入力などを組み合わせた非接触対応を実現することで、ウィズコロナ時代における感染症予防の「新常態」に適応した新しい接客サービスの提供を目指す。引き続きAIを用いた感情推定技術の社会実装に取り組み、少子高齢化による労働力不足、感染症予防など、社会課題解決に貢献するとしている。

なお同実証実験については、横浜国立大学、自然科学研究機構生理学研究所、エヌ・ティ・ティ・データ経営研究所(NTTデータ経営研究所)を中心とした「生理学研究所COIサテライト拠点」活動の下で研究開発を進めているものという。同実証実験における各機関の役割は以下の通り。

  • OKI:感情推定技術を活用した提案型注文サービスの研究開発、プロトタイプの開発
  • サブウェイ:実証実験協力店舗の調整、提案型注文サービスの監修
  • NTTデータ経営研究所:OKI×サブウェイのマッチング、COI STREAM研究開発成果の社会実装支援

生理学研究所COIサテライト拠点は、文部科学省「革新的イノベーション創出プログラム」(COI STREAM)の研究開発拠点「精神的価値が成長する感性イノベーション拠点」のサテライト拠点のひとつ。

関連記事
著名人対象に公式3D CGモデル「デジタルツイン」を制作・管理・キャスティングするサービス開始、2023年までに500人制作
オリィ研究所の分身ロボット「OriHime」に新製品、自走可能で接客・誘導も行える拡張版「OriHime Porter」登場
UsideUのアバター採用遠隔接客ツール「TimeRep」がNTTドコモの5Gソリューションとして採択
AIチャットボット「りんな」のrinnaとUneeQを日本展開するデジタルヒューマンが協業、顔・声・視聴覚を持つ雑談AI実現
高さ2mの65型有機ELディスプレイで等身大のAIキャラによる接客実現、Gateboxが法人向け大型召喚装置
少人数で多拠点の遠隔接客を実現する「RURA」運営のタイムリープが1.8億円調達
レブコムがオンライン商談の会話をAIにより解析・可視化する新サービス「MiiTel Live」開始

カテゴリー:人工知能・AI
タグ:AI / 人工知能(用語)OKI / 沖電気工業(企業)コンピュータービジョン(用語)ディープラーニング / 深層学習(用語)日本サブウェイ(企業)日本(国・地域)

豆腐業界初の検品業務AI自動化・省人化、日本IBMが徳島県・四国化工機の豆腐生産工場スマートファクトリー化に向け支援

日本アイ・ビー・エム(日本IBM)は7月28日、徳島県・四国化工機の割れや欠けのある豆腐を自動判定し検品する、豆腐業界では初めてとなるAIラインピッキングシステム「STI-ALPS」 (エス・ティー・アイ – アルプス。Shikokukakoki Tofu Inspection – AI Line Picking System)の開発を支援し、2021年6月から稼働を開始したと発表した。

近年豆腐業界は、原材料の値上がりや後継者不足などの理由から地域密着型の個人商店から広域流通に対応できる企業に集約する流れが顕在化しているという。また2020年、国の基準改正により国内で常温流通が可能になったことで、無菌充填豆腐の製造技術を有する四国化工機への需要が増加していたそうだ。

そのため四国化工機では、主力製品の豆腐の品質向上と増産を目指したAIの活用に加え、複数のロボット装置や無人搬送のフォークリストを備えた阿南食品工場新棟を新設し、スマートファクトリー化を推進してきた。新棟では全機器の状況が一元管理できるIoTを導入し、2021年6月から本格的に稼働を開始したそうだ。

また四国化工機では、これまでも画像検査装置の導入を試みたことがあったものの、良品・不良品を判定する項目すべてをルール化し設定する必要があり、豆腐の割れ目やくぼみ、欠けの大きさ・数・深さといった決まりのない形を設定し判別するのは非常に困難で、目視による検査を必要としていたという。

一方今回開発のSTI-ALPSは、大量の画像データをAI学習して良品・不良品の「特徴」をモデル化し製造ラインから自動的に取り除くものとなっており、負荷の高い検品業務を自動化・省人化しているという。また、複数カメラを活用することで、上面・側面・底面に加え、分割パックの内側も検査が可能。これまで長年の経験が必要だった検品の自動化で、作業の速度や精度の向上、品質の安定、コスト削減を目指すとしている。

さらに、ロボット装置や無人搬送のフォークリフトをSTI-ALPSと連動することで、不良品を排除して良品を箱詰めし、冷蔵倉庫へ移動する作業の省人化を推進する。例えば、これまで実施していた目視検査は1ライン3名体制で稼働していたが、無人稼働が可能になり、職場の働き方改革を促進したとしている。

なおSTI-ALPSでは、AIの学習と実行に最適なサーバー「IBM Power System AC922/IC922」と、コーディングや専門的なスキルを必要とせずウェブブラウザー操作でAIの開発・実行が可能な「IBM Maximo Visual Inspection」を利用しているという。

関連記事
「はやい、やすい、巧い」エッジAIのフツパーと高速なアノテーションを提供するFastLabelが協業し国内産業のAI化推進
レクサス製造ラインの熟練工の技を人とAIが協働し伝承、TRIARTとトヨタが「不良予兆感知システム」の試行開始
ASTINAが化粧品のグラデーション生地などランダム模様の異物も検出可能な「OKIKAE for AI外観検査」を提供
「目についたら異常」などあいまいな官能検査も対応、ロビットが工業製品向け汎用型AI外観検査ロボを提供開始
ロビットが「雪国まいたけ」のまいたけカット工程自動化開発に成功、次世代パッケージングライン開発に合意

カテゴリー:人工知能・AI
タグ:AI / 人工知能(用語)画像解析(用語)食品 / 食料品 / 食材 / 食品加工(用語)資金調達(用語)日本(国・地域)

「はやい、やすい、巧い」エッジAIのフツパーと高速なアノテーションを提供するFastLavelが協業し国内産業のAI化推進

「はやい、やすい、巧い」エッジAIのフツパーと高速なアノテーションを提供するFastLavelが協業し国内産業のAI化を推進

AI開発に欠かせないアノテーション作業の高速化を行うFastLabel(ファストラベル)は7月29日、中⼩企業向けエッジAIシステムを提供するフツパー(Hutzper)と7月より協業し、システム連携を開始すると発表した。高速アノテーションとエッジAI技術を組合せることで、目視検査業務の効率化を目指す。

FastLabelは、AIの機械学習に用いられる「教師データ」作成に必要なアノテーション(データに関連するメタデータを埋め込む作業)の高速化を行っている。AIの産業利用では、教師データの不足や品質の低さで十分な性能が発揮できず、「実用化のボトルネック」になっているという。「AI開発を10倍速くする」をミッションとするFastLabelは、教師データの作成、分析、管理を効率化し、精度を向上させるアノテーションプラットフォーム「FastLabel」を開発・提供している。

一方、フツパーは、「はやい、やすい、巧い、AIを」をミッションに、目視検査業務を効率化する画像認識エッジAI特化型SaaS「Hutzper Insight」(フツパー・インサイト)と、画像認識AIモデル開発「Hutzper Vision」(フツパー・ビジョン)を開発・提供している。どちらも2020年設立の新しい企業だが、大手から中小まで、国内の企業に貢献している。

この協業では、両社の技術を組み合わせて、データアノテーションをエッジAIの運用オペレーションに組み込み、継続的に教師データの蓄積が可能となる機械学習基盤MLOpsを構築する。MLOpsは、機械学習用のDevOpsといった意味合いで、「機械学習」(ML。Machine Learning)とソフトウェア分野における継続的な開発手法「DevOps」を組み合わせた造語。

具体的には、フツパーの技術で認識した画像データをFastLabel側に連携し、アノテーターによるアノテーション完了後のデータをリアルタイムでフツパー側に連携するというものだ。アノテーションの難易度やデータ量に応じて、内部で処理するか、外注するか、両方を組み合わせるかが選べるという。

フツパー代表取締役CEOの大西洋氏は、「FastLabelと連携することにより、弊社のはやい・やすい・巧いAIがさらに速くなりました」と話している。今後も、エッジとクラウド間での「AIモデルの最適運用」を追究していくとのこと。

またFastLabel代表取締役CEOの鈴木健史氏は、「両者の強みを活かして製造業へのAI導入をさらに加速させていきます」と述べている。

関連記事
ソニー「IMX500」採用、動線分析のリアルタイム処理も可能なエッジAIカメラ「S+ Camera Basic」高機能版登場
レクサス製造ラインの熟練工の技を人とAIが協働し伝承、TRIARTとトヨタが「不良予兆感知システム」の試行開始
ASTINAが化粧品のグラデーション生地などランダム模様の異物も検出可能な「OKIKAE for AI外観検査」を提供
既存防犯カメラで来店客の店内行動を解析可能なエッジAI端末を提供する「AWL」が20億円調達
パトスロゴスが画像10枚から30分でAIモデルを作成できるノーコードの外観検査ソフト「DEEPS」リリース
「目についたら異常」などあいまいな官能検査も対応、ロビットが工業製品向け汎用型AI外観検査ロボを提供開始
中⼩企業向け検品・検査⼯程用エッジAIをサブスクで提供するフツパーが約1億円を資金調達
自動目視検査など製造業にAI外観検査システムを提供するMENOUが8000万円を調達
中小企業へ「はやい・やすい・巧いAI」の提供目指すフツパーが数千万円調達

カテゴリー:人工知能・AI
タグ:アノテーション(用語)エッジAI(用語)エッジコンピューティング(用語)MLOps(用語)機械学習 / ML(用語)製造業(用語)DevOps(用語)FastLabel(企業・サービス)フツパー(企業)日本(国・地域)

動画コンテンツを「読み取る」ことで、より効率的な検索を可能にするAnyClip

動画は昨今、世界をオンラインへ移行させている原動力といって差し支えなく、実際に2021年のIPトラフィックの82%を占めると予想されている。2021年5月下旬、その大量の動画コンテンツをより適切に解析し、インデックスを作成し、検索するための一連のツールを開発してきたスタートアップが、大規模な資金調達ラウンドについて発表した。2020年600%の成長率を見せたこのスタートアップは、さらなる事業拡大を目指している。

AnyClipは、コンテンツプロバイダーが動画の使用方法や視聴方法を改善できるよう、人工知能と標準的な検索ツールとを組み合わせたより優秀な動画検索ツールを彼らに提供している。このAnyClipが、自社プラットフォームを構築するための資金として、4700万ドル(約51億3000万円)を調達した。

この資金調達はJVP、Maison、Bank Mizrahiが主導し、内部投資家も参加して行われた。同社は評価額を公表していないが、現在までに7000万ドル(約76億4000万円)を調達しており、信用できる筋からの情報によると、評価額は約3億ドル(約327億5000万円)相当と考えられる。

テルアビブで創設され、ニューヨークにも拠点を置いているAnyClip。同社が現在取り組んでいるのは、社会に大量に出回っている動画への対処である。一般消費者がNetflixシリーズを観たり、YouTubeにあるクラッシック音楽を探そうとしたり、ビジネスユーザーがZoomで会議をしたり、といったように動画は最も多く利用されているコンテンツメディアの1つである。問題は、ほとんどの場合、人々が検索する際に表面的な検索しかしていない点である。

これは、ホストがアルゴリズムを微調整し、視聴者が他の動画よりもある動画を観るように仕向けている、といったことだけが原因ではない。ほとんどの場合、すべてを効率的な方法で検索するのは非常に困難だからであり、それは不可能だ、という人もいるほどである

AnyClipは、これを不可能ではないと考えているテック企業の1つである。コンピュータービジョン、NLP、音声からテキストへの変換、OCR、特許取得済みのキーフレーム検出、クローズドキャプションに基づくディープラーニングモデルなどのテクノロジーを活用し、動画のコンテンツを「読み取る」ことで、人、ブランド、製品、行動、何百万というキーワードを認識し、動画の内容に基づいて分類法を構築可能だ。これらは、コンテンツカテゴリ、ブランドセーフティー、あるいはユーザーの要求に基づいて行うことができる。

AnyClipは現在、AWSでAnyClip自身がホストしている動画を対象に作業を進めており、社長兼CEOのGil Becker(ジル・ベッカー)氏によると読み取りとインデックス化のプロセスは「リアルタイムの10倍」という驚異的な速さである。

この結果得られるデータおよびそれがどのように使用されるかについては、ご想像の通り、さまざまな潜在的用途がある。現在、ベッカー氏は、AnyClipは、さまざまなユースケース(社内用、B2B用、または一般消費者が動画を発見しやすくするためなど)で動画を効率よく整理する方法を探している顧客から強い支持を得ていると述べた。

上記の説明が示すように、このテクノロジーは当然、効果的に動画から収益を得るためにも使用できる。AnyClipは動画の中のオブジェクト、テーマ、ムード、言語をより多くより効果的に特定することで、人々が効果的に動画を発見できるようにするだけではなく、広告主が望むところに広告を配置することが可能なフレームワークを構築することができる(あるいは反対に、関係づけられたくないコンテンツを避けることもできる)。

AnyClipが連携している企業は、Samsung、Microsoft、AT&T、Amazon(Prime Video)、Heineken、Discovery、Warner Media(the latter two soon to be one)、Tencent、Internet Brands、Googleなど、錚々たる顔ぶれだ(ただし、ベッカー氏はこれらの顧客に対しどのようなサービスを提供しているかは明かさなかった)。

AnyClipはGoogleを自社への投資家とは考えていないが、Google News Initiativeのイノベーションの一環として 資金提供を受けてはいる。これは、AnyClipのAIに支えられた高度な動画管理ツールを用いながら、今日最も人気のあるビデオオンデマンドサービスの機能とデザインを模倣する、メディア企業向けのストリーミングビデオページエクスペリエンスの構築を目指すものだ。AnyClipは、企業がチャネルやサブチャネルを作成し30秒未満でライブラリを「NetflixやYouTubeのような」ライブラリに変換できるソリューションとして、数多くの企業の中から選ばれた。

AnyClipが、どのように現在取り扱っている検索および発見ツールの開発に至ったのかについては、興味深い経緯がある。AnyClipは2009年に同社の社名の由来にもなっているコンセプトで創設された。これはメディア企業が映画クリップを作成し、AnyClip自身のサイトでホストするインターネット上でシェアできるサービスで、これらのクリップはAnyClipのアルゴリズム、社員、および寄稿者によって構築された数多くの分類法を使用して検索することができた。これは、いうなればGiphyが登場する前の、類似のサービスであった。

しかし、そのサービスの登場はあまりに早すぎた。当時は著作権侵害が依然として大きな問題であり、Netflixesなど効率のよい合法なストリーミングサービスは存在せず、そのアイディアは複雑過ぎて、権利保持者に購入してもらうのは難しいことがわかった。そこでAnyClipは動画ベースの広告ネットワークの構築に軸足を移したのだが、これまた時期尚早であることがわかったのだ。

しかし、場所や時代が適切であれば、そのテクノロジーには見るべきものがあり、それでこそ、今日AnyClipは現在の立ち位置にあるといえる。同社は特許を保持しており、開発チームはそのテクノロジーを引き続き拡充している。これによりAnyClipは、Kaltura、Brightcoveなどの競合他社を引き離していると考えている。しかし当然のことながら、同市場におけるビジネスチャンスは非常に大きいため、競争がすぐになくなることはないだろう。

しかしAnyClipがこれまでの12年間で得てきた資金が3000万ドル(約32億円)という控えめなものだったことを考えると、現在のAnyClipの急成長は、同社が競合他社に打ち勝つ能力だけでなく、帯域幅とリソースを大量に消費する媒体と見なされている領域において資本効率を高める能力をも備えていることを物語っている。

「企業は動画を使ってメッセージやアイデンティティを伝えますが、その方法に革命が起ころうとしています」とJVPの創設者件会長でAnyClipの取締役会長であるErel Margalit(エレル・マーガリット)氏はいう。「動画に初めてAIが利用されます。企業や組織は、社内外を問わず、動画が文字よりも優勢なあらゆる領域で、これを利用し新しい形のコミュニケーション方法を確立しようとしています。彼らは一般消費者向けの動画や組織向けのトレーニング動画をどのように作成するか、あるいはコンテンツの取得にインテリジェントな管理が必要となるZoomでの会議の管理などに取り組もうとしています。新しい時代がやってきました。AnyClipはそういった取り組みに着手する人々にとって必須のツールなのです」。

関連記事
TC Early Stage Pitch-Offで優勝したVyrillはブランドがユーザーによる動画レビューを発見・活用をサポート
YouTubeの動画レコメンドAIは依然として悪行を重ねていることが大規模調査で判明
初期YouTubeも支えたオンラインビデオプラットフォームの老舗JW Playerは今もビジネスの最前線にいる

カテゴリー:人工知能・AI
タグ:AnyClip資金調達動画コンピュータービジョンディープラーニング

画像クレジット:AnyClip

原文へ

(文:Ingrid Lunden、翻訳:Dragonfly)

顔認証の使用禁止措置や論争にもかかわらず同スタートアップには巨額の資金が注がれている

顔認証の使用を抑制するプライバシー規制の導入という地方自治体による取り組みを考えると、顔認証テクノロジーを開発している企業の最悪の事態を想像するかもしれない。しかし最近の投資資金の流入からするに、顔認証スタートアップ業界は苦境に陥るどころか、むしろ繁栄している。

関連記事
メイン州も危険なバイアスのかかった監視技術、顔認識導入を拒絶する自治体に
反人種差別デモの発端となったミネアポリス市が警察による顔認識技術の使用を禁止

顔認証は最も議論を呼び、また複雑な政策分野の1つだ。このテクノロジーはあなたがどこにいるのか、何をしているのかを追跡するのに使うことができる。公的機関や店舗などの民間企業によって使用されている。しかし顔認証は往々にして非白人の顔を誤認したり、有色人種のコミュニティに偏った影響を与えるなど、欠陥があり、また不正確であることが示されてきた。欠陥のあるアルゴリズムは無実の人を刑務所に送るのに使われ、プライバシープライバシー擁護派はこの種の生体認証データの保存・使用法について数え切れないほどの懸念を示してきた。

関連記事
アメリカの複数の国会議員がAmazonの顔認識ソフトウェアの精度で質問状、表現の自由の無視、人種差別の疑いも
Amazonの顔認識ソフトウェアを人権団体がプライバシー侵害で懸念、AMZNは歯牙にもかけず
アマゾンが顔認識技術を地方警察には1年間提供しないと表明、FBIへの提供についてはノーコメント

連邦法の制定が迫っているという恐れから、AmazonやIBM、Microsoftといった最大の顔認証会社の一部は投資家、顧客、そして米政府や入国管理局によるそうしたテクノロジーの使用に抗議した自社社員の怒りを和らげようと、顔認証技術の警察部門への販売を停止すると発表した

顔認証への抵抗はそこで止まらなかった。年初以来、メイン州マサチューセッツ州ミネアポリス市は何らかの形で顔認証の使用を制限したり禁止したりする法案を可決した。他の多くの市や州に続く動きで、ニューヨーク市も独自の規制を導入している。

関連記事
反人種差別デモの発端となったミネアポリス市が警察による顔認識技術の使用を禁止
ニューヨーク市で生体情報プライバシー法が発効、データの販売・共有を禁止

そうした動きと重なるここ6カ月ほど、投資家らはいくつかの顔認証スタートアップに数億ドル(数百億円)もの金を注いできた。FindBiometricsによるCrunchbaseデータの分析では、顔認証企業へのベンチャーファンディング額は2020年に通年で6億2200万ドル(約686億円)だったのに対し、2021年はこれまでのところ5億ドル(約551億円)を超えている。

5億ドルのおおよそ半分はスタートアップ1社のものだ。イスラエル拠点のスタートアップAnyVisionは7月上旬、学校やスタジアム、カジノ、小売店などで使われている顔認証技術のためにシリーズCでソフトバンクのVision Fund 2から2億3500万ドル(約259億円)を調達した。顧客の1社として知られているのがMacy’sで、同社は万引き犯を特定するために顔スキャニング技術を使用している。MicrosoftがAnyVisionのシリーズAでの投資を撤回した1年前に比べ、投資ラウンドの規模は急拡大している。Microsoftは、イスラエル政府によるヨルダン川西岸の住民の監視にAnyVisionのテクノロジーが使用されていた、という報道についての元米司法長官Eric Holder(エリック・ホルダー)氏による調査を受けて投資を撤回した。

関連記事
物議を醸し出しながらも広く使われる顔認識のAnyVisionがソフトバンクなどから約261億円調達
マイクロソフトが顔認証スタートアップから撤退、海外の顔認証技術への投資を終了
米移民局や検察局などが採用中の顔認識技術が一般企業にも売られていた

ユーザーに通知することなくユーザーの顔認証を使用していたと非難され、論争によって評判を落としたParavisionはJ2 Venturesがリードしたラウンドで2300万ドル(約25億円)を調達した。

そして先週、議論の的となっている顔認証スタートアップのClearview AIは「名前を公表しないで欲しい」と依頼されて「機関投資家とプライベートなファミリーオフィス」とした投資家から3000万ドル(約33億円)を調達したことをニューヨークタイムズ紙に認めた。Clearview AIはいくつかの政府による調査の対象となっていて、ソーシャルメディアサイトから何十億枚というプロフィール写真をスクレイピングしていた疑いで複数の集団訴訟も起こされている。つまり、投資家らは顔認証システムの構築に喜んで金を注いでいる一方で、そのテクノロジーに自分の名前を絡ませることのリスクと論争をしっかりと認識している。

顔認証の応用と顧客は幅広く、このテクノロジーに関しては大きなマーケットが広がっている。

顔認証を禁止した自治体の多くは、特定の状況での使用、あるいはそのテクノロジーを自由に購入して使用することができる民間企業向けに幅広い免除も設けている。米政府が新疆ウイグル自治区の少数民族ウイグルのイスラム教徒に対する人権侵害に関係づけているHikvisionやDahuaといった中国拠点の多くの顔認証企業、そして米政府がブラックリストに載せている何十ものスタートアップの排除は、政府などを顧客とする最も儲けの多い米国マーケットで競争を促すのに一役買った。

しかし顔認証には引き続き厳しい目が向けられていて、テクノロジーが誤って使用されることがないよう一層の取り組みを投資家らは企業に促している。

合計4兆5000億ドル(約496兆5075億円)超の資産を持つ投資家50人のグループは6月、AmazonやFacebook、Alibaba、Huaweiなど何十もの顔認証企業に倫理的にテクノロジーを構築するよう要求した。

「一部のケースでは、顔認証のような新しいテクノロジーは私たちの基本的権利を損なっています。このテクノロジーはほぼ制約のない方法でデザイン・使用されていて、基本的人権にとってリスクとなっています」と声明文には書かれた。

倫理の問題だけではない。さらなる政治的な逆風が不可避である業界の将来性を証明しようという問題でもある。欧州連合のデータ保護当局は4月、域内の公共の場での顔認証の使用停止を要求した。

声明文には「大規模な監視が拡大するにつれ、テクノロジー面でのイノベーションは人権保護をしのいでいます。顔認証テクノロジー使用の禁止、使用に対する罰金、そしてブラックリスト掲載は増えています。こうした疑問を考慮する差し迫った必要性があります」とも書かれている。

関連記事:EUデータ保護当局のトップ監督官が公共の場での顔認識の禁止を強く要請

カテゴリー:人工知能・AI
タグ:顔認証プライバシー

画像クレジット:TechCrunch

原文へ

(文:Zack Whittaker、翻訳:Nariko Mizoguchi

メイン州も危険なバイアスのかかった監視技術、顔認識導入を拒絶する自治体に

顔認識のような危険なバイアスのかかった監視技術の導入を拒絶する都市、郡、州が増えているが、これにメイン州も加わった。

同州の新しい法律は、米国で最も強力な州全体にわたる顔認識に関する法律であり、幅広い超党派の支持を得ただけでなく、州議会の両院で満場一致で可決された。法案を支持した進歩的な議員から、法案を委員会の外で採決した共和党議員、メイン州のACLU、州の法執行機関に至るまで、さまざまな政治的立場の議員や支持者が一堂に会し、メイン州やプライバシーの権利に関心を持つすべての人たちにとっての大きな勝利を手にした。

メイン州は、ACLUなどの草の根の活動家や組織が主導する、顔認識技術の使用を禁止または厳格に規制する全国的な運動の最新の成功事例だ。Pine Tree State(メイン州)からGolden State(カリフォルニア州)に至る、顔認識を規制する全国的な取り組みは、21世紀のデジタル時代にテクノロジーで自由の境界を決めることはできないという広範な認識を示している。

顔認識技術は、市民の権利と自由に対する深刻な脅威となっている。民主的な監視がなければ、政府がこの技術を捜査網の監視ツールとして利用し、言論と結社の自由、正当なプロセスの権利、そして放置される権利が脅かされてしまう。この技術が規制されないままだと、民主主義そのものが危機にさらされることになる。

顔認識の負荷が平等にかかっているわけではないことは認識されている。黒人や褐色人種のコミュニティ、特にイスラム教徒や移民のコミュニティは、政府による差別的監視の対象となっている。さらに悪いことに、顔監視アルゴリズムでは、肌の色が濃い人、女性、高齢者、子どもの顔を正確に分析するのが難しい傾向がある。簡単にいうと、この技術は機能していても機能していなくても、危険をはらんでいるということだ。

もっとも、この技術を規制するすべてのアプローチが平等になされているとはいえない。メイン州は、州全体の包括的な規制をいち早く可決した州に挙げられる。公民権団体、地域社会、宗教的自由団体の強い反対にもかかわらず脆弱な法案を可決したのは、ワシントンが最初だった。その法案が可決された背景には、ワシントンに本拠を置く巨大企業Microsoft(マイクロソフト)からの強力な支持があった。ワシントン州の顔認識法の下においても、テック企業は数百万ドル(約数億円)相当の自社技術を、考えられるあらゆる政府機関に売却することができるのだ。

これとは対照的に、メイン州の法律は別の道をたどり、一般のメイン州民の利益を民間企業の利潤動機よりも優先させている。

メイン州の新しい法律は、公立学校や監視目的など、行政のほとんどの分野で顔認識技術の使用を禁止している。法執行機関が顔認識を使用する際の例外を慎重に設定し、その使用基準を作成し、米国の他の地域で見られたような悪用の可能性の回避を図っている。重要なのは、メイン州で仕事をしたり、政治集会や抗議活動に参加したり、友人や家族を訪ねたり、医療を求めたりする人々に対して、顔認識技術を使って監視を行うことを禁じている点だ。

メイン州では、法執行機関が顔認識の要請を行う前に、さまざまな制限がある中で、正当な理由があるかどうかの基準を満たす必要がある。また、顔認識のマッチングを唯一の根拠として、逮捕や捜索を行うことはできない。さらに、地元の警察が独自の顔認識ソフトウェアを購入、所有、使用することも禁じられており、他の起きているように、Clearview AIのような後ろ暗い技術が、メイン州の行政当局によって秘密裏に使用されることはない。

メイン州で制定された法律をはじめとするこの種の規制は、顔認識のような未検証の新しい監視技術によってコミュニティが被害を受けないようにするために不可欠なものだ。しかし、米国人のプライバシーを顔の監視から効果的に保護するには、地方レベルの断片的なアプローチだけでなく、連邦レベルのアプローチが必要である。だからこそ、米国民にとって、2021年6月に両院の議員が提出した「顔認識および生体認証技術モラトリアム法案」を支持することには大きな意味がある。

ACLUは、米国のすべての人々を侵入的監視から保護するこの連邦法を支持している。私たちは、顔認識技術を阻止し、それを支援する運動に参加することを議員たちに要請するよう、すべての米国国民に強く呼びかけたい。

編集部注:本稿の著者であるAlison Beyea(アリソン・ベイヤ)氏はメイン州のACLUのエグゼクティブディレクター。Michael Kebede(マイケル・ケベデ)氏はメイン州のACLUの政策顧問。

関連記事
ニューヨーク市で生体情報プライバシー法が発効、データの販売・共有を禁止
物議を醸し出しながらも広く使われる顔認識のAnyVisionがソフトバンクなどから約261億円調達
英個人情報監督局が公共の場でのライブ顔認証による「ビッグデータ」監視の脅威に警鐘を鳴らす

カテゴリー:人工知能・AI
タグ:メイン州顔認証プライバシー

画像クレジット:FotografiaBasica / Getty Images

原文へ

(文:Alison Beyea、Michael Kebede、翻訳:Dragonfly)

監視カメラやAIビジョンシステムを合成人間のデータで訓練する英MindtechがIn-Q-Telなどから3.6億円調達

誰のプライバシーも侵害されず、巨大なデータベースに顔がスキャンされることもなく、プライバシー法が破られることもない世界があったとしたら?そんな世界がすぐそこまで来ている。企業は単に現実世界の監視カメラ(CCTV)映像を捨て、潜在的なシナリオを100万回以上演じる合成人間に切り替えることができるのではないだろうか?それが、有力な投資家から資金を集めている、英国の新しいスタートアップが示す魅惑的な展望だ。

英国に拠点を置くMindtech Global(マインドテック・グローバル)は、エンド・ツー・エンド合成データ作成プラットフォームを開発した。簡単にいえば、店内での人の行動や、道路を横断する様子など、視覚的なシナリオを想像できるシステムだ。このデータは、大手小売企業、倉庫業者、ヘルスケア、輸送システム、ロボット工学などの顧客向けに、AIベースのコンピュータービジョンシステムを訓練するために使用される。文字通り、合成世界の中で「合成」CCTVカメラを訓練するわけだ。

このたび同社は、英国の地域投資家である国家生産力投資基金(NPIF、National Productivity Investment Fund、Mercia Equity Finance)がリードし、Deeptech LabsIn-Q-Telが参加した325万ドル(約3億6000万円)のアーリーステージ資金調達ラウンドを終了したと発表した。

この最後の出資者は重要だ。In-Q-Telは、米国の諜報活動を支援するスタートアップに投資しており、(ペンタゴンのある)バージニア州アーリントンに拠点を置いている。

MindtechのChameleonプラットフォームは、コンピューターが人間同士のやり取りを理解し、予測できるように設計されている。周知のように、現在、AIビジョンシステムを学習させるためには、企業がCCTVの映像などのデータを調達する必要がある。このプロセスにはプライバシーの問題がともない、コストと時間がかかる。Mindtechによると、Chameleonはこの問題を解決し、顧客は「フォトリアリスティックなスマート3Dモデルを使って、無限のシーンやシナリオをすばやく構築することができる」という。

さらに、これらの合成人間は、AIビジョンシステムのトレーニングに利用でき、人間のダイバーシティやバイアスからくる人的要因を取り除くことができるとのこと。

MindtechのCEOスティーブ・ハリス氏(画像クレジット:Mindtech)

MindtechのCEOであるSteve Harris(スティーブ・ハリス)氏は次のように述べている。「機械学習チームは、トレーニングデータの調達、クリーニング、整理に最大80%の時間を費やしています。当社のChameleonプラットフォームはAIトレーニングの課題を解決し、業界はAIネットワークイノベーションのようなより価値の高いタスクに集中できるようになります。今回のラウンドにより、当社の成長を加速させることができ、人間同士や周囲の世界との関わり方をよりよく理解する新世代のAIソリューションを実現することができます」。

では、それによって何ができるのだろうか?次のような場合を考えてみよう。ショッピングモールで、子供が親の手を放して迷子になったとする。Mindtechのシナリオの中で動いている合成CCTVは、それをリアルタイムで発見してスタッフに警告する方法を何千回も訓練されている。別の例では、配達ロボットが路上で遊んでいる子供に出会い、どうすれば子供を避けることができるかを学習する。最後の例として、プラットフォーム上で乗客がレールに近づきすぎて異常な行動をしている場合、CCTVは自動的にそれを発見して助けを呼ぶように訓練されている。

In-Q-Telのマネージングディレクター(ロンドン)であるNat Puffer(ナット・パッファー)氏は次のようにコメントしている。「Mindtechは、Chameleonプラットフォームの成熟度と、グローバルな顧客からの商業的牽引力に感銘を受けました。このプラットフォームが多様な市場で多くのアプリケーションを提供し、よりスマートで直感的なAIシステムの開発における重要な障害を取り除くことができることに期待しています」。

Deeptech LabsのCEOであるMiles Kirby(マイルズ・カービー)氏は次のように述べた。「ディープテックの成功のための触媒として、当社の投資およびアクセラレータプログラムは、斬新なソリューションを持ち、世界を変えるような企業を作る意欲のある野心的なチームを支援しています。Mindtechの経験豊富なチームはAIシステムのトレーニング方法を変革するという使命感を持っており、我々は彼らの旅をサポートできることを嬉しく思います」。

もちろん、スーパーでの万引きを発見したり、過酷な労働環境にある倉庫作業員を最適化したりするような、よりダークな用途への応用も考えられる。しかし理論的には、Mindtechの顧客はこのプラットフォームを利用して、中間管理職のバイアスを排除し、顧客によりよいサービスを提供することができる。

関連記事
ニューヨーク市で生体情報プライバシー法が発効、データの販売・共有を禁止
全米で失業保険用に導入された顔認識システムが申請を次々拒否、本人確認できず数カ月受給できない人も
欧州人権裁判所は「大規模なデジタル通信の傍受には有効なプライバシー保護手段が必要」と強調

カテゴリー:人工知能・AI
タグ:Mindtech Global資金調達イギリスプライバシーコンピュータービジョン監視カメラ

画像クレジット:Mindtech’s Chameleon platform/Mindtech

原文へ

(文:Mike Butcher、翻訳:Aya Nakazato)

コンピュータービジョンで多様なエフェクトを作れるビデオエディターVOCHIが全世界的に好評

オンラインのクリエイターたちが使用する、コンピュータービジョンの技術を利用した巧妙なビデオ編集アプリを作っているベラルーシのVOCHIが、昨年のウクライナのGenesis Investmentsがリードする150万ドルのラウンドに続き、このほど、「後期シード」と称するラウンドでさらに240万ドルを獲得した。新たな資金は、このモバイルツールのこれまでの大きな成長を踏まえており、今では毎月50万あまりのユーザーが使用し、1年で400万ドルあまりを稼いでいる。

この最新のラウンドの投資家は、TA VenturesとAngelsdeck、A.Partners、Startup Wise Guys、Kolos VC、そしてベラルーシのVervやエストニアのユニコーンBoltなどの企業からのエンジェルたちだ。資金調達と並行してVOCHIは、同社の最初の社員でマーケティングのトップだったAnna Buglakova氏を、プロダクト担当最高責任者(CPO)である共同創業者に昇進させた。

VOCHIの共同創業者でCEOのIlya Lesun氏によると、同社の発想はプロフェッショナルなビデオ編集技術を一般人が容易に使えるようにして、彼らの作るユニークでトレンディなコンテンツのおかげで、作者がソーシャルメディア上で目立つ人気者になることだった。そのためにVOCHIは、コンピュータービジョンの技術を利用した独自のビデオセグメンテーションアルゴリズムにより、映像中で動いている特定のオブジェクトや、写真などの静止画像中の特定部分に、さまざまなエフェクトをかける。

Lesun氏の説明によると、「そんな結果を得るために二つの訓練済みの畳み込みニューラルネットワークが、半教師ありのVideo Object SegmentationとInstance Segmentationを実行する。弊社のチームはさらに、ビデオエフェクトのためのカスタムのレンダリングエンジンを開発し、それは相手が4Kでもモバイルでも瞬時の適用ができる。しかも画質の損失がない」。編集作業としてのエフェクトの適用は、わずか数秒でできる速さだ。

関連記事: コンピュータビジョンを利用して動画の特定部分のみにエフェクトをかけられるスマホ向け編集アプリ「Vochi」

最初のシード資金はマーケティングと製品開発に投じられ、今や同社にはユニークなエフェクトが80以上、フィルターは30以上ある。


画像クレジット: VOCHI

今ではこのアプリは、ビデオに特殊な美観を与えるツールをいろいろ提供している。たとえば、夢の中のような雰囲気や、美術絵画の中、昔の8ビット画像などだ。また、動くオブジェクトはその輪郭を光らせたり、ぼかしや運動を加えたり、さまざまなフィルターを適用したり、またビデオ中に3Dオブジェクトを挿入し、ギラギラ感やチカチカ感を加えるなど、いろんなことができる。

また、コンテンツを直接編集するだけでなく、アプリ内でホームフィードを縦にスワイプすると、自分のコンテンツに他人が行った編集を見て、編集のヒントにすることができる。そして、好きだなと思うものを見たら、ボタンをタップするだけで同じエフェクトを自作に適用できる。完成したらそれをInstagramやSnapchat、TikTokなど、他のプラットホームで共有できる。

VOCHIはベラルーシの企業だが、ユーザーの大半は米国の若者だ。Lesun氏によると、ほかにロシアやサウジアラビア、ブラジル、そしてヨーロッパ各地のユーザーも多い。

ライバルのビデオエディターと違ってVOCHIは、エフェクトやフィルターのほぼ60%を無料で使える。無料に伴う制限は、何もない。他のビデオ編集ツールやコンテンツと併用してもよい。エフェクトの設定や、ユニークなプレゼン、さまざまな特殊エフェクトなどの高度な機能はサブスクリプションを要する。ただしそのサブスクリプションは、週7ドル99セントまたは12週39ドル99セントとお安くない。それは、ときどきビデオの制作を楽しみたいというカジュアルなユーザーよりも、プロのコンテンツクリエイターをユーザーとして想定しているからだ。アプリを150ドルで買い切り、という使い方もある。

同社によると、これまで、VOCHIの月間アクティブユーザー50万のうち約2万が有料ユーザーで、しかもそれは毎月20%ずつ増えている。


画像クレジット: VOCHI

でも、VOCHIが公表した数字は、同社がこれまで達成したことに比べればあまり重要ではない。

同社のビジネスが成長していたその同じ時期に、独裁政権が反対勢力を弾圧し、国中に逮捕と暴力が氾濫した。昨年は米国に本社のあるエンタープライズ系スタートアップPandaDocの複数の社員が、ミンスクでベラルーシの警察に逮捕された。それは、ルカシェンコ大統領に対する抗議への報復だった。4月には、ミンスクにおける同国のスタートアップとイベントとコワーキングスペースのハブであるImaguruが、同じくルカシェンコ政権によって閉鎖された。この古い建物でこれまで、Facebookが買収したMSQRDを初め、多くのスタートアップが誕生した。

関連記事: ベラルーシ政権が暴漢・圧力で同国の重要なスタートアップハブImaguruに閉鎖を強いる

その間、VOCHIは世界126か国のApp StoreでApp of the Dayとしてフィーチャーされ、月間収益はほぼ30万ドルにまで成長した。

VOCHIのインキュベーターだったBulba VenturesのゼネラルパートナーAndrei Avsievich氏は、こう述べている: 「パーソナルビデオは私たちの生活の中でますます重要な地位を占めるようになり、多くの人びとにとって、自己表現の手段になっている。VOCHIは、人びとがこのインスピレーションと学習の小道を辿ることを助け、ビデオによる創造性のためのツールを提供している。ユーザーや投資家がVOCHIを愛していることは、とても嬉しい。そのことは、収益と、応募超過の投資ラウンドの両方に表れている」。

今回の新たな投資はVOCHIをシリーズAに導き、彼らの仕事が今後ますます多くのクリエイターを惹きつけ、ユーザーエンゲージメントを向上し、アプリにもっと多くのツールを加えていくことに貢献するだろう。

関連記事: 10 VCs say interactivity, regulation and independent creators will reshape digital media in 2021(未訳、有料記事)

(文:Sarah Perez、翻訳:Hiroshi Iwatani)
画像クレジット: VOCHI

[原文へ]

アンソニー・ボーディン氏の最新ドキュメンタリー「Roadrunner」にはディープフェイク音声が使われている

米国時間7月16日、Anthony Bourdain(アンソニー・ボーディン)氏を描いたドキュメンタリー映画「Roadrunner」が米国の劇場で公開される。多くのドキュメンタリーと同様に、本作はインタビューや未公開シーンを含む数多くの記録映像から作られており、主人公の物語を自身の言葉で語らせようとしている。作品ではボーディン氏が2018年に自殺する前にカメラの前で話したことのなかった言葉も、彼の声で聞くことができる。

The New Yorker(ニューヨーカー)のインタビューに答えて、同作品の監督であるMorgan Neville(モーガン・ネヴィル)氏は、ボーディン氏に話して欲しかった発言が3つあったが、録音がなかったので代わりにソフトウェアを使って再現した、と語った。「彼の声のAIモデルを作りました」と同監督がNew Yorkerに語った。

それは簡単な仕事ではなかったようだ。別のGQのインタビューでネヴィル氏は、プロジェクトについて4つの会社と話をして一番良いところに決めたと語った。その会社は約10時間の音声をAIモデルに読み込ませた。ネヴィル氏が望むソフトウェアで再現するボーディン氏の正確な口調を決めるのには多大な労力が必要だった。作家で旅行家だった彼が文章を口述するやり方は長年のTV出演の間に大きく変わったからだ。

これまでに見たことのあるAIディープフェイクで人を騙すやり方と比べて、出来は悪くないが、倫理的にはやはり疑問が残る。私が知る限り、この映画にボーディン氏の声をAIで再現したことを示す情報開示はない。「この映画を見たら、わかっているもの以外、どのセリフをAIがしゃべっているのかは、たぶんわからないでしょう」とネヴィル氏はThe New Yorkerに話した「後日ドキュメンタリー倫理委員会を開くかもしれません」。GQのインタビューでは、ボーディン氏の遺族が彼に「トニーが生きていれば喜んだことでしょう」と言ったことを話し「私は彼の言葉を生き返らせようとしただけ」と付け加えた。

【編集部注】本稿(原文記事)はEngadgetで掲載された。

カテゴリー:人工知能・AI
タグ:映画合成音声ディープフェイク

画像クレジット:CNN / Focus Features

原文へ

(文:Igor Bonifacic、翻訳:Nob Takahashi / facebook

【コラム】パンデミックによる米国の労働力不足はAIニーズを呼び起こす大きなチャンスとなるのか?

編集部注:著者のChetan Dube(チェタン・ドゥベ)氏は、Amelia(アメリア)の創業者でCEOである。ニューヨーク大学の元助教授で、自動制御、コグニティブ・コンピューティング、デジタル・ワークフォースの将来的な影響に関する専門家でもある。

ーーー

パンデミックが引き起こした米国の文化や社会への地殻変動は、まだまだ終わりそうにない。その中でも特に目立つのは、米国の労働市場が完全に混乱してしまっていることだ。

何百万人もの人びとが失業しているのに、小売業やカスタマーサービス、航空会社などの企業が十分な労働力を確保できていない。Uber(ウーバー)の料金が高騰したり、飛行機がキャンセルされて延々と待たされたりする背景にあるこの不可解なパラドックスは、単に私たちにとって不便というだけではなく、パンデミック後の米国の労働側からの明確なメッセージでもあるのだ。多くの人が、現在の仕事では給料が低く、過小評価され、存在感が希薄になっていて、キャリアを変えたり、ある種の仕事からは完全に足を洗ったりしたいと考えている。

なお、低賃金労働者だけではなく、ホワイトカラーの退職者も過去最高となっていることにも注目する価値がある。パンデミックの際に実施された失業手当の延長が、一部の労働者の様子見を促している可能性もあるが、従業員たちの燃え尽きや仕事への不満も主な原因となっている。

私たちの目の前には賃金問題と従業員の満足度の問題が横たわっていて、議会はこれからの長い夏の間に解決策を見つけなければならない。しかし、その間に企業は何をすればいいのだろうか?

今、企業が必要としているのは、新型コロナウイルスによる救済措置や失業手当が期限切れとなる9月までの一時しのぎの解決策か、もしくはエンジンをただ動かし続けるだけでなく船を前進させるような、より長期的で頑丈な解決策だ。AIの採用は、その両方の鍵となり得る。

「私たちはAIの目覚めの瀬戸際に立ち会っている」と宣言したところで、おそらく2021年目にしたものの中で最も衝撃的な言葉ではないだろう。しかし、ほんの数年前までは、自動化やAIの進歩により、遠い想像からごく個人的な現実へと変化し始めたことが、膨大な数の人々を怯えさせていたのだ。人びとは、ロボットやバーチャルエージェントの登場で、命の綱である仕事を失うのではないかと、本気で心配していた(今でも一部の人は心配している)。

しかし、この「AIが仕事を奪う」というストーリーは、現在私たちが置かれている文化的・経済的な状況に適用されるのだろうか?

誰もその仕事が好きじゃないのに、AIが仕事を奪っていると言えるのだろうか?

この「人手不足」に明るい面があるとすれば、それは現実の世界にある「組み分け帽子」(ハリーポッターに出てくるクラス分けを行う帽子)の役割を果たしているということだ。雇用の問題からお金を取り除いてみると、人々がどのような仕事を好ましいと思っているのか、さらには、何を好ましくないと思っているのかが明らかになってくる。具体的には、製造業、小売業、サービス業が最も厳しい労働力不足の打撃を受けていて、こうした仕事に関連するタスク(反復的な業務、報われない接客業務、肉体労働)が、ますます多くの潜在的な労働力を遠ざけていることが明らかになっているのだ。

製造業におけるAIの導入は、パンデミックの間にサプライチェーンの変動に対応するために加速したが、今や「試験的な苦行」から広い導入へと移行しなければならない。この業界におけるAIの最適なユースケースは、品質検査、一般的なサプライチェーン管理、リスク / 在庫管理など、サプライチェーンの最適化に役立つものたちだ。

最も重要なことは、AIが機器の故障や破損の可能性を予測し、コストを削減し、ダウンタイムをほぼゼロにできることだ。業界のリーダーたちは、AIは事業継続に有用であるだけでなく、既存の従業員を置き換えるのではなく、彼らの仕事や効率性を増強することができると考えている。AIは、リアルタイムのガイダンスやトレーニングを提供して従業員を支援したり、安全上の危険を警告したり、組み立てラインの潜在的な欠陥を検出するなどの作業を引き受けることで反復的でスキルの低い作業から人間の従業員を解放することができる。

製造業において、現在のような人手不足は今に始まったことではない。米国この業界は、長い間認識の問題に直面してきた。主に若い労働者が製造業を「低技術」で「低賃金」だと考えているからだ。AIは、既存の仕事をより魅力的なものにして、収益の向上に直結させると同時に、テーマに沿った人材や専門知識を集める企業に新たな役割を生み出す。

小売業やサービス業では、過酷な接客業務と低賃金が原因となって、多くの従業員が離職している。それでも頑張っている人は、仕事に不満があっても現在受けている福利厚生のために手をこまねいているのだ。自然言語処理と機械学習を活用して人間のように人と対話できる会話型AIが、従業員を多くの単調な顧客体験のやりとりから解放することで、従業員たちはより頭を使い人間的な入力をもとに、販売やサービスブランドを高めることに焦点を当てた役割を担うことができるようになる。

多くの小売業やサービス業の企業が、パンデミックの際に、オンラインでの大量処理に対応するためスクリプト付きのチャットボットを採用した。だがそうしたチャットボットは固定されたディシジョンツリーで動作しているので、文脈を無視した質問をすると顧客サービスプロセス全体が破綻してしまう。高度な会話型AI技術は、人間の脳をモデルにしている。さらに、AIは運用を通して学習することで、より熟練した技術を身につけ、小売店やサービス業の従業員たちを煩雑な作業から解放し、顧客満足度と収益を向上させるようなソリューションを提供する。

職場におけるAIに対する躊躇と誤解が、長い間普及の障壁となってきた。しかし、人手不足に悩む企業は、AIが従業員の生活をより良くより楽にすることができる場所を検討すべきであり、それは収益成長のためにはメリットにしかならない。そしてそれが、おそらくAIが必要とする大きなチャンスなのだ。

関連記事:【コラム】21世紀型の搾取となっている「ギグエコノミー」

カテゴリー:人工知能・AI
タグ:コラム労働アメリカ

画像クレジット:Westend6  / Getty Images

原文へ

(文:Chetan Dube、翻訳:sako)

AIのためのリアルなバーチャルトレーニング環境をフェイスブックとMatterportが共同開発

ロボットが家の中を移動できるように訓練するには、何軒もの本物の家で、実際に何時間も訓練する、何軒もの仮想の家で、仮想的に時間をかける、という2つの選択肢があるが、後者の方が便利なのはいうまでもない。FacebookとMatterport(マーターポート)は共同で、研究者および学習過程にあり、データを必要としているAIに、何千ものバーチャルかつインタラクティブな、本物の家のデジタルツイン(仮想空間で再現されたリアル空間)を提供する。

Facebook側の大きな進歩は、新しいトレーニング環境「Habitat 2.0」と、それを可能にするために作成されたデータセットの2つだ。数年前に公開されたHabitatを覚えているだろうか。当時Facebookは「身体性を有するAI」と呼ばれる現実世界と相互作用するAIモデルを開発するために、AIが動き回ることのできる、写真のようにリアルに描写された仮想環境を大量に構築していた。

関連記事:Facebookがロボットを学習させるための本物そっくりな仮想の家を提供

これまで、たくさんのロボットやAIが、現実よりもゲームに近い、理想的かつ非現実的な空間で、動作や物体認識などの学習を行ってきた。現実のリビングルームは、バーチャルに再現されたものとはまったく異なる。現実に近い空間で動きを学習したAIのナレッジがあれば、家庭用ロボットなどへの実際の適用も実現しやすくなるだろう。

しかし結局のところ、バーチャル環境にはポリゴンの厚みしかなく、相互作用は最小限で、物理的にリアルなシミュレーションもない。ロボットがテーブルにぶつかっても、倒れて物をそこら中にこぼしたりすることもなく、台所で冷蔵庫を開けたり、流し台から物を持ち上げたりすることもできなかった。今回、Habitat 2.0および新しいReplicaCADのデータセットは、相互作用性を改善し、単に3Dの表面をなぞるのではなく、3Dオブジェクトを増やすことで、この問題を解決する。

シミュレートされたロボットは、これまでと同様に新しい住戸単位の環境を動き回るが、あるオブジェクトに到達すると、そのオブジェクトに対して実際にアクションすることができる。あるロボットのタスクが「ダイニングテーブルからフォークを拾ってシンクに置く」ことだと考えてみよう。数年前までは、フォークを適切にシミュレートできなかったので、フォークを持ち上げたり下ろしたりすることだけが想定されていた。Habitat 2.0では、フォークが置かれているテーブルやシンクなどが物理的にシミュレートされる。そのため、計算量は増加するが、格段に有意義なシミュレーションとなる。

この分野は急速に進歩しており、新しいシステムが登場するたびに新機能が追加され、同時に次の大きな改善点やチャンスが示される。この場合、Habitat 2.0の最も近い競争相手は、住戸単位の環境と物理的なオブジェクトのシミュレーションを組み合わせたAI2(エーアイツー)の「ManipulaTHOR」だろう。

Habitat 2.0はスピードでManipulaTHORに勝る。論文によると、シミュレーターの実行速度はManipulaTHORと比較しておよそ50~100倍。つまり、ロボットは1秒あたり50~100倍多くのトレーニングを実行することができる(これは厳密な比較ではなく、2つのシステムは他にも異なる点がある)。

ここで使用されるデータセットはReplicaCADと呼ばれ、基本的にはオリジナルの部屋のスキャンをカスタム3Dモデルで再現したものである。面倒な手作業であり、Facebookはスケールアップの方法を検討していると認めているが、非常に有用な結果を提供する。

オリジナルの部屋のスキャン(上)とReplicaCADによる3D再現(下)

基本的なオブジェクトや動き、ロボットの存在などはサポートされているが、現段階ではスピードを優先したため、再現性は失われている。そのため、より詳細でより多くの種類の物理シミュレーションが計画されている。

また、Matterportは、Facebookとの提携でも大きな動きを見せている。ここ数年でプラットフォームを大幅に拡大したMatterportは、3Dスキャンした建物の膨大なコレクションを持つ。これまでも研究者との共同研究を行ってきたMatterportだが、そのコレクションの大部分をコミュニティで利用できるようにする時が来たと判断した

CEOのRJ Pittman(アールジェー・ピットマン)氏は次のように話す。「私たちは、現存するあらゆる種類の物理的構造物、構造物のようなものに対し、3Dデータを作成しました。住宅、高層ビル、病院、オフィス空間、クルーズ船、ジェット機、マクドナルド……。デジタルツインに含まれる情報すべてが、研究には非常に重要です」「これらの3Dデータはコンピュータビジョン、ロボット工学、家庭内オブジェクトの識別など、あらゆる分野に影響すると確信していました。Facebookに事細かに説明する必要はありませんでした。Habitatや身体性を有するAIにとっては、あきらかに重要なデータだからです」。

Matterportが、不動産を閲覧する人が目にするような住宅のスキャンから企業や公共スペースまで、1000点ものインテリアを極めて詳細に3Dキャプチャーしたデータセット、HM3Dを作成したのはこれが目的だ。HM3Dは、一般公開されているコレクションとしては最大となる。

画像クレジット:Matterport

正確なデジタルツインでトレーニングされたAIがスキャンし、読み取った環境は、スケール的に非常に正確で、例えば窓の表面積やクローゼットの総容積の正確な数値が計算できる。これは、AIモデルにとって有益でリアルな遊び場で、出来上がったデータセットは(まだ)インタラクティブではないものの、現実世界のあらゆる不変性を非常によく反映している(Facebookのインタラクティブデータセットとは異なるが、拡張の基盤となる可能性がある)。

ピットマン氏は「(HM3Dは)極めて多様性の大きなデータセットです」「 私たちは、さまざまな実世界の環境を、豊富に、確実に集めたいと考えていました。AIやロボットのトレーニングで最大限の効果を得るには、このような多様なデータが必要なのです」と話す。

すべてのデータはその空間の所有者から提供されたもので、(極めて小さい文字で印刷された契約書の細則を使って)非倫理的に集められたという心配はない。同氏の説明によると「最終的には、より大きく、よりパラメータ化されたデータセット、すなわちサービスとしての現実的な仮想空間を作成し、APIでアクセスできるようにしたい」とのことだ。

ピットマン氏は語る。「米国風のB&B(ベッドアンドブレックファスト、比較的低価格で利用できる宿泊施設)での利用を想定したおもてなしロボットを作っているとしましょう。B&Bのデータが1000個あればすばらしいと思いませんか?」「この最初のデータセットでどこまでのことが可能かを確認し、学び、研究コミュニティや自社の開発者と協力して、さらに進化させていきたいと考えています。私たちにとって重要な出発点です」。

ReplicaCADとHM3Dはどちらも公開され、世界中の研究者が利用できるようになる予定だ。

関連記事
Googleの研究でロボット犬の小走りが簡単に
VRで事前学習してから作業する公共トイレ用掃除ロボ

カテゴリー:人工知能・AI
タグ:FacebookMatterportトレーニング

画像クレジット:Facebook

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)

物議を醸し出しながらも広く使われる顔認識のAnyVisionがソフトバンクなどから約261億円調達

顔認識は、人工知能の応用分野の中でも特に問題の多い分野だ。コンピュータービジョンを使って顔を識別し、その後、その人の身元を特定することは、プライバシーやデータ保護、仕事の目的やシステム自体を支える倫理観について多くの疑問を投げかけている。しかし、その一方で、顔認識はさまざまなユースケースで広く採用されている。今回、この分野で物議を醸しながらも成功を収めているスタートアップの1つが、大規模な資金調達を完了した。

イスラエルのスタートアップであるAnyVision(エニービジョン)は、顔で人を識別するAIベースの技術を開発するだけでなく、大勢の中から高い体温の人を検出する技術も開発している。同社は2億3500万ドル(約261億円)の資金を調達したと認めた。

今回のシリーズCは、AIスタートアップとしては大規模なラウンドの1つだ。ソフトバンクのVision Fund 2とEldridge Industriesが共同でリードし、既存投資家も参加した(表には出ていないが、Robert Bosch GmbH、Qualcomm Ventures、Lightspeedなどが名を連ねている)。同社はバリュエーションを公表しておらず、問い合わせ中だ。PitchBookによると、AnyVisionは過去に約1億1600万ドル(約129億円)を調達しており、2020年の前回のラウンド以来、多くの顧客を獲得してきた。

また、AnyVisionのCEOであるAvi Golan(アビ・ゴラン)氏は、ソフトバンクの投資部門の元オペレーティングパートナーであることも特筆すべき点だ。

今回調達した資金は、SDK(Software Development Kit)の開発継続のため、特にエッジ・コンピューティング・デバイス(スマートカメラ、ボディカメラ、その他のデバイスに使用されるチップ)を動かし、同社のシステムのパフォーマンスとスピードを向上させるために使用されるという。

AnyVisionのシステムは、ビデオによる監視、監視員による警告、会社などの組織が群衆を監視・制御するといったシナリオで利用される。例えば、人数の把握、小売店での滞留時間の分析、違法行為や危険な行為の警告などに利用される。

「AnyVisionの認識AIのイノベーションは、受動的なカメラをプロアクティブなセキュリティシステムに変え、組織が高度なセキュリティの脅威に対してより全体的な視点を持つことを可能にしました」とゴラン氏は投資を発表する声明で述べた。「Access Point AIプラットフォームは、人、場所、プライバシーを保護すると同時に、コスト、電力、帯域幅、運用の複雑さを削減するように設計されています」。

多くの報道に触れ、AnyVisionの名前を知っている人もいるかもしれない。

同社は2019年、その技術によりイスラエル政府がヨルダン西岸地区のパレスチナ人の監視を密かに実行していると報道された。

同社はこれを否定したが、この話はすぐに同社の評判に大きな汚点を残すことになり、同時に顔認識の分野全体にさらなる監視の目を向けることになった。

これを受け、ベンチャー部門「M12」を通じてAnyVisionに投資していたMicrosoft(マイクロソフト)は、その投資と、顔認証投資に対する同社の姿勢を全面的に監査することになった。最終的にマイクロソフトは株式を売却し、今後、このような技術には投資しないことを約束した。

それ以来、AnyVisionは、顔認識という大きな市場には多くの課題や欠点があることを認め、この分野での「倫理的」なプレイヤーになるべく懸命に取り組んできた。しかし、同社を巡っては論争が続いている。

2021年4月のReuters(ロイター)の報道では、ロサンゼルスのCedars Sinai(シダーズ・サイナイ)のような病院から、Macy’s(メイシーズ)のような大手小売店、エネルギー大手のBPまで、今日どれだけ多くの企業がAnyVisionの技術を使用しているかが紹介されている。AnyVisionの権力とのつながりは、単に大きな顧客を持っているということだけではない。ホワイトハウスのJen Psaki(ジェン・サキ)報道官は、かつてこのスタートアップのコミュニケーション・コンサルタントを務めていた。

また7月6日、The Markupに掲載されたレポートでは、2019年に発行されたユーザーガイドブックを含むAnyVisionのさまざまな公開記録を調べ、同社がどれだけの情報を収集できるのか、どんなことに取り組んできたのかについて、かなり不利な状況を描いている(ある試験運用とその報告書では、テキサス州の学区の子どもたちを追跡している。AnyVisionは、わずか7日間で5000枚の生徒の写真を収集し、16万4000件以上の検出を行った)。

しかし、AnyVisionの技術が役に立ち、有用となり、あるいは歓迎されると思われるケースは他にもある。例えば、体温を検知して、高い体温の人と接触した人を特定する機能は、新型コロナウイルスの不明瞭なケースをコントロールするのに役立つ。例えば、人が集まるイベントでウイルスを封じ込め、遂行するための安全策を提供する。

また、これは明確にしておきたいが、この技術を開発・展開している企業はAnyVisionだけではなく、監視の目にさらされているのもAnyVisionだけではない。米国のClearview AIは、何千もの政府や法執行機関で利用されているが、2021年初め、カナダのプライバシー当局から「違法」と判断された。

実際、こうした技術がどのように発展していくのか、どのように使用されるのか、そして一般の人々がこれをどうに見るようになるのかという点においても、物語は完結していないようだ。今のところ、論争や倫理的な問題があったとしても、AnyVisionの勢いはソフトバンクを動かしているようだ。

「視覚認識市場は初期段階にありますが、欧米では大きな可能性を秘めています」と、ソフトバンク・インベストメント・アドバイザーズのパートナーであるAnthony Doeh(アンソニー・ドー)氏は声明で述べた。「我々は他のカテゴリーでAI、バイオメトリクス、エッジコンピューティングによる変革の力を目の当たりにし、AnyVisionが数多くの業界で物理環境分析を再定義するユニークな位置にあると信じています」。

関連記事
Clearview AIの顔認識技術はカナダでもプライバシー侵害で違法
英個人情報監督局が公共の場でのライブ顔認証による「ビッグデータ」監視の脅威に警鐘を鳴らす
スマホ電子チケット「チケプラ」で公演当日まで二次流通可能な顔認証入場システムを提供開始

カテゴリー:人工知能・AI
タグ:顔認識AnyVision資金調達Softbank Vision Fundイスラエルコンピュータービジョン

画像クレジット:Design Cells / Getty Images

原文へ

(文:Ingrid Lunden、翻訳:Nariko Mizoguchi

モバイルアプリのE2Eテストにも対応するAIテスト自動化プラットフォーム「Magic Pod」のTRIDENTが3億円調達

モバイルアプリのE2Eテストにも対応するAIテスト自動化プラットフォーム「Magic Pod」のTRIDENTが3億円調達

AIテスト自動化プラットフォーム「Magic Pod」を運営するTRIDENTは7月7日、第三者割当増資による3億円の資金調達を発表した。引受先はSTRIVE、Angel Bridge。今後は、グローバル展開も視野に入れたMagic Podの発展および採用強化をさらに加速する。

ソフトウェアテストの世界では、多くのエンジニアやテスト担当者が「リリースのたびに同じ手作業テストを繰り返す必要がある」「テストのせいでリリースサイクルを短縮できない」「機能が増えるとテスト項目が増え、開発速度が落ちていく」といった課題を抱えている。しかし、こうした課題解決のための仕組みを自社で構築するには非常に多くの時間とコストを要し、多くの企業が今も非効率な手動テストに依存している。

同社はそうした課題を解決すべく、AI技術を活用し、ウェブサイトとモバイルアプリのE2Eテスト自動化プラットフォームのMagic Podを開発した。現在利用企業数は500社を超えているという。

TRIDENTは、自動テストコミュニティ「日本Seleniumユーザーコミュニティ」のリーダーを務めるCEO伊藤望氏や、自動テスト書籍の著者・翻訳者である玉川紘子氏・戸田広氏など、自動テスト分野の著名なエキスパートが参画。テクノロジーを駆使した理想的なソフトウェアテストを簡単に行える世界の実現を目指し、誰でも手軽に使える・スピーディーで・品質の高いソリューションの提供を行う。

関連記事
ウェブアプリのUIテストを容易に自動化するUI-liciousがプレシリーズAで約1.6億円を調達
ノーコードのE2Eテスト自動化プラットフォーム「Autify」がモバイルアプリ対応版を提供
自動JavaユニットテストツールDiffblueの無料コミュニティエディションが登場
ノーコードで誰でもモバイルアプリをテストできる「Waldo」

カテゴリー:人工知能・AI
タグ:AI / 人工知能(用語)テスト自動化TRIDENT(企業)プログラミング(用語)資金調達(用語)日本(国・地域)

非プログラマーのために開発された機械学習のノーコードプラットフォーム「Obviously AI」、大日本印刷と提携し日本市場開拓戦略も進める

Nirman Dave(ニーマン・デイヴ)氏が起ち上げた2つのスタートアップは、まったく異なるものだが、どちらもDIYの精神を持っている。1つめは、高校卒業後のギャップイヤーに設立したCircuiTricks(サーキットリックス)という会社で、電子工学や物理学を学生に教えるためのキットを作っていた。そして現在、デイヴ氏は、技術的なバックグラウンドを持たない人でも機械学習モデルの構築とトレーニングができる、ノーコードのAI / MLプラットフォーム「Obviously AI(オビアスリー・エーアイ)」の最高経営責任者を務めている。バークレーに拠点を置くこの会社は、シードエクステンションを行い、ラウンドの総額は2カ月前に発表した360万ドル(約4億円)から470万ドル(約5億2000万円)となった。このエクステンションは、ディープテック分野の投資会社である東京大学エッジ・キャピタル・パートナーズ(UTEC)が主導し、Trail Mix Ventures(トレイル・ミックス・ベンチャーズ)とB-Capital(Bキャピタル)が参加した。

UTECのプリンシパルであるKiran Mysore(キラン・マイソール)氏は、AI / MLやコーディングのバックグラウンドを持たない友人が機械学習モデルを構築するのを手伝っていたときに、Product Hunt(プロダクト・ハント)でObviously AIを見つけたと、TechCrunchに語った。Obviously AIを使用し、他のAutoML製品との比較試験を行った後、マイソール氏は非常に感銘を受け、このスタートアップ企業に連絡を取り、投資ラウンドを主導することになったという。

この1年間、ノーコード / ローコードのスタートアップは多くの注目と、そして資金を集めている。Noogata(ヌーガタ)やAbacus(アバカス)などがその代表例だ。デイヴ氏によると、Obviously AIの適所は、データサイエンスチームを持たない中規模企業、あるいはデータ分析の知識はあってもプログラマーではない人たちのチームだという。

関連記事:企業向けノーコードAIプラットフォームのNoogataがシードラウンドで約13億円を調達

Obviously AIは「Edge-Sharp AutoML」と呼ばれる独自の技術を用いて、顧客のニーズに合わせてカスタマイズされた機械学習モデルを構築・教育し、顧客の既存のクラウドサービスやデータベースに統合することができる。同社では、マーケティング、ソフトウェア、ダイレクト・トゥ・コンシューマー、フィンテック、保険会社といった分野を中心に、現在3000社以上の顧客を持っており、Obviously AIのモデルにホストされた8万2000以上の予測モデルが、これらの顧客企業で使われている。

新たに追加調達した今回のシード資金は、アジア市場における事業拡大のために使用される。特に日本では、同社の顧客である国内最大級の印刷会社の大日本印刷(DNP)と提携し、市場開拓戦略を進めていく予定だ。

大日本印刷の研究開発マネージャーである下村剛哉氏は、TechCrunchにメールで次のように語った。「大日本印刷では、マーケティングや営業のための最先端の予測分析が非常に重要です。しかし、現在のツールは非常に複雑で、結果が出るまでに数カ月かかります。我々はObviously AIを使うことで、何人かのアナリストをシームレスに起用することができ、わずか数時間で稼働させることができました」。

デイヴ氏が、Obviously AIの共同設立者で最高技術責任者を務めるTapojit Debnath(タポジット・デブナット)氏と出会ったのは、2人ともハンプシャーカレッジの留学生だった頃のことだ。卒業後、2人はベイエリアのスタートアップ企業でインターンシップを始めた。デイヴ氏は、ライブストリーミング・ソフトウェア・プラットフォームを提供するStreamlabs(ストリームラボ)で、データサイエンスのインターンをしていた。

もともとビデオエンコーディングのアルゴリズムを担当するために採用されたデイヴ氏は、会社のマーケティングやセールスチームのために、機械学習モデルの構築にも多くの時間を費やした。小売業向けソフトウェアのスタートアップ企業であるb8ta(ベータ)で機械学習のインターンをしていたデブナット氏も同様の経験をしていた。

2人は、機械学習エンジニアの人材が不足しており、多くの企業が「市民データアナリスト」、つまりデータサイエンスを理解していてもコーディングの経験がない人に頼っているということに気づいた。

Obviously AIの機械学習モデルによるリポートのユーザーインターフェース(画像クレジット:Obviously AI)

「膨大なデータを扱う仕事をしているけれど、自分自身はプログラマーではない人たちがいます。そのような人たちのために、私たちはこのツールを開発しました。その目標は、データを理解し、そのデータを用いて、何時間も何日も待たずに、ソフトウェアを使って本当に速くモデルを構築できるようにすることです」と、デイヴ氏は語っている。

同氏とデブナット氏は、2018年に仕事を辞めてこのスタートアップに取り組み始めた。家賃代わりにAirbnb(エアビーアンドビー)ホストのために雑用をこなしながら、カリフォルニア大学バークレー校のSkyDeck(スカイデック)アクセラレータプログラムに参加し、投資家への売り込み方を学んだ。

デイヴ氏によれば、多くの自動AI / MLソフトウェアプラットフォームは「データセット上でたくさんの異なるアルゴリズムを総当りで実行し、最もパフォーマンスが高いものを選ぶ」という。例えば、100種類のアルゴリズムを実行してから最もパフォーマンスの高いものを選んだりするわけだが、これでは他のアルゴリズムを自動的に構築するのに費やした時間が無駄になってしまう。

Obviously AIのEdge-Sharp AutoMLが異なる点は、データセットに使用できる特定の機械学習モデル群を調べてから、顧客のニーズに合った上位5つのモデルを自動的に候補として挙げ、それらのハイパーパラメータを自動的にチューニングし、予測結果を返すところだ。

Obviously AIの料金プランは、月額75ドル(約8300円)からとなっている。同社の典型的な顧客は、データサイエンスのチームを持たない中規模企業や、あるいはデータサイエンティストが他の仕事に没頭している大企業の小規模なチームだ。

例えば、インドの小規模な小口金融会社では、15人ほどのチームが、どの申請者に融資をするかを手作業で決めていたが、これをAIモデルに切り替えることに決めた。彼らはObviously AIを使って、申請者が債務不履行に陥る可能性や、どれくらいの金額を融資すべきかを自動的に予測するようにした。現在、この会社のアプリではエンド・ツー・エンドでObviously AIが使われており、顧客は申し込み後すぐに融資を受けられる可能性のある金額を知ることができる。

もう1つのユースケースとして、ドイツのモバイルゲーム会社では、変動料金制を導入しようとしていたが、個々のユーザーがゲーム内トークンのような商品に、どのくらいの金額を支払おうとするかを把握する必要があった。彼らはObviously AIを使って、プレイヤーのゲームへの参加状況からそれを予測している。

Obviously AIが調達したシード資金の一部は、より多くのユースケースに対応するために、機械学習の研究開発に使用される予定だ。デイヴ氏によるとObviously AIは、顧客がデータを持っていて、何を予測すべきかがわかっている教師あり学習のユースケースに焦点を当てているという。一方、教師なし学習のユースケースは、顧客がデータセットを持っているが、何を求めているのか正確にはわからない場合で、機械学習モデルを使って、データに興味深いパターンがあるかどうかを判断するものだ。教師なし学習のアルゴリズムは、eコマース・プラットフォームにおける自動分類やレコメンドエンジンなどに使われる。

関連記事
グーグルのAirTable対抗ワークトラッキングツール「Tables」がベータを卒業、Google Cloud追加へ
データ専門家でなくてもプロダクトアナリティクスをよりアクセシブルにするJune
マイクロソフトはGPT-3を使い自然言語でコードを書けるようにする
誰でも簡単にAI分析が使えるSaaS「datagusto」が8500万円を調達、創業者「自動調理器のようなツール」

カテゴリー:人工知能・AI
タグ:Obviously AIノーコード資金調達機械学習大日本印刷(DNP)

画像クレジット:Obviously AI

原文へ

(文:Catherine Shu、翻訳:Hirokazu Kusakabe)

GitHubがコーディングの提案を行う新しいAIツールをプレビュー

GitHub(ギットハブ)が、人工知能を活用してコードをより効率的に書けるようにする新製品を発表した。「GitHub Copilot(ギットハブ・コパイロット)」と名付けられたこの新製品は、コードの一部や、ときには関数全体さえも提案することができる。

GitHubはOpenAI(オープンAI)と提携してこのツールを開発した。これは開発者に取って代わるようなものではなく、生産性を向上させ、コードの書き方を簡単に学べるようにするためのツールに過ぎない。GitHubはこの新しいツールを「AIペアプログラマー」と位置づけている。

GitHub Copilotのモデルは、何十億行ものコードを使って訓練を受けた。その多くはGitHub自身によってホストされ公開されているものだ。コードを書き進めていくと、その途中でGitHub Copilotがコードを提案してくる。プログラマーはそうした提案を眺めながら、受け入れたり、拒否したりすることができる。

GitHub Copilot は、プログラマーが現在何をコーディングしているのかを理解するために、コメントの意味や書いている関数の名前、そこまでの数行のコードの解析を試みる。そのウェブサイトでは、いくつかのデモが紹介されている。

画像クレジット:GitHub

特に、コメントに平易な英語で機能を記述することで、それを実際のコードに変換することができる。新しい言語を始めようとしている人や、これまでノーコードやローコードのツールを使っていた人には、この機能は便利だろう。

毎日コードを書いているなら、新しいフレームワークやライブラリに、GitHub Copilotを使って取り組むことができる。GitHub Copilot は、現在使用しているフレームワークの特定の関数や機能をすでに知っているので、プログラマーはドキュメントを最初から最後まで読む必要はない。また、Stack Overflowに対する質問の多くを置き換えることができるだろう。

GitHub Copilotは、Visual Studio Codeと直接統合される。拡張機能としてインストールすることも、GitHub Codespaces(GitHubコードスペース)を使ってクラウド内で利用することもできる。GitHub Copilotとの対話履歴に基づいて、徐々にサービスは改善されていくだろう。提案を受け入れたり拒否したりを繰り返すうちに、その提案は良くなっていくはずだ。

現在はテクニカルプレビューとして提供されているが、GitHubはGitHub Copilotをベースにした商用製品の発売を予定している。現在は、Python、JavaScript、TypeScript、Ruby、Goとの相性が抜群だ。

画像クレジット:GitHub

カテゴリー:人工知能・AI
タグ:GitHubOpenAIコーディング

画像クレジット:James Harrison / Unsplash

原文へ

(文: Romain Dillet、翻訳:sako)

【コラム】深層強化学習は私たちが知る製造業を変革する

編集部注:Chris Nicholson(クリス・ニコルソン)氏は、深層強化学習を産業オペレーションとサプライチェーンに適用する企業であるPathmindの創業者兼CEO。

ーーー

通りを歩きながら、目に入るものすべての名前を大声で叫んでみたとしよう。「ごみ収集車!」「競輪選手!」「プラタナスの木!」  多くの人は、そんなあなたを特に賢いとは思わないだろう。一方で、例えば障害物コースを通るときに、一連の障害をうまく切り抜けて無傷で最後までたどり着く方法を示したなら、人々の評価は変わってくるはずだ。

ほとんどの機械学習アルゴリズムは、街中で名前を連呼するようなものである。人間が1秒たらずで行えるような知覚的な作業を実行する。しかし、もう1つのAIである「深層強化学習」は、戦略的なものだ。目標を達成するための一連のアクションを実行する方法を学習する。これはパワフルかつスマートな手法であり、多くの業界を変革しようとしている。

AIトランスフォーメーションの最前線にある2つの業界は、製造とサプライチェーンだ。物を作り、出荷する方法は、協働する機械群に大きく依存しており、その機械の効率性とレジリエンスは、経済と社会の基盤となっている。それがないと、生活や仕事に必要な基本的な物を手に入れることができなくなる。

CovariantOcado傘下のKindredBright Machinesなどのスタートアップは、機械学習と強化学習を用いて工場や倉庫での機械の制御方法を改変し、ロボットにさまざまな大きさや形の物体をビンの中から検出して拾わせるなど、極めて難易度の高い課題を解決している。これらの企業はまさに巨大な市場に挑んでおり、2020年には産業用制御および自動化市場は1520億ドル(約16兆7530億円)、物流自動化市場は500億ドル(約5兆5110億円)を超える価値を示した。

技術者としては、深層強化学習を機能させるには多くのことを行う必要がある。最初に考えるべきことは、どのようにして深層強化学習エージェントに、求めるスキルを実践させるかだ。これには、実際のデータを活用する方法と、シミュレーションを使用する方法の2つの手法のみ存在する。各アプローチにはそれぞれ独自の課題がある。データは収集して整理する必要があり、シミュレーションは構築して検証することが求められる。

いくつかの例を挙げて、これが何を意味するかを示そう。2016年、Google Xはロボットの「Arm Farm」を公開した。モノをつかむことを学び、他者にも同じことを教える、複数のロボットアームで満たされた空間である。これは、強化学習アルゴリズムが実際の環境で動きを練習し、動作の成功を測定するための初期の方法の1つだった。このフィードバックループは、目標指向アルゴリズムの学習に欠かせないものである。つまり、連続的な決定を行い、その決定が導く対象を把握することが必要だ。

多くの場合、強化学習アルゴリズムが学習できる物理環境を構築することは現実的ではない。複数の工場から数多くの小売店に商品を輸送する数千台のトラック群をルーティングするための、異なる戦略をテストすることを想定しよう。可能なすべての戦略をテストするには莫大な費用がかかるだけでなく、実行に失敗した場合、多くの顧客に不利益をもたらしかねない。

多くの大規模システムにとって、最適なアクションパスを見つける唯一の方法はシミュレーションを使用することである。その際、データ強化学習のニーズを生成するために、理解したい物理システムのデジタルモデルを作成する必要がある。これらのモデルは、デジタルツイン、シミュレーション、強化学習環境とも呼ばれるものだ。これらはすべて、製造とサプライチェーンの用途において、本質的に同じことを意味する。

物理システムを再作成するには、システムの動作を理解しているドメインエキスパートが必要である。このことは、単一のフルフィルメントセンターのような小規模システムでは困難な課題となり得る。というのも、システムを構築した人々が退職していたり、あるいは亡くなっている可能性があり、後継者はシステムの運用方法は習得しているものの、再構築は行っていないからだ。

多くのシミュレーションソフトウェアツールは、ドメインエキスパートによる物理システムのデジタルモデル作成を可能にする、ローコードのインターフェイスを提供する。ドメインの専門知識とソフトウェアエンジニアリングのスキルを同じ人物が兼ね備えることは難しいため、これは重要である。

なぜ1つのアルゴリズムにこれほどの労力がかかるのだろうか。つまるところ、深層強化学習は、他の機械学習や最適化ツールでは実現し得ない結果を一貫して生成するからである。DeepMindも当然ながら、囲碁の世界チャンピオンを倒すために深層強化学習を使用した。強化学習は、チェス、タンパク質フォールディング、Atariのゲームにおいて、画期的な成果を達成するために不可欠なアルゴリズムの一部となった。同様に、OpenAIは「Dota 2」で、最高水準の人間チームに勝利するための深層強化学習を訓練した。

Geoffrey Hinton(ジェフリー・ヒントン)氏がGoogleに、Yann LeCun(ヤン・ルカン)氏がFacebookに入社した後の2010年代半ばに、深層人工ニューラルネットワークがビジネス用途を開拓し始めたように、深層強化学習も業界に大きな影響を与えるようになるだろう。囲碁で見たのと同じように、ロボットの自動化とシステム制御の飛躍的な向上がもたらされ、我々の持っている中で最高の、しかも他と大きくかけ離れたものになることが大いに期待される。

その恩恵を受けて、製品の製造とサプライチェーンの運用における効率性とコスト削減が大幅に促進され、炭素排出量と労働災害の低減につながっていくだろう。明らかに物理的世界の難問や課題は、我々の周りに存在している。2020年だけでも、新型コロナウイルス(COVID-19)、ロックダウン、スエズ運河の崩壊、異常気象によって、社会は複数のサプライチェーンの混乱に見舞われた。

新型コロナに着目すると、ワクチンが開発され承認された後も、多くの国でその製造や迅速な供給が困難になっている。これらは、過去のデータでは対応できない製造やサプライチェーンの問題だ。何が起こるかを予測するシミュレーションと、危機が発生したときに最善の方法で対処するためのシミュレーションが必要だったと、Michael Lewis(マイケル・ルイス)氏は最近の著書「The Premonition」の中で指摘している。

まさにこのような、工場やサプライチェーンで発生する制約と新たな課題の組み合わせにこそ、強化学習とシミュレーションがより迅速な解決をもたらすのである。そして、我々は将来、その数々のブレイクスルーを目にすることになるだろう。

関連記事
宇宙船や先進的製造の未来をより良くより早く実現する工場を建設するHadrian
新しいコンセプトのロボティクスに挑むRapid Roboticsが13.2億円調達
製造業を立て直すために米国は中小企業技術革新研究プログラムを強化せよ

カテゴリー:人工知能・AI
タグ:機械学習深層学習強化学習コラム製造業サプライチェーン

画像クレジット:rozdemir01 / Getty Images

原文へ

(文:Chris Nicholson、翻訳:Dragonfly)

ウォールマートのグローサリー配達用AIがより賢くなっている

新型コロナウイルスによるパンデミックが買い物方法、特にグローサリーの買い方を変えたのは驚きではない。グローサリー配達アプリのダウンロード数は2020年3月に過去最多を記録し、同年4月にはWalmart Grocery(いまはWalmartアプリに統合されている)がAmazon(アマゾン)を抑えてGoogle PlayとApp Storeの買い物アプリランキングで1位になった。しかしパンデミックによる規制が緩和されても、消費者はまだグローサリー配達やピックアップのサービスをパンデミック前よりも頻繁に使っている。

関連記事:ウォルマートのグローサリーアプリのダウンロードが新型コロナで過去最多に

Walmartのグローサリー配達サービスは引き続き人気を博していて、これはAmazonやInstacartのような企業にとっては競争となり、それにともないWalmartが使うテックも拡大してきた。Walmartは米国時間6月24日、オンライングローサリー注文で賢く代替品を提案するためにどのようにAIを訓練しているかについて情報を共有した。

AIをグローサリー配達に持ってくるのはまったく目新しいことではない。2020年5月にWalmartは当時新しく導入したExpress配達サービスのための適格性を決定するためにどのようにAIを使っているかを披露した。米国が新型コロナ感染拡大に見舞われていた1年間、Instacartのエンジニアは「何がグローサリーの棚にあるか、そして駐車場を探すのにどれくらい時間がかかるのかといったことまで予測するために毎日膨大な量の情報」を処理したと報告している

では、Walmartのグローサリー代替品のためのAIをユニークなものにしているのは何なのか。Walmart Global TechのエグゼクティブバイスプレジデントSrini Venkatesan(スリニ・ヴェンカテサン)氏によると、WalmartがAIに教えるのに使うことができるデータの量は膨大なものだ。毎週2億人がWalmartの店舗とオンラインで15万を超える種類のグローサリー製品を買っている。AIはそのデータを消費者行動、好み、需要を予測するのに使っている。

「我々が構築したテックは、次に入手可能な最適のアイテムを決めるために、サイズやタイプ、ブランド、価格、買い物客の集計データ、各顧客の好み、現在の在庫など何百もの変数をリアルタイムに考慮するのに深層学習AIを使っています」とヴェンカテサン氏は説明した。「AIはあらかじめ顧客に代替品を認めるよう、あるいは欲しくないとの意思表示を示すよう尋ねます。これは将来のレコメンデーションの精度を高めるために学習アルゴリズムにフィードバックする重要なシグナルです」。

チェリーヨーグルトの代替品について即断するために(同じブランドの違う味でもいいか、あるいはより高価なブランドから出ている同じ味のものを確保するか)、Personal Shopperに聞くのではなくAIが判断する。Walmartはこのアルゴリズムの開発を2020年開始し、以来、顧客の代替品受け入れは改善した。

「アルゴリズムを導入する前はおおよそ90%でした。しかし今では97〜98%ほどです」とヴェンカテサン氏は話した。

2020年WalmartはPersonal Shoppersの数を17万人超に倍増させた。3750店舗が注文品のピックアップに、3000店が配達に対応していて、これは人口の68%をカバーしている。2021年初め、WalmartはAmazonのPrime Nowと競合するExpress配達サービスの買い物額35ドル(約3900円)以上という縛りを撤廃した。

関連記事
ウォルマートが(誤って予定より早く)低価格FHDストリーミングスティックと4Kプレイヤーを公開
ウォルマートがAIやコンピュータービジョンを駆使したバーチャル試着のZeekitを買収
植物由来代替肉のビヨンド・ミート株が急騰、ウォルマートでの扱い増加で

カテゴリー:人工知能・AI
タグ:Walmartアプリ深層学習グローサリー配送

画像クレジット:Walmart

原文へ

(文:Amanda Silberling、翻訳:Nariko Mizoguchi

NVIDIAのAIペイントソフト「Canvas」はいたずら書きを瞬時にリアルな風景に変える

ここ数年、AI(人工知能)はイラストレーターとフォトグラファーのギャップを埋めてきた。文字通り、ビジュアルコンテンツのギャップを巧みに埋める。しかしこの最新ツールは、作品の最初期段階、つまり白紙のキャンバス状態からAIがアーティストに手を貸すことを目標にしている。

それぞれの色が異なる対象物を表す。山、水、草木、廃墟などだ。キャンバスに絵を描くと、荒削りなスケッチが敵対的生成ネットワーク(GAN)に送られる。GANは、(この場合は)リアリスティックな画像を作ろうとするクリエイターAIと、その画像がどれほどリアリスティックかを評価するディテクターAIの間でコンテンツを行き来させる。この共同作業によって、提案された画像のそこそこリアリスティックな解釈と考えられるものが作られる。

これは、2019年のCVPR(Computer Vision and Pattern Recognition)学会で発表されたプロトタイプ、GauGAN(ゴーギャン?)のユーザーフレンドリーバージョンといえるだろう。エッジ周りがよりスムーズになり、生成される画像も向上し、対応するNVIDIAグラフィクスカードを備えたどのWindowsパソコンでも使える。

関連記事:スケッチを数秒でリアルな写真に変えるNVIDIAのAI

この手法は、非常にリアリスティックな顔や動物、景色などを作るために使用されているが、人間にはわかる何らかの「違い」があるのが普通だ。しかし、このCanvas(キャンバス)アプリは現実と区別がつかないものを作ろうとはしていない。コンセプトアーティストのJama Jurabaev(ジャマ・ユラバエ)氏がビデオで説明しているように、いたずら書きよりも詳細な画像で自由に実験できることがこのアプリの狙いだ。

 

例えば片側に川が流れている草原の朽ち果てた廃墟を鉛筆で手早く描いたスケッチは、最終作品がどう見えるかをそこそこしか表せない。もし頭の中で描いたイメージがあり、その後2時間かけて作画して色をつけた後、太陽は絵の左側に沈んでいくので前景の影がどうにも落ち着かないことに気がついたとしたらどうだろうか。

もし代わりに、これらの要素を簡単な走り書きにしてCavasに渡せば、そうなることが即座に把握でき、次のアイデアに移ることができる。時刻やパレットやその他高度なパラメータも簡単に変えられるので、それぞれの場合をすばやく評価することができる。

画像クレジット:NVIDIA

「もう白いキャンバスが怖くなくなりました」とユラバエ氏は言った。「大きな変更も怖くありません、細部は常にAIが助けてくれることがわかっているので、自分はクリエイティブ面に全力を集中し、あとはCanvasに任せられるからです。

これはGoogle(グーグル)のChimera Painter(キマイラ・ペインター)と非常によく似ている。あの不気味な画像を覚えているなら、そこではほとんど同じプロセスを使って想像上の動物が作られていた。雪と岩と茂みの代わりに、後ろ足と毛皮と歯などがある。使い方はより複雑で間違いも起こりやすい。

画像クレジット:Devin Coldewey / Google

それでも普通のペイントアプリで不気味な円筒形の動物すら描いたことのない私のようなアマチュアにとって、優れたツールであることは間違いないだろう。

キマイラ・ペインターとは異なり、Canvasはローカルで動作し、NVIDIAの強力なビデオカードが必要だ。GPUが機械学習アプリケーションの推奨ハードウェアになって久しいが、リアルタイムGANのようなものには、間違いなく超強力バージョンが必要だろう。Canvsアプリはここから無料でダウンロードできる

関連記事:Googleが機械学習を利用した悪夢のような「怪物ジェネレーター」を開発

カテゴリー:人工知能・AI
タグ:NVIDIA機械学習

画像クレジット:NVIDIA

原文へ

(文:Devin Coldewey、翻訳:Nob Takahashi / facebook

データ分析の力で意志決定を行う経営層をDXする「Hogetic Lab」が5000万円を調達

データ分析の力で意志決定を行う経営層をDXする「Hogetic Lab」が5000万円を調達

「データの力で経営を再発明する」をミッションとするデータ分析スタートアップHogetic Lab(ホゲティックラボ)は6月23日、第三者割当増資と融資による総額5000万円の資金調達を発表した。引受先は独立系ベンチャーキャピタルmintで、借入先は日本政策金融公庫。

新型コロナウイルスの影響で、マーケティング、セールス、業務などの自動化といったDXを推進する企業が増えたものの、「こうしたDXへの取り組みは進む一方で、旧来より変化していないものがあります。それが”経営”です」とHogetic Labは話す。多くの企業では、経営のための意志決定は経営者などの直感に頼っていて、意志決定の過程と結果の蓄積がない。「そのため会社経営そのものは、実はそこまで進化していないと当社では考えています」という。それは、ディー・エヌ・エーの分析組織に在籍していた大竹諒氏(代表取締役CEO)と、白石裕人氏(取締役COO)がHogetic Labを共同創設した動機にもなっている。

Hogetic Labは、事業に関わるデータを集める分析基盤を高速・低価格で構築できるDCaaS(サービスとしてのデータ収集)「Collectro」(コレクトロ)、意志決定を行う経営層のデータリテラシーを飛躍的に向上させるサービス「BizSchola」(ビズスカラ)、収集データを経営に組み込み意志決定につなげるAIアルゴリズムモジュールを提供するサービス「Factolithm」(ファクトリズム)という3つのサービスを提供している。これらを連携することで企業のデータ利活用水準を向上させるという。「CollectroとBizScholaによって、あっという間にデータ分析ができる社内環境を整え、組織にデータ分析がフィットするまで我々が粘り強く並走します」とのことだ。

今回調達した資金は、Collectroのプロダクト開発とデータ分析に関わる社内体制の強化に利用される。

関連記事
Shopify特化型グロースプラットフォームを手がける「StoreHero」が5000万円を調達
heyが実店舗とネットショップの商品・在庫・売上データを自動で同期・一元管理できるPOSレジアプリ「STORES レジ」公開
セゾン・ベンチャーズとライトアップが中小企業DXを促進するスタートアップに出資・営業支援
Beyond Next Venturesが日本初の研究領域対象「起業版サーチファンド」開始

カテゴリー:人工知能・AI
タグ:AI / 人工知能(用語)経営 / マネジメント(用語)データ分析(用語)Hogetic Lab(企業)資金調達(用語)日本(国・地域)