スマホ活用・画像解析AIによるイチゴの高精度生育解析の検証実験結果をキヤノンITSが報告

キヤノンITソリューションズ(キヤノンITS)は5月26日、令和元年度から令和2年度にかけて実施したスマート農業技術の開発・実証プロジェクト「阿蘇イチゴスマート農業実証コンソーシアム」(農研機構九州沖縄農業研究センター)の検証実験結果を公開した。

今回の実証実験でキヤノンITSは、映像情報から現在までのイチゴの生育状況を数値化および未来の収穫量を予測する「イチゴ生育画像解析システム」と、遠隔業務支援サービス「VisualBrain」により、スマートフォンと画像情報を用いたイチゴの花数・果実熟度・葉面積の「生育特徴量計測技術」の実証実験を行った。生育特徴量計測技術は、イチゴの生育画像からAIが花の数や果実の⽣育ステージなどを自動判別し、生育状況の指標として定量化するものという。

実証実験では、九州沖縄農業研究センター内のイチゴ品種「恋みのり」「さがほのか」の生育状況をスマートフォンで一定期間にわたり撮影し、解析に適した高精細かつ定点の画像データを収集。そしてイチゴ生育画像解析システムを使った画像解析で得られたデータを「VisualBrain」を通じてクラウドシステムに蓄積し、遠隔から現地の映像や解析結果を閲覧できる環境を構築した。

そしてスマートフォンでの簡易な生育解析として実証したところ、2品種の花数・果実熟度・葉面積の生育特徴量の自動計測精度が90%以上を達成。これにより、スマートフォンのカメラ機能を使い初期費用を抑えた生育解析や、高精度な生育解析が可能だと確認している。

またキヤノンITSは、農林水産省委託事業「令和3年度スマート農業技術の開発・実証プロジェクト」にも採択されており、次回のプロジェクト「阿蘇イチゴ輸出スマート農業実証コンソーシアム」(課題番号:21451798)ではイチゴ生育画像解析システムおよび「VisualBrain」を活用したスマートフォンによる生育計測から収量予測、農業熟練者による映像共有を活用した遠隔指導や農作物のリモート審査の実証実験を開始する予定だ。

キヤノンITSは、2015年よりカメラとAIを活用したスマート農業技術の研究開発に取り組んでおり、イチゴ栽培において、花や実の数、葉の大きさ・色などの生育情報をICT技術を用いて数値化するAIを開発したという。さらにこの情報に温度や湿度などの環境データを組み合わせることで、マルチモーダルな情報をもとにした収穫量予測AIの開発に取り組んでいるとした。

関連記事
「宇宙ビッグデータ米」が2021年中に販売予定、宇宙領域の天地人・農業IoTの笑農和・米卸の神明が栽培着手
「ニューヨークのイチゴはまずい」植物工場で作った日本品質のイチゴを世界に届けるOishii Farmが総額55億円を調達
果菜類の植物工場および完全自動栽培の実現を目指すHarvestXが5000万円を調達
米の銘柄判定をAI搭載スマホアプリで実現する「RiceTagプロジェクト」の実証実験が成功
産業用リモートセンシングのスカイマティクスが日本初のAI米粒等級解析アプリ「らいす」公開

カテゴリー:人工知能・AI
タグ:AI / 人工知能(用語)キヤノンITソリューションズ(企業)食品(用語)農業 / アグリテック(用語)日本(国・地域)

OpenAIの約109億円スタートアップファンドはマイクロソフトがパートナー

OpenAIが、スタートアップを対象とする1億ドル(約109億円)のファンドを立ち上げる。OpenAI Startup Fundと呼ばれ、これによりファンドとそのパートナーたちは、重要な問題および生産性の問題に挑戦している初期段階のAI企業に投資する。パートナーとファンドの投資家たちにはMicrosoftがおり、BuildカンファレンスではOpenAIの創立者である元Y CombinatorのSam Altman(サム・アルトマン)氏がこのニュースを発表した。

め録画されたビデオの中でアルトマン氏は「これは、よくあるような企業のベンチャーファンドではありません。私たちは、10社を超えない少数の企業に大きな投資をしていきたいと計画しています」と説明している。

1億ドルがどのように分割・分配されるのか、どのようなスケジュールで行われるのか、また、これがより長期的なプログラムの一部なのかなど、明らかになっていない。しかし、2021年のラウンドに限らず、限定的な資金であることは間違いなさそうだ。

アルトマン氏は、OpenAIのミッションステートメントに沿って、AIを活用したアプリケーションやアプローチが「人類全体に利益をもたらす」ようなヘルスケア、気候変動、教育といった深刻な問題に取り組んでいる企業を探していくと述べた。また、Microsoftが先に発表したGPT-3を利用した自然言語処理のように、生産性の向上も考慮するとしている。

MicrosoftのCTOであるKevin Scott(ケビン・スコット)氏は、Buildカンファレンスのキーノートで次のように述べている。「GPT-3のような強力なツールを使って、世界に貢献するような意欲的なアプリケーションを作ることができるのは、デベロッパーであるみなさんだ。Microsoftがこのファンドをサポートできることには、とても感激している」。

投資対象に選ばれた企業は新しいOpenAIのシステムへのアーリーアクセスとMicrosoftのAzureのリソースを使えるようになり、より本格的な研究開発ができる。OpenAIは、投資対象企業の所有権や、スタートアップに求める要件、その他の出資パートナーの参加など、詳細を明らかにしていない。現在、決まっているのは1億ドルという数字だけということもありうる。

申請はとても簡単であり、非常に多くの申請件数を期待しているのかもしれないが、自身の企業をこの渦中に投じたい人は、まずエレベーターピッチの準備から始めよう。申請には1分間の動画も必要だが、デモや音楽やエフェクトは不要だ。OpenAIがまだその詳細を明らかにしていない審査員たちにとって、それを見ることが審査の最初のふるいになるだろう。Zoomの背景は、まだ外さない方が良さそうだ。

関連記事

マイクロソフトのブラウザ「Edge」は起動が速くなりタブがスリープする機能も搭載する
マイクロソフトはGPT-3を使い自然言語でコードを書けるようにする
マイクロソフトが今や1日に1億4500万人が利用するTeamsの開発者向け新機能やツールを発表
マイクロソフトのナデラCEOがBuild 2021で「自らテストしてきた」次世代Windowsに言及
Microsoft AzureがPyson向け機械学習プラットフォーム「PyTorch」のエンタープライズサポートを提供

カテゴリー:人工知能・AI
タグ:MicrosoftMicrosoft BuildMicrosoft Build 2021OpenAI

画像クレジット:OpenAI

原文へ

(文:Devin Coldewey、翻訳:Hiroshi Iwatani)

【コラム】欧州のAIに必要なのは過剰な規制ではなく、戦略的なリーダーシップだ

編集部注:本稿の著者Mark Minevich(マーク・ミネビッチ)氏はGoing Global Venturesの社長であり、Boston Consulting Groupのアドバイザー、IPsoftのデジタルフェロー。また世界的なAIの専門家で、デジタルコグニティブストラテジスト、ベンチャーキャピタリストでもある。

ーーー

EU委員会は最近、緊急の必要性があるとして、AIを規制するための新たな厳格なルールを提案した。AI規制の世界的な競争が正式に始まる中、EUはAIの規制方法についての詳細な提案を発表している。AIの一部の使用を明確に禁止し「高リスク」とみなされる事柄を定義し、人々の権利や安全を脅かすAIの使用を禁止する計画だ。

欧州委員会のMargrethe Vestager(マルグレーテ・ベステアー)副委員長が「人工知能に関しては、信頼はあったらいいなというものではなく、なくてはならないものです」と述べた心情には誰もが同意できるものだが、信頼を確保するための最も効果的かつ効率的な方法は規制なのだろうか。

委員会ではかなり深い見識が得られたが、私が最も同意できたことは、規制されたAIの目指すところは人間の幸福度を高めることであるべきだという主張だ。しかし、規制によってAIシステムの実験や開発を過度に制約するべきではない。

高リスクのAIシステムは、常に変更不可能な人間による監視・制御メカニズムを内蔵すべきである。人との対話やコンテンツの生成を目的としたAIシステムは、高リスクであるか否かに関わらず、特定の透明性の義務を負うべきである。また、公的にアクセス可能な場所に設置されるAIベースの遠隔生体認証システムは、EUまたは加盟国の法律によって認可されたものでなければならず、重大な犯罪やテロの防止、検知、調査の目的に資するものでなければならない。

AIと人類のパートナーシップ

欧州で制定された一連の法律と法的枠組みは、過去10年間にGDPR規制が生み出した効果と同様に、世界中のAI規制に大きな影響を与えることだろう。しかしこれらの法律は、EU全体の行き当たりばったりの規制方法から、単一で共通の分類への移行をサポートするものになるのだろうか?

私は、中国や米国が躍進する一方で、EUのAI開発はこの規制により廃れてしまうと考えている。人工知能のユースケースやイノベーションが制限され、EUは世界的に技術的に劣位に置かれることになるだろう。米国では、企業の収益性と効率性を最大化するためにAIが最適化されている。中国では、政府が権力を維持して国民を最大限支配するために、AIが最適化されている。EUの過剰な規制環境は、EUのさまざまな機関での規制が矛盾し始めると、完全なカオスに陥るだろう。

EUの企業家精神への悪影響

EUが米国や中国にAI競争で負けているのは、EUにおけるAIへの投資不足が大きな要因だ。現在、EUの居住者数は約4億4600万人、米国の居住者数は約3億3100万人だが、EUの2020年のAIへの投資額は20億ドル(約2178億8100万円)だったのに対し、米国の投資額は236億ドル(2兆5710万円)だった。

もしEUが積極的な規制と資金不足を推し進めれば、EUはAI規制において世界的なリーダーシップを享受することにはなるが、多くのヨーロッパの起業家が、よりAIに優しい国でスタートアップ企業を立ち上げるようになってもおかしくない。

イノベーションや起業家に優しいEUを実現するためには、AIのパイオニアが先導する共同ネットワークを作る必要がある。

一方、他の国々は、EUが厳格な規制を推し進めていることを利用して、イノベーションを促進し、世界のテクノロジーの未来をよりしっかりと作り出すだろう。最近の世界銀行の報告書によると、2019年にデータコンプライアンスに関する調査を開始したのは、北米ではわずか12%だったのに対し、EUでは38%だったという。企業にとってこれほどまでに厳しく厄介な負担を強いる政策では、イノベーターや起業家たちが世界でよりビジネスに適した地域に移動し始めても不思議ではない。

規制は降格を招く

今回の規制案では、違反した場合、最大2000万ユーロ(約26億6100万円)、またはAIプロバイダーの年間総売上高の最大4%の罰金が科せられることになっている。これまでのEUの法律とその後のデジタルイノベーションの欠如を考慮すると、この規制案はEU圏におけるデジタルイノベーションと導入の慢性的な停滞を引き起こすだろう。

つまり、これらの規制が法制化されれば、EUはパイオニアになるどころか、ラガードになってしまうのではないだろうか。AIの真の可能性を明らかにする「本当の」ユースケースはまだ登場していない。リスクの高いユースケースに対する大規模な官僚主義は、起業家精神やボトムアップのイノベーションの努力を削ぐことになるだろう。歴史的に見てもEUは不況に向かっている傾向にあり、今はイノベーションを阻害する時ではない。

グローバルAIに人間の顔を持たせ、その価値を示すべき

AIが広く受け入れられるためには、AIが人々の問題や課題の解決に役立つということを示す人間の顔が必要だ。私たちは、事実に基づいた魅力的なストーリーを強調し、その背後にいる実在の人物を見せなければならない。国民全体がAIの可能性を受け入れるためには、自分たちと同じような人がAIの良さの恩恵を受けている姿を目にする必要があるのだ。

AIの資金調達とは、何よりもまずスタートアップ企業の資金調達のことを指す。スタートアップ企業は、破壊的技術の発見や開発と、一般の人々による日常的な使用の橋渡しをする。欧州ではすでにかなりの計画が立っているが、これを加速させなければならない。

欧州のベンチャーキャピタルは、米国のモデルに比べて遅れている。急成長しているスタートアップ企業は、ほとんどが米国やアジアの投資家に依存している。そのためには、機関投資家側の投資制限の緩和など、投資文化を再考し、ダイナミックな投資環境を賢明に推進する必要がある。

今、私たちは「ムーンショット」の時代に生きている。起業家や科学者がこれまで以上に前進することができる時代だ。次の経済で競争するためには、イノベーションを10倍にすることを目標とした新しいイノベーションに挑戦する必要がある。

このレベルに到達するためには、段階的な最適化は役に立たない。大きなイノベーション、つまりムーンショットに焦点を当てる必要がある。リスクを取ることが許容され、大規模でリスクのあるアイデアを実行することが普通になるべきだ。

イノベーションと起業家に優しいEUを作るためには、AIの先駆者たちが先導する協力的なネットワークを作らなければならない。起業家やデータサイエンスのリーダーたちは、長期的な視点で世界を良くするためのAI for good(社会貢献のためのAI)に注力し、規制緩和を提唱しなければならない。そのためには、主要な研究機関、企業、公共部門、市民社会からの参加者で構成される「社会貢献のためのAI」に関するグローバルなAIパイオニア協議会を設立し、ベストプラクティスについての共通理解を深める必要がある。

AIはもはや、企業システムや社会インフラを最適化するためのツールではなく、その可能性は、気候変動や制御不能なパンデミックなど、人類が直面するさまざまな危機を解決するための広範囲なものとなっている。世界中のすべての超大国において責任あるAI、そして「社会貢献のためのAI」の導入ができれば、これらの危機を解決することができる。

EUが世界の中でイノベーションを阻害し、起業家精神をくじく地域になるわけにはいかない。EUは、過剰な規制ではなく「社会貢献のためのAI」に基づいたAIの戦略的リーダーシップに移行しなければならない。過剰な規制の道は、停滞の深みにつながる。EUの未来をどうしたいかを決めるのは、EU自身にかかっている。

関連記事
欧州がリスクベースのAI規制を提案、AIに対する信頼と理解の醸成を目指す
EUがプロバイダーによるテロ関連コンテンツの1時間以内の削除を法制化

カテゴリー:人工知能・AI
タグ:EU人工知能コラム

画像クレジット:

原文へ

(文:Mark Minevich、翻訳:Dragonfly)

誰でも簡単にAI分析が使えるSaaS「datagusto」が8500万円を調達、創業者「自動調理器のようなツール」

「ドリルを買う人が欲しいのは『穴』である」という格言がある。顧客にとってドリルはあくまでも手段であって、求めるものは穴(結果)ということだ。私たちは、たとえテレビやPC、スマートフォンがどんな仕組みで動いているのかを知らずとも満足に使える。その結果、それらは世界中で数十億人が利用するツールになった。

AIの分野でこれを実現しようとするのが、データを入れるだけで高度なAI分析を行うことができるSaaS型ツール「datagusto(データグスト)」だ。同製品を開発するdatagustoは、2021年5月24日、DEEPCOREEast VenturesゼロワンブースターG-STARTUPからの合計8500万円の資金調達を発表した。

専門知識なしでAIが使える

「これまで企業がAIを活用しようとすると、専門のコンサルタントに依頼したり、データサイエンティストを雇用したりするのが必要で、多大なコストがかかっていました」。そう話すのは、datagustoのCEOであるパー・麻緒氏。「昨今、AIの開発工数を短縮するためのソフトウェアはいろいろ出てきてますが、それらはあくまでもデータサイエンティストのためのツール。専門知識のないビジネスサイドの人間が使いこなすことは難しい」。

この課題を解決するため、ユーザーが専門知識をまったく持たずとも、簡単にAIを使いこなすためのツールがdatagustoだ。パー氏はこれを「具材を入れるだけで料理ができあがる、自動調理器のようなツール」と表現する。同ツールでは、あらかじめパッケージ化された分析テンプレート(同社は「レシピ」と呼ぶ)をクリックすると、誰でも簡単に「何時に荷電すれば受注できるのだろうか?」といった現場の疑問への答えを、データから導出することが可能になる。ユーザーが行うことは、datagustoにより指定されたデータをアップロードすることだけ。

先の例では、荷電時間・受注の有無・荷電先の業種・設立年・荷電担当者など、社内で過去蓄積してきたデータをコピー&ペーストでdatagustoにアップする。あるいは、SalesforceなどのCRMと連携し、自動でのアップロードも今後可能に。AIは、アップロードされた過去のデータから傾向を見出して「○時に荷電するのが最も成功確率が高い」といった形でユーザーに提示する。

datagustoの分析テンプレートは「最適な荷電時間のレコメンド」にとどまらない。「販売個数の予測」「離脱予測」「コンバージョンにつながる見込み客の予測」など、これまで社内に眠ったままだったデータをdatagustoに注入することで、業界や規模を問わず手軽にAI分析を行うことができるようになる。

画像クレジット:datagusto

AIの大衆化を実現する

一方で、datagustoにもトレードオフは存在する。同製品は誰でも簡単に使える分析テンプレートが用意されている反面、他社のAIツールと比較するとカスタマイズできる部分が少ないのだ。しかしパー氏は、その違いこそがdatagustoの強みだと話す。「誰しもが高い自由度や、最高の性能を求めているわけではないと思うんです。例えば他社のAIツールは、車でいうとフェラーリ。馬力があって何でもできるんだけど、数千万円も費用がかかって、使いこなすのが大変。一方でdatagustoは、低燃費で使い勝手が良い『AIツール界のプリウス』みたいな存在を目指しています」。

パー氏のdatagusto創業のきっかけは、アパレルバイヤーとして働く友人からの相談だった。当時、大手外資系コンサルティングファームでデータサイエンティストをしていたパー氏は、海外ラグジュアリーブランドのバイヤーを務める友人から、発注数を決める方法について尋ねられたという。「データ分析の専門知識を持たず、ツールもエクセルしか与えられていない友人にとって、その分析を自身の手で行うことは不可能でした」。一方で、毎月数百万円ものフィーが発生するコンサルサービスは、ビジネスの規模として採算が合わない。同氏は「それだったら、誰にとっても低価格で知識がなくても使えるAIツールを自分がつくろう」と考えた。

2020年4月創業のdatagustoは、同年11月にβ版をリリース。すでにリコー大和ライフネクストなどで試験導入されており、ある営業現場ではアポ率を従来の5%未満から、最大20%にまで上昇させることに成功したという。今回の調達資金をもとに製品開発をすすめ、2021年10月に正式版をリリースする予定で、提供価格は1ユーザーあたり年間10万円〜(予定)。従来のAI開発では、数百万から、大規模であれば数千万円規模の開発費用がかかっていたことを考えると、まさに「AIの大衆化」を実現するプロダクトといえるだろう。

「テレアポ1件をAIで効率化して得られる経済的利益は、微々たるものです。でもこれが数百、数千件と積み重なることで、ビジネスを抜本的に変革させる要因にもなり得ます」とパー氏は目を輝かせる。日本中のビジネスパーソンが、マニュアルを読まずともAIによるデータ分析を使いこなして意思決定を行う。彼女が目指すそんな未来の実現も、そう遠くはないかもしれない。

関連記事
企業がサイバー犯罪と戦うためのノーコードプラットフォームを提供するSpecTrustが約4.7億円調達
Salesforceがローコードツールキットにドラッグ&ドロップ式のインタラクティブコンポーネントを導入
自動機械学習のDataRobotがプラットフォームの拡張やZeplの買収を発表
ノーコードでチャットボットを開発可能なKUZENを提供するコンシェルジュがシリーズAで4.5億円を調達

カテゴリー:人工知能・AI
タグ:datagusto資金調達日本ノーコードSaaSデータ分析

ビジネスパーソン向け無料AI講座「AI For Everyone」が開講から約2週間で受講登録者数5000人を突破

ディープラーニングを中心とする技術による日本の産業競争力の向上を目指す日本ディープラーニング協会(JDLA)は5月20日、新講座「AI For Everyone(すべての人のためのAIリテラシー講座)」の受講登録者数が開講から約2週間で5000人を突破したと発表した。

AI For Everyoneは、すべてのビジネスパーソンに向けた、AI・ディープラーニングについて「知る」ための無料(受講のみの場合)エントリー講座だ。AIの基礎を学びたい、所属組織をAIを使いこなせる組織へと変革させたいなど、幅広い層が受講できる内容となっている。

その内容は、DeepLearning.AIが提供し全世界で60万人以上の受講者を誇る人気コース「AI for Everyone」(オリジナルは英語)に、JDLAが制作し東京大学大学院工学系研究科 松尾豊教授が講師をつとめる日本向けコンテンツを加えた特別版となる。講座は約5時間のビデオ方式だ。詳細なシラバスはこちらを参照いただきたい。

講座は、世界最大級のオンライン講座プラットフォーム「Coursera」(コーセラ)にて実施される。受講は無料だが、Coursera発行の受講修了証取得コース(ビデオ講座後に確認テストを実施)の場合には別途Courseraへの49ドル(約5400円)の支払いが必要となる。また、団体受講申込のフォーマットも現在準備中だ。

関連記事
AI理解のためのビジネスパーソン向け無料講座「AI For Everyone」、日本ディープラーニング協会が開講
日本ディープラーニング協会がビジネス活用人材向けG検定で7250名受験・累計合格者数3万人突破と発表
日本ディープラーニング協会が高専生対象コンテスト開催、最優秀賞の東京高専チームが企業評価額5億円を獲得

カテゴリー:人工知能・AI
タグ:Coursera(企業・サービス)AI / 人工知能(用語)日本ディープラーニング協会(用語)日本(国・地域)

Google CloudのVertex AIは機械学習を果てしないパイロットから価値を生む実用技術にする

米国時間5月18日のGoogle I/Oにおいて、Google Cloudは開発者が自分のAIモデルをもっと容易にデプロイしメンテナンスできるための、新しいマネージド機械学習プラットフォームであるVertex AIを発表した。I/Oは以前からモバイルとウェブのデベロッパーが対象であり、Google Cloudのニュースはあまりなかったため、やや違和感のある発表にも思えたが、GoogleがVertexの発表を本日行なうと決めた事実は、この新しいサービスが多様な分野の開発者にとって重要と同社が考えている証拠だ。

Vertexのローンチは、Google Cloudのチームが反省をたくさんしたことの結果だ。Google CloudのAI Platformでプロダクト管理を担当しているディレクターのCraig Wiley(クレイグ・ワイリー)氏は、次のように語る。「私見では、エンタープライズの機械学習は今危機にあります。その分野で何年も仕事した者の1人として現状を見れば、Harvard Business Reviewなどに論評を書いているアナリストの誰もが、今や大半の企業が機械学習に投資をしたり、投資に関心を示しているが、どこもそこから価値を得ていないと言っている。こんな状況は、そろそろ変わるべきです」。

画像クレジット:Google

2016年から2018年までAWSのAIサービスであるSageMakerのゼネラルマネージャーを経験して2019年にGoogleに来たワイリー氏によると、Googleのように自分たちのために機械学習を動かすことのできる企業は、どうやればそれが変革への力になるかを実際に見て知っている。しかし彼がいう問題とは、大きなクラウドがそんなサービスを提供するときは何十ものサービスに分割されてしまうことだ。「しかも(Google自身も含めて)そんなサービスの多くが袋小路にあります。そこでVertexの目標は、エンタープライズにとって機械学習への投資からのROIの時間を短縮し、モデルを作ったことが終わりではなく、彼らが作ったモデルから確実に、リアルな価値を得ることです」とワイリー氏はいう。

そこでVertexは、極めて柔軟性に富んだシステムとして、デベロッパーやデータサイエンティストのスキルのレベルがそんなに高くなくても、モデルを迅速に訓練できるようにする。Googleによると例えばモデルの訓練に要するコードの行数は他社の類似製品に比べて80%少なく、しかも彼らはモデルの全ライフサイクルを自分で管理できるようになる。

画像クレジット:Google

このサービスにはGoogleのAIオプティマイザVizierが統合されていて、機械学習のモデルのハイパーパラメータを自動的にチューニングする。これによりモデルのチューニングに要する時間が大幅に減り、エンジニアはより多くの実験をより短時間でできるようになる。

また、Vertexが提供している「Feature Store」でユーザーは機械学習のいろいろな機能をサービスし、シェアし、再利用できるようになる。そしてVertex Experimentsという機能を利用するとモデルの選択が速くなり、モデルの本番へのデプロイが加速される。

デプロイは、継続的モニタリングサービスとVertex Pipelinesが支援する。後者はGoogle CloudのAI Platform Pipelinesからの改名で、モデル用のデータを準備および分析し、モデルを訓練し、それらを評価してプロダクション(本番展開)へとデプロイしていくワークフローの管理を助ける。

いろいろなタイプのデベロッパーにとってとっつきやすいシステムにするために、このサービスには3つのインタフェイスがある。「ドラッグ&ドロップのツール」と「高度なユーザーのためのノートブック」、そして意外かもしれないがBigQueryのデータウェアハウスの中で、SQLの標準的なクエリを使って機械学習のモデルを作り実行するGoogleのツールである「BigQuery ML」だ。

Google CloudのCloud AIとIndustry Solutionsの副社長兼ゼネラルマネージャーであるAndrew Moore(アンドリュー・ムーア)氏は、次のように述べる。「Vertex AIを作るときには、2つのことを指針とした。1つはデータサイエンティストとエンジニアを組織の藪から救い出すこと、もう1つは、AIを果てしないパイロット事業から正規のサイズのプロダクションへと移行させることに誰もが真剣になるために、業界全体としての気運を作り出すことだ。このプラットフォームとして実現したことを、私たちはとても誇りに感じている。それは、データサイエンティストとエンジニアがクリエイティブな仕事に充実感を持てるような、新世代のAIの本格的なデプロイを可能にするものだからだ」。

関連記事
グーグルがAndroid 12の最新情報を公開、近年最大級のデザインアップデート、新ベータ版配信開始
Chromeに漏洩パスワードを自動的に修正する新機能、グーグルのAIテクノロジー「Duplex」を利用
事前トレーニングなしでより自然に会話できる新AI言語モデル「LaMDA」をグーグルが発表
今、Androidは30億台のアクティブデバイスに搭載されている
グーグルが「折りたたみ式」にフォーカスしたAndroidディベロッパー向けアップデートを追加
グーグルが次世代カスタムAIチップ「TPUv4」を発表、1ポッドでエクサフロップ以上の処理能力
グーグルの「Wear OS」とサムスンの「Tizen」が統合、アップルのwatchOSに対抗
Googleがオンラインショッピング拡大でShopifyと提携
グーグルがクロスプラットフォームUIツールキット「Flutter」をアップデート
グーグルの「Workspace」アプリが相互連携を強化し12の新機能を追加、囲い込みがさらに進む
Android TV OSの月間アクティブデバイスが8000万台に到達、新機能も発表
グーグルがWear OSの大規模アップデートを発表、Fitbitの「健康」関連機能も導入
グーグルが実物大の相手がすぐ向こう側にいるかのような3Dビデオ通話ブースを開発中

カテゴリー:人工知能・AI
タグ:GoogleGoogle I/O 2021Google Cloud機械学習Vertex AI

原文へ

(文:Frederic Lardinois、翻訳:Hiroshi Iwatani)

PornhubがAIで4Kカラー化した1890〜1940年代のアダルト映像ライブラリー「Remastured」公開

PornhubがAIで4Kカラー化した1890〜1940年代のアダルト映像ライブラリー「Remastured」公開大手アダルト動画サイトのPornhubが1890年代のものを含むビンテージポルノ映像を、AIを使って4Kカラー映像にリマスターしたライブラリー「The Remastured」を公開しました。AIを使って古い映像を高解像度化したりカラー化する技術はいまや珍しくはありません。大戦時に従軍カメラマンが撮影した兵士たちの映像から、ろくにガードレールもないモナコの市街地コースを疾走するシートベルトもない葉巻型F1マシンのレース映像までさまざまなビンテージフィルムが、あたかもつい最近の映像のように再現されています。

ところが、ことポルノに関してはこのようなAIリマスターは行われていませんでした。その理由は、映像を高解像度化およびカラー化する人工知能はポルノ映像で鍛えられることがないから。Pornhubはサイトにアップロードされたアダルト動画から約10万本を使い、裸で組んず解れつする男女の上や下の凹や凸やアスタリスク、その周辺に繁茂するススワタリなどの微妙な色合いのバリエーションをAIに叩き込みました 。さらに4Kへの高解像度化とフレーム補間を適用し、不鮮明さとちぎこちなさを補っています。

VHSとベータの戦いで例えられる話のように、人々は新しい映像メディアが現れれば、それを用いてポルノを製作してきました。Pornhubは、これらの映像を保存するだけでなく現代化することが重要だと考え、1896年から1940年代にわたる20本のビンテージ素材を修復。過ぎ去りし時代の古風な営みを楽しめるようにすることに「非常に興奮」しているとのこと。

修復された映像の1本、1896年の「The Kiss」は、初めて男女が接吻する様子を収めた映像とされます。かのトーマス・エジソンも関わりがある会社が配給したものの、Pornhubによると当時の人々は「衝撃的かつわいせつ」だと非難したのだそう。これらの映像は歴史的な面でも貴重なものです。当時は今ほどオープンな時代ではなかったものの、人類が種を保存しようとする本能はいつの時代も変わりません。

ただPornhubが公開したライブラリーを進めていくと、1920年代にはもう三つ巴で喜々として互いの核心をズビズバする紳士淑女を捉えた、思わず手で目を覆いつつ指の隙間から凝視してしまいそうになる映像も登場します。

なお、いくらAIを鍛えたからと言って修復された映像のカラー化が現実そのままだという保証はありません。それは10万本のいかがわしい映像で頭が一杯になったAIが「きっとこんなかんじ」と想像して「色」を着けたものだと言うのが正しいでしょう。

ちなみにPornhubが公開したこのライブラリーの映像はいずれもAIによる「修復」済みですが、日本の法に合わせた「修正」はされていませんのでご注意を。

(Source:Pornhub(Twitter)Engadget日本版より転載)

関連記事
アダルト動画配信のPornhubが2020年版透明性レポートを公開、違反動画検出の取り組みを詳述
アダルト動画配信のPornhubが数百万本の投稿を凍結、違法動画掲載の非難を受けて
新技術を育てるのはやはりポルノ?!
ポルノサイトが人工知能でビデオをタグづけ――PornHubのシステムは出演者、場面を認識する

カテゴリー:人工知能・AI
タグ:AI / 人工知能(用語)Pornhub(企業・サービス)

NASAのアーカイブでドキュメント理解の経験を積むDocugamiの新モデル

最近はデータについての話題が多いため、膨大な量の処理が世界中のドキュメントで行われていることを忘れてはいないだろうか。ドキュメントは多様なファイルや形式が混在する動物園のようなものだ。非常に大きな価値はあるが、クリーンな構造化データベースの時代にはまだ適合していない。Docugami(ドキュガミ)はこの状況を変えようとしている。Docugamiのシステムは、任意のドキュメントを直感的に理解した上で、内容に対してインテリジェントな方法でインデックスを作成する。NASAはこの計画に賛同している。

Docugamiのプロダクトが計画どおり機能すると、何年にもわたり積み上げられたドキュメントの山を、誰でも瞬時に使いやすいデータに変換できるようになる。

どんな会社でも、運営していればドキュメントが大量に発生する。契約書や法的書類、不動産の賃貸借契約書や同意書、マーケティング関連の提案書やリリースノート、医療のカルテなどがある。形式もさまざまで、Word(ワード)ドキュメント、PDF、ワードからエクスポートしたPDFを印刷してスキャンしたものなど、多岐にわたる。

この問題に対応しようと何年にもわたって努力が払われたが、すべてのドキュメントを1カ所に集め、社内で共有したり編集したりできるようにするなど、大部分は組織側の対応だった。ドキュメントを理解するということは、それを扱う人間に委ねられてきたケースが多い。ドキュメントを理解するのは難しいので、これはもっともな話だ。

関連記事:自然言語処理ライブラリをオープンソースで提供するHugging Faceが43.6億円調達

賃貸借契約を考えてみよう。借主の名前がJill Jackson(ジル・ジャクソン)だとする。その契約書に「借主」と書かれているのを人間が読むと、借主が誰かは理解できる。また、他に100件の契約書があるとする。そのようなドキュメントに「借主」とあれば、ドキュメントの文脈からそれが先ほどと同じ概念を意味するが、同1人物ではないことを理解できる。一方で、機械学習や自然言語理解システムにとって、このような概念を理解して適用するのは非常に難しい。それでも、もしシステムがこのような概念を理解して応用できるのであれば、世界中の膨大なドキュメントから有用な情報を山のように抽出できる可能性がある。

.docxへの貢献

Docugamiの創業者であるJean Paoli(ジャン・パオリ)氏によると、同社では問題を全面的に解決できたという。大胆な主張ではあるが、彼はそう言える数少ない人間の1人だ。パオリ氏はMicrosoft(マイクロソフト)で何十年も重要な人物だった。とりわけXML形式の作成に力を入れていた。.docxや.xlsxなどの「x」で終わるファイルをご存じだろう。パオリ氏は、そのようなファイル形式の発展に少なからず貢献している。

「データとドキュメントは同じではありません。人間が理解できるものがドキュメントで、コンピューターが理解できるものがデータです。なぜ違うのでしょうか。(マイクロソフトでの)私の最初の仕事は、ドキュメントをデータとして表せる形式を作ることでした。業界の友人たちと一緒にXMLを作り、それをBill(ビル)が承認しました」(そう、あのビル・ゲイツが)と彼は説明した。

このときに作られた形式は広く使われるようになったが、20年経った現在でも問題は解決されていない。さまざまな業種がデジタル化され、問題の規模は大きくなっているが、パオリ氏にとって解決策は同じだ。XMLのコンセプトは「ドキュメントはウェブページのように構造化されるべきだ」である。つまり、ボックス内にボックスがあり、メタデータで明確に定義されているという、コンピューターが処理しやすい階層モデルだ。

画像クレジット:Docugami

「数年前にAIに関わっていた時に、ドキュメントをデータに変換するというアイデアが浮かびました。階層モデルを参照するためのアルゴリズムが必要でしたが、そんなアルゴリズムは存在しないと他の人に言われました。XMLモデルではあらゆる要素が他の要素内にあり、各要素の持つ固有の名前から、そこに含まれるデータが分かります。このモデルは、現在使用されているAIモデルと互換性がありません。これが現実です。AIの専門家がこの問題に取り組むことを期待していましたが、そうはなりませんでした」と彼は説明した(「自分は他の分野で忙しかった」と彼は言い訳を加えた)。

コンピューティングの新しいモデルに互換性がないことは、驚くことではない。新しい技術には特定の条件や制限がつきものだ。AIは音声認識やコンピュータービジョンなど、重要な他の分野に焦点が当てられている。その分野でのアプローチは、ドキュメントを体系的に理解するニーズとは異なる。

「多くの人が、ドキュメントは猫に似ていると考えています。AIをトレーニングすることで、目やしっぽを見つけられるようになるというわけです。しかし、ドキュメントは猫には似ていません」と彼は言った。

当たり前のようだが、ここに制限があるのだ。セグメンテーション、シーンの理解、マルチモーダルのコンテキストなどの高度なAIの手法はすべて、ある意味で非常に高度な猫検出機能であり、猫だけでなく犬、車の種類、表情、場所なども検出できる。一方で、ドキュメントはそれぞれがあまりに異なっている、もしくは似すぎていると言えるかもしれない。そのため、同じようなアプローチでできるのは、せいぜいおおまかに分類することだ。

言語理解については適している面もあるが、パオリ氏が必要とする方法としては不適切だった。「AIは英語の言語レベルのように機能しています。AIは参照するテキストを、そのテキストが含まれているドキュメントと切り離して考えています。私は神経言語プログラミング(NLP)の専門家が好きです。私のチームの半数はNLPの専門家ですが、NLPの専門家はビジネスのプロセスについては考えません。XMLの専門家(コンピュータービジョンを理解している人たち)とNLPの専門家にチームで共同してもらう必要があります。そうすると、違うレベルでドキュメントを見ることができるようになります」と彼は言った。

Docugamiの仕組み

画像クレジット:Docugami

パオリ氏が既存のツール(光学文字認識のような従来の成熟した機能を超えるもの)を採用しても、目標を達成できなかっただろう。そのため彼は独自のAIラボを作り、幅広い専門分野のチームが約2年間いろいろな改造を進めた。

「我々は自己資金でコアサイエンスをこっそりと研究し、特許事務所にかなりの数の特許を提出しました。その後ベンチャーキャピタルと会合を持ち、SignalFireが1000万ドル(約10億8000万円)のシードラウンドを自発的に主導してくれました」と彼は言った。

Docugamiを実用段階まで開発を進めるところまではシードラウンドに含まれなかったが、パオリ氏は作業中のドキュメントでプラットフォームについて説明してくれた。私はアクセス権を付与されず、スクリーンショットや動画も提供してもらえなかった。統合とUIの対応が途中だということで、ここからは想像してもらう必要がある。何かしらの企業向けSaaSサービスを想像してもらえれば、ほぼ間違いない。

Docugamiのユーザーは、任意の数のドキュメントを好きなだけアップロードできる。マシンが理解できるワークフローにドキュメントを移動すると、ドキュメントが解析される。スキャンされたPDFやワードファイルなどが、コンテンツに固有の階層構造にXMLのような形式で解析される。

「例えば、500個のドキュメントを複数のグループに分類するとします。こちらの30個は同じカテゴリー、20個は似ているから同じカテゴリー、そちらの5個をまとめるという感じです。ドキュメントの見た目、内容、使用方法などの手がかりを組み合わせてグループ化します」とパオリ氏は言った。あるサービスでは賃貸借とNDAの情報を区別できるかもしれないが、ドキュメントの種類は多岐にわたるため、事前にトレーニングされたカテゴリーの内容に合わせて分類して解決することはできない。どのドキュメントも内容が重複しない可能性があるため、Docugamiでは毎回トレーニングをやり直す。ドキュメントが1つしかない場合もやり直す。「ドキュメントを分類したら、ドキュメントの全体的な構成と階層を理解します。そうすることで、ドキュメントの内容全体を有効活用できます」。

画像クレジット:Docugami

この作業で可能になるのは、見出しのテキストを選択してインデックスを作成したり、単語が検索できるようになったりすることだけではない。ドキュメントに含まれるデータ(支払元、支払先、金額、支払日、支払いの条件など)がすべて構造化され、同じようなドキュメントの文脈で編集が可能となる(推定された内容を再確認するために多少の入力が必要)。

わかりにくいと思うので、会社で進行中の融資に関するレポートを1つにまとめることを考えてみよう。必要な作業は、サンプルドキュメント内の重要な部分をハイライトするだけだ。「Jane Roe(ジェーン・ロー)」「2万ドル(約210万円)」「5年」などの部分をクリックしたら、対応する情報を取得する別のドキュメントを選択する。すると、ドキュメントから取得された名前、金額、日付などが記載されている整理されたスプレッドシートが、数秒後にできあがる。

当然、このデータはすべて移動可能である。ビジネスで一般的に使用される他のさまざまなパイプやサービスとの統合も計画されている。実現すれば、レポートの自動化、特定の条件下でのアラートの発出、テンプレートや標準ドキュメントの自動作成が可能になる(古いドキュメントを保管したり、重要なカ所に下線を引いたりする必要がなくなる)。

このような処理が、ドキュメントのアップロード後30分で行われることに注目できる。データのラベリングや前処理、クリーニングは不要だ。事前に決まっている特定の概念や、賃貸借ドキュメントの形式に基づいてAIが処理するわけではない。関連がある構造、名前、日付などの必要な情報を、アップロードしたドキュメントからすべて学習するのだ。加えて、異なる業種への対応も可能で、誰でも直感的に理解できるインターフェースを使用する。ヘルスケアデータや建設関係の契約管理など、どんなデータを入力してもツールは処理可能だ。

ウェブインターフェースは、ドキュメントを取り込んで新しいドキュメントを作成できる主要ツールの1つであるが、ワードには別のツールがある。ワードを使用する場合にDocugamiは、使用するドキュメントがどのような形式でも内容を完全に認識するアシスタントのように機能する。そのため、新しいドキュメントを作成したり、標準的な情報を入力したり、規制に準拠したりすることができる。

機械学習の適用対象として法律文書を処理するのはあまり楽しいものではないが、重要ではある。そうでなければ私はこの記事を書いていないだろう(記事の長さはともかく、記事を作成することはなかったかもしれない)。このような深い理解が必要なタイプのドキュメントは、既存業種で使用されている標準のドキュメントタイプ(警察や医療のレポートなど)で一般的となっているが、カヤックレンタルサービス向けに運用できる特注モデルを誰かがトレーニングするまで待っているのは楽しいものである。中小企業のドキュメントにも、大企業のドキュメントと同じような価値が眠っている。中小企業ではデータサイエンティストを雇う余裕がなく、大企業でもすべて手作業で行うことはできない。

NASAのお宝

画像クレジット:NASA

極めて難しい問題でも、人間にとっては些細なことがある。似たような20個のドキュメントに名前と金額のリストが含まれていても、誰でも簡単に目を通せるだろう。おそらくDocugamiがクロールしてトレーニングするよりも短い時間で、内容を把握することが可能だ。

AIを活用する目的は、人間の能力を模倣してそれを超えることにある。経理担当者が20件の契約に対するレポートを毎月作成することと、1000件の契約に対するレポートを毎日作成することは別問題だが、Docugamiではその両方をどちらも簡単に実現できる。このような運用を調整できることが重要な企業システムにとっても、ドキュメントのバックログに埋もれたデータからクリーンなデータやインサイトを集めることを望んでいるNASAにとっても、Docugamiは適していると言える。

NASAが大量に保有しているもの、それはドキュメントだ。合理的かつ適切に管理されたアーカイブは、設立当初までさかのぼれる。数多くの重要なドキュメントをさまざまな方法で利用できる。私は長い時間をかけて、楽しみながら歴史あるドキュメントの情報を精査した

NASAは、アポロ11号に関する新しいインサイトを探しているわけではない。今に至るまでのプログラム、募集、補助金プログラム、予算、エンジニアリングプロジェクトを通じて、膨大なドキュメントが生成されている。これは結局のところ、連邦政府の官僚制度の大部分を占めている。さらに、何十年にもわたって書類を管理してきた他の大規模組織と同じように、NASAのドキュメントにはさまざまな可能性が隠されている。

ファイル内には専門家の意見、研究の産物、エンジニアリングのソリューション、その他さまざまなカテゴリーの重要情報が存在しており、簡単なワードで検索できると思われるが構造化されてはいない。例えばファイルに保存されている情報をジェット推進研究所で働いている人が理解し、ノズル設計に取り入れることができれば有用ではないだろうか。また、あるトピックについて、種類、日付、作成者、ステータスごとに整理された包括的なリストの最新版を数分で入手できたらどうだろう。特許アドバイザーが、従来の技術に関するNIAC助成金の受領について、情報を提供する必要がある場合はどうだろう。特定のキーワードで調べた場合よりも具体的に、特許や申請に関する古い情報を取得できるのではないだろうか。

2020年授与されたNASAのSBIR助成金は「Johnson Space Center(ジョンソン宇宙センター)の特定の種類のドキュメントをすべて収集する」ような、特定の業務を対象とするものではない。これは、このような助成金の多くと同様に探索や調査を目的とした契約であり、DocugamiはNASAの研究者と協力して、アーカイブにテクノロジーを適用する最もよい方法を見つけるよう取り組んでいる(優れた適用方法として、SBIRとその他の中小企業向け資金提供プログラムが挙げられるかもしれない)。

米国立科学財団(NSF)が提供する別のSBIR助成金とは次の点で異なる。NASAでは、さまざまな種類のドキュメントに重複する情報が含まれていても、チームで適切に整理することを検討している。その一方でNSFでは「小さなデータ」を適切に特定することを目指している。「我々は小さなデータに注目しています。非常に細かい点です。例えば名前が記載されている場合、貸主の名前か借主の名前か、医者の名前か患者の名前かに注目します。患者の記録にペニシリンに関する記載がある場合、それが処方されているか禁止されているかに注目します。アレルギーという欄と処方という欄がある場合に、そのような項目を関連付けることができます」とパオリ氏はいう。

「私がフランス人だからかもしれません」

SBIR助成金の予算がやや少ないため、その金額では会社の経営に影響がある可能性を指摘すると、彼は笑った。

「我々は助成金に頼って運営しているのでも、助成金が重要なのでもありません。私にとって、助成金は世界最高のラボで科学者と働くための方法なのです」と彼は言った。一方で彼は、助成金によるプロジェクトがいくつも予定されていることにも言及していた。「私にとって科学は燃料です。ビジネスモデルは非常にシンプルです。Docusign(ドキュサイン)やDropbox(ドロップボックス)のような、サブスクリプション形式のサービスです」。

この会社はビジネス運営を開始したばかりであり、インテグレーションパートナーやテスターとの多少のつながりを作っている。しかし今後1年で、独自のベータ版を展開した上で一般公開する予定だ。ただし明確な日程は決まっていない。

「我々は新興企業です。1年前は社員が5~6人でしたが、このシードラウンドで1000万ドル(約10.8億円)を獲得し、波に乗っています」とパオリ氏は言った。彼はこれが儲かるビジネスであるというだけでなく、企業の仕組みを大きく変えるものになると確信している。

「人々はドキュメントが好きです。私がフランス人だからかもしれませんが、テキストや本、文書は重要だと考えています。人間にはそういうものが必要です。人間は機械が上手に考えることを助け、機械は人間が上手に考えることを助けるもの。我々はそう考えています」と彼は言った。

関連記事:企業向けノーコードAIプラットフォームのNoogataがシードラウンドで約13億円を調達

カテゴリー:人工知能・AI
タグ:Docugami機械学習NASA

画像クレジット:cifotart / Getty Images(Image has been modified)

原文へ

(文:Devin Coldewey、翻訳:Dragonfly)

コロナ禍で押し進められたDXの中、AIに期待される今後の役割とは

コロナ禍で押し進められたDXの中、AIに期待される今後の役割とは

アフロ

編集部注:この原稿は、MIN SUN(ミン・スン)氏による寄稿である。同氏は、AppierのチーフAIサイエンティストを務めている。Appierは、AI(人工知能)テクノロジー企業として、企業や組織の事業課題を解決するためのAIプラットフォームを提供している。

2020年、新型コロナウイルスの存在が確認されて以来、その猛威は世界中に広がり、2021年になった今でも終息のめどが立っていない。

新型コロナウイルス感染症の流行により、人々の健康に対する意識はもちろんのこと、社会のあり方そのものに対しても大きな影響を与え、ミクロレベルからマクロレベルにいたるまであらゆるものごとが変革を余儀なくされたことに疑いの余地はない。

特に、営利企業において新型コロナウイルスの影響は甚大で、これまで遅々として進まなかったデジタルトランスフォーメーション(DX)が事業規模の大小を問わず急速に押し進められている。

この状況下、にわかに注目を集めているのが業務の自動化や省力化を得意とするAI技術の活用だ。

これまで、AIという技術に対する疑心や懸念をもっていたために活用に消極的だった企業においても、AIソフトウェアパッケージの導入やシステム開発が加速している。

新型コロナウイルスの流行が5年分のDXを1年で押し進めた

新型コロナウイルスの流行拡大により、企業内で最も大きく変わったことといえば、従業員の働き方だろう。新型コロナウイルスの流行以前は「仕事をする」ことは「オフィスにおもむく」ということに直結していた。しかし、コロナ禍で避けるべき3つの密と呼ばれる密閉、密集、密接の全条件に当てはまってしまうケースがあり、多くの企業が従業員を健康維持のため、出社制限を設けざるを得なかった。

このことにより、在宅勤務が急激に増加したわけだが、すべての業務をいきなりリモートで実施するのは当然難しい。そのため、自粛期間の合計が1年を超えてくる中でオフィスへの出社を要する業務においてもDXに取り組む企業が増加している。

バックオフィス業務における契約対応業務を例にあげると、これまでは紙媒体に押印し、それを送付するという流れが一般的だったのに対し、コロナ禍でDXが進められたことにより、契約書類がデータで渡されるようになり、押印もデジタル環境で実施した上で、契約書類の返送もオンライン上で完結させるケースが増加している。

ただ、このような業務のデジタル化に必要な技術やサービスの多くは、コロナ禍で生まれたものではなく、以前から存在していたが導入が先送りされていたものだ。つまり、企業における大規模なDXを推進したのはCEOでもCTOでもなく、新型コロナウイルスということになる。

コロナ禍で価値を発揮するAI

現在社会で起こっているDXは一過性のものではなく、さらなる推進に向け多くの企業が取り組んでいる。その中でもAIは、どのような価値を発揮しているのだろうか。

AIは様々な分野で活躍しており、その中でも特に医療分野では大きな価値をもたらしている。

医療分野におけるAI活用に関するひとつ目の事例は創薬の迅速化だ。従来、新薬が臨床試験に至るまでには4~5年以上の研究期間が必要だといわれてきた。だが、イギリスのオックスフォードを拠点とするAIスタートアップのExscientiaはAIを用いて新薬に用いる化合物を設計し、12カ月という短い期間で新薬の臨床試験にこぎつけた。また、通常の創薬では莫大な投資コストが発生することが多々あるが、AIの活用がその圧縮にもつながっている。

また、このような創薬ノウハウは新型コロナウイルスに効果的な薬品の特定にも用いられているという。したがって、過去に開発された薬品から新型コロナウイルスの予防や治療に効果的なものを特定する作業にはAIが少なからず貢献しているということになる。

AIを医療分野に活用する事例はもちろんこれだけではない。中国や台湾、韓国などでは、新型コロナウイルスへの感染予防に向け、AIを用いた陽性者のマッピングなども行われているという。

AIに期待される今後の役割とは

コロナ禍においても、AIが一定の価値を生んでいるが、AIがより大きな価値をもたらすのはこれからだろう。というのも、AIには学習のためのトレーニングデータが必要なため、中長期的な問題解決に適しているからだ。新型コロナウイルスの感染拡大が終息したとしても、いずれ人類は新たな感染症の流行に見舞われる。その際には、AIはより大きな価値をもたらすことは間違いない。

たとえば、感染症の予防においては電子医療記録をデータとして用いることで感染時の重症化リスクを予測できるようになる。また、新型コロナウイルスの感染経路を記録しておくことで、どのような場所で、誰を、どのように検査すれば感染症拡大の防止に役立つかを分析することも可能だ。

なお、上記の電子医療記録と地理空間に関するデータを組み合わせることで、検査、隔離、その他リソースの割当に関する優先順位の策定を支援するという構想は将来的な期待が高まっている。

さらに、ウイルスの遺伝子配列を分析し、変異をモニタリングすることにより、製薬会社による医薬品開発のターゲット明確化やウイルスの拡散速度予測、変異体の有害性の特定など、これまでは専門家が時間をかけて実施していた一連の取り組みの迅速化も期待されている。検査においても、現状ではPCR検査による感染の判断が主流だが、早期にウイルスの特性を明らかにできれば、CTスキャンデータなどを基に感染判断ができるようになる可能性はある。

今回の新型コロナウイルスの感染拡大は突発的だったため、AIが価値を発揮することが間に合わなかったケースも見受けられるが、私達が今直面している問題が、将来的なAI活用の礎として生かされるはずだ。

もちろん、技術を活かすも殺すも結局は人によるところが大きいため、将来的に期待されているAI活用が机上の空論で終わる可能性もある。

だが、政府や企業が主体となり、将来的な感染症に備えた仕組みを整え、人々がコロナ禍で得た教訓をしっかりと学習しパンデミックに備えることができれば、感染症拡大による社会的なリスクは大きく減少することだろう。

関連記事
AI創薬・AI再生医療スタートアップ「ナレッジパレット」が創薬・再生医療領域の停滞を吹き飛ばす
TikTokの親会社ByteDanceがAI創薬チームを採用開始、多角化を目指しヘルスケア産業へ参入
Googleが感染症の数理モデルとAIを組み合わせた都道府県別の新型コロナ感染予測を公開、慶応大監修
NVIDIAのGPUで新型コロナ研究中のAIスタートアップElix、アステラス製薬とAI創薬の共同研究開始
希少疾患の治療法をAIで探るHealxが約61億円を調達
AIで創薬プロセスを改善するAtomwiseが、シリーズAで4500万ドルを調達

カテゴリー:人工知能・AI
タグ:医療(用語)AI / 人工知能(用語)新型コロナウイルス(用語)創薬(用語)

「常識」獲得に向け少しずつ進化するコンピュータービジョン、フェイスブックの最新研究

機械学習は、やり方を教えるデータさえあれば、あらゆることができる。これは必ずしも簡単なことではない。だから研究者は、AIに少々の「常識」を加える方法を常に模索している。常識があれば、AIが猫だと認識する前に500枚の猫の写真を見せる必要がなくなるからだ。Facebook(フェイスブック)の最新の研究は、データのボトルネックを減らす方向へ大きな一歩を踏み出した。

同社の強力なAI研究部門は、高度なコンピュータービジョンアルゴリズムなどの技術進歩や応用範囲拡大の方法に長年取り組んでいる。着実に前進しており、その成果は一般に他のリサーチコミュニティと共有されている。Facebookが特に追求している興味深い開発の1つは「半教師あり学習」と呼ばれるものだ。

一般にAIの訓練について考えるとき、上述の猫の500枚の写真のようなものを思い浮かべる。こうした画像はあらかじめ選り分けられ、ラベルが付されている(つまり、猫の輪郭が描かれていたり、猫の周りに四角い囲みをつけたり、単に猫が画像の中のどこかにいると示されていたりする)。こうして、機械学習システムが猫の認識プロセスを自動化するアルゴリズムを作れるようにする。当然のことながら、犬や馬で行いたい場合は、500枚の犬の写真、500枚の馬の写真などが必要となる。つまり、線形に応用範囲が広くなる。テクノロジーの世界では決して目にしたくない言葉だ。

「教師なし」学習に関連する半教師あり学習では、ラベル付けされたデータをまったく使用せずにデータセットの重要な部分を理解する。これで単純に明後日の方向に進んでしまうことはなく、そこにはまだ構造がある。例えばシステムに1000個の文(センテンス)を与えて学習させた後、いくつかの単語が欠落している10の文をシステムに提示する。システムはおそらく、最初に見た1000文に基づき空白を埋めるまともな仕事をすることができる。しかし、それを画像や動画で行うのはそれほど簡単ではないし、単純でも予測可能でもない。

だがFacebookの研究者は、簡単ではないかもしれないが可能であり、実際には非常に効果的であることを示した。DINOシステム(DIstillation of knowledge with NO labels「ラベルなしでの情報抽出」の略)は、ラベル付きのデータが皆無でも、人、動物、静物のビデオの中から目的のものを見つけるべく学習することができる。

画像クレジット:Facebook

AIは上記の処理を、1つずつ順番に分析される一連の画像として動画を捉えるのではなく「一連の単語」と「文」の違いのような複雑で相互に関連する集まりとして捉えることによって行う。動画の冒頭だけでなく、途中や最後にも注意を払うことで、AIエージェントは「この一般的な形の対象物が左から右に移動する」という感覚を得る。その情報は他の知識にも反映される。例えば右側にある物が最初の物と重なっている場合、システムは双方の輪郭をパッと見て同じではないと認識する。その知識は他の状況にも応用できる。言い換えれば、AIは「見たものの意味」という基本的な感覚を養う。そして新しい対象物に関して非常に少ない訓練で同じことを行う。

これによりコンピュータビジョンシステムは、従来の訓練を受けたシステムと比べて優れたパフォーマンスを発揮するという点で効果的であるだけでなく、関連づけや説明する能力が高まる。例えば500枚の犬の写真と500枚の猫の写真で訓練されたAIは犬と猫を認識するが、その類似性はまったく理解しない。だがDINOは、具体的にではないが、両者が視覚的に類似し、とにかく車よりも類似していることを理解する。そしてメタデータとコンテキストがメモリで見えるようになる。犬と猫は、犬と山よりも、その種のデジタル認知空間では「近い」のだ。こうした概念は小さな集まりとして見ることができる。下の画像で、ある種の概念同士がどのくらい近接しているのか見て欲しい。

画像クレジット:Facebook

これには、この記事では取り上げない技術的な利点がある。興味がある人は、Facebookのブログ投稿にリンクされている論文に詳細があるので参照されたい。

隣接する研究プロジェクトとしてPAWSと呼ばれる訓練方法もある。これは、ラベル付けされたデータの必要性をさらに減らす。PAWSは、半教師あり学習のアイデアの一部を従来の教師ありメソッドと組み合わせて、ラベル付きデータとラベルなしデータの両方から学習させ、訓練を飛躍的に向上させる。

Facebook自身はもちろん、多くのユーザー向け(そして秘密の)画像関連の製品のために、速く優れた画像分析を必要としている。だが、コンピュータービジョンの世界でのこうした一般的な進歩は、目的が異なる開発者コミュニティでも歓迎されることは間違いない。

カテゴリー:人工知能・AI
タグ:機械学習コンピュータービジョンFacebook

画像クレジット:Facebook

原文へ

(文:Devin Coldewey、翻訳:Nariko Mizoguchi

ディープフェイクのビジネス活用、技術の悪用防止をめぐる戦い

ディープフェイクのビジネス活用と悪用防止をめぐる戦い

アフロ

編集部注:この原稿は、MIN SUN(ミン・スン)氏による寄稿である。同氏は、AppierのチーフAIサイエンティストを務めている。Appierは、AI(人工知能)テクノロジー企業として、企業や組織の事業課題を解決するためのAIプラットフォームを提供している。

顔認識技術を用いて動画内の人物の顔に、画像データの人物の顔を当て込むディープフェイクという技術がある。近年、注目度が高まっている技術のひとつだが、ディープフェイクと聞いてどのようなイメージが湧いてくるだろうか?

おそらく多くの人がネガティブなイメージを思い浮かべるだろう。著名人の顔をアダルトコンテンツにはめ込んだ動画や政治家が問題発言をしている動画が拡散、流通した事件はまだ記憶に新しい。

技術の悪用がメディアに大々的に取り沙汰され、悪評を得てしまったディープフェイクだが、この技術はどんな目的で開発されたのだろうか。

本寄稿では、ディープフェイクの誕生から社会に広まっていく過程、ビジネスにおいて期待されている活用策について、ディープラーニング技術の社会実装を目指す研究者としての立場から考察していく。

ディープフェイクとは?

「ディープフェイク」という単語自体は、ディープラーニングを活用したフェイク画像あるいは動画のことを指し、2017年にRedditに複数のフェイク動画を投稿したユーザーのID「deepfakes」に由来する。この辺りの経緯は、プレプリント含め様々な論文を保存・公開しているarXivにある「Deepfakes Generation and Detection: State-of-the-art, open challenges, countermeasures, and way forward」が詳しい。

近年、大きな注目を集めているディープフェイクだが、実は約20年前に開発された「Synthesis Human Technology」(人物画像合成技術)が技術の根幹を成しており、これら技術そのものは映画業界を中心に以前から盛んに活用されていた。

たとえば、2009年に公開された映画「アバター」は、俳優の表情や体全体の動作を捉え、CGキャラクターを重ねる形で制作されている。しかし、この作業は専用の機材が必要なため、莫大な制作費が発生してしまうという難点があった。

この難点の解決につながるきっかけとなったのが、2012年だ。2012年の画像分類コンテストにおいて、「AlexNet」が活用しているディープラーニング(深層学習)が注目を浴び、第三次AIブームへの期待値が高まり始めた(総務省 平成28年版 情報通信白書「人工知能(AI)研究の歴史」)。そして2015年前後にはAIの社会実装に向けた様々なコンセプトが起草された。

2015年、ワシントン大学のSteve Seitz(スティーブ・セイツ)教授らによって、高価な機材を使うスタジオで撮影を行わずとも表情を重ね合わせられるようになる技術が開発された。

さらに、2016年にはミュンヘン工科大学のMatthias Niessner(マティアス・ニースナー)教授が発表した「Face2Face: Real-time Face Capture and Reenactment of RGB Videos」で技術はさらに進歩をとげ、ノートPCのカメラを使用して3Dの顔をリアルタイムで操作できるようになった。

これらの技術進歩の過程を経て、2017年、「GAN」(敵対的生成ネットワーク。Generative Adversarial Networks)と呼ばれる画像生成技術と上記の技術などを組み合わせた「ディープフェイク」および関連オープンソースソフトウェアが登場するに至った。

これらディープフェイク関連ソフトウェアの登場により、PCにインストールし、動画と画像データを集めるだけでフェイク動画を生成できるようになった。ディープラーニングに関する深い知見を持たずとも利用できるソフトウェアということも相まり、一般人によりフェイク動画が数多く生成されていった。

当初はいたずら感覚で政治家や芸能人が普通であればしないような動きや発言をするフェイク動画が作られていたのだが、活用は悪意ある方向に少しずつエスカレートし、フェイク動画の流通がメディアで大々的に取り上げられ、逮捕者が出るまでに至ってしまったのだ。

ビジネスにおけるディープフェイク活用

ディープフェイクが意図しない形で悪用されているという事実がある一方、ビジネスにおける前向きな活用も進められている。

エンターテインメント領域では、映画制作への活用はもとより、スマートフォンアプリのような個人が利用するサービスとしてもディープフェイクの技術は盛んに活用されている。たとえば、Snapが提供するSnapChatのFace Swap機能では、2人以上が写真に写っている場合、顔をスワップすることが可能だ。また、自身の顔のパーツを有名人のものとスワップすることもできる。

広告分野では、スタントマンの動作にGANで生成した架空の顔を重ね合わせ、仮想モデルのCMを作る取り組みなどが進んでいる。これにより、有名人を起用するコストを抑えることができる。また、仮想モデルは現実には存在しないため、スキャンダルや不祥事によるブランドイメージの毀損リスクを排除することにもつながる。

こうしたビジネス活用の例から分かる通り、ディープフェイクは悪評が先行しているだけで、必ずしも悪い技術ではないということだ。

悪意に対するカウンター

ただ、ディープフェイクを用いた有益なビジネスが生まれているからといってこれまでに根付いてしまった悪評が自然消滅するわけではない。

そのため、近年ではディープフェイクの悪用を検知するための取り組みが産学を中心に進められている。

アカデミックの世界では、ディープフェイクを検知する技術が確立されつつある。2019年ICCV(International Conference of Computer Vision)というコンピュータービジョン領域の国際会議では、90%以上の精度でディープフェイクの動画を検知する技術の開発に成功したとの発表があった(「FaceForensics++: Learning to Detect Manipulated Facial Images」)。

そして、現代における情報拡散の中心であるソーシャルメディアを運営する企業でもディープフェイクの悪用を防止するための検証が動き出している。ソーシャルメディアの代表格であるFacebook(フェイスブック)では、AIを用いてディープフェイクを検知するプロジェクト「Deepfake Detection Challenge」(DFDC)が立ち上がっており、ディープフェイクの検知にAIが有効だという報告も上がっている。このプロジェクトの最終的な結果によっては、フェイスブック上で拡散されている動画がフェイクの可能性があるときに「この動画はフェイクかもしれない」というようなメッセージをユーザーに自動で発信できるようになる。

余談となるが、産学でディープフェイクの検知に関する成果が上がりつつある一方、テキストベースのフェイクニュースに効果的な技術はまだ確立されていない。ディープフェイクには、コンピューターにより検知できる特徴的なシグナルがある。しかし、テキストベースのフェイクニュースの場合、膨大なデータソースから情報を収集し、内容の真偽を総合的に判断しなければならないため、AIによる自動検知が難しいというわけだ。

ディープフェイクの検知技術は年々向上している。しかし、100%の精度で偽物を見破れるわけではない。テキストや画像などの情報媒体も含め、社会に生きる全員が意識的に情報の真偽を判断するためのリテラシーを身に着けていくことが悪意ある情報を駆逐する近道なのかもしれない。

関連記事
口コミで大流行の顔交換ビデオアプリRefaceにa16zなどの有名投資会社が約6億円を出資
Facebookの判別コンペはディープフェイク抑止に有望な第一歩
Facebookが10億円超を投じてディープフェイクの識別に賞金
Snapchatは自分の顔でディープフェイクできるCameoをテスト中
デビッド・ベッカムの「ディープフェイク」ビデオを作ったスタートアップが3.3億円超を調達
国防総省のDARPA研究所が改悪改竄ビデオを検出する技術で研究助成事業を展開
Facebookがリベンジポルノ防止策―マークされた画像の拡散を禁止
ディープラーニングと検索エンジン最適化の新たな時代
人工知能の最前線―人間の脳を真似るコンピューター
Facebookがディープラーニングツールの一部をオープンソース化

カテゴリー:人工知能・AI
タグ:AI / 人工知能(用語)ディープフェイク(用語)ディープラーニング / 深層学習(用語)

動画クリエイター向けAI作曲サービスSOUNDRAW、楽曲を「選ぶ」のではなく誰もが「作る」時代へ

SOUNDRAWの作曲家による作業風景

動画コンテンツはスマホ1つでいつでもどこでも楽しめるようになり、近年急速に普及している。YouTubeなどの動画サイトや各種SNSで目にしない日はないのではないだろうか。そしてほとんどの動画コンテンツでは楽曲がBGMとして使われている。

現状、動画クリエイターはストックBGM素材サービスから楽曲を探し、動画に合うかを1曲ずつ確認していかなければならない。「動画に合う楽曲を探すのはとても時間が掛かり大変」との声が多いという。

2020年2月に設立したスタートアップのSOUNDRAW(サウンドロー)は従来の「楽曲に合わせて動画を完成させる」といった手順を根本から変える。同社が提供する動画クリエイター向けAI作曲サービスSOUNDRAWは、独自開発したAI技術やアルゴリズムによって楽曲を自動生成し、その楽曲をユーザーが編集して商用利用もできるようにした。

動画クリエイターは動画に合わせて楽曲を「選ぶ」のではなく、SOUNDRAW上で「テーマ」や「ジャンル」などを選ぶことで、曲を作れるようになるのだ。SOUNDRAWの楠太吾代表は「これまで作曲家という特殊能力を持つ人しかできなかった『作曲』を、誰もができるように一般化していきます」と語る。

動画クリエイターなどからの反応も上々だ。2020年6月にベータ版、9月に製品版をリリースし、2021年4月時点ですでにアカウント登録者数は2万人を超えているという。

数多の楽曲から思い通りに編集も可能

自動生成された楽曲を自分好みに編集可能

SOUNDRAWの使い方はシンプルだ。ライフスタイルやビジネスなどの「テーマ」、ヒップホップやアコースティックなどの「ジャンル」といったカテゴリーを選ぶだけで、15個の楽曲が自動生成される。

ユーザーは選んだ楽曲の長さや構成、テンポ、音程などを動画に合うようにカスタムできる。演奏楽器も変更できる上、メロディやドラムといった特定の音を抜くことも可能だ。楠氏は「どんな構成でも、動画に合わせて自由に編集できます」という。

楽曲をダウンロードしたら企業PR動画やCM動画、YouTubeに投稿する動画、ゲームなどに、ロイヤリティフリーで使うことができる。著作権はSOUNDRAWに帰属しており、使用ライセンスをユーザーに付与しているかたちだ。このため楽曲の転売などは禁止している。

SOUNDRAWの会員登録は無料で、月間プランは月額税込1990円、年間プランは年額税込1万9900円。両プランともにAIによる作曲回数無制限、楽曲のダウンロード無制限となる。無料会員は作曲回数無制限と楽曲をキープする機能が使える。SOUNDRAWは今のところPCのみで利用可能だ。

また、SOUNDRAWでは動画編集ソフトAdobeのPremiere Pro、After Effectsのプラグインも開発し、有料会員に無料で提供している。SOUNDRAWはブラウザ版でも使えるが、プラグイン版はより効率よく作業できるようになる。なお、ブラウザ版はSafariでも使えるが、Chromeでの利用を推奨している。

楠氏は「プラグイン版は動画と楽曲を同時に編集できる点が大きなメリットです。楽曲をダウンロードすれば、動画編集ソフト内にインポートされます。そのデータを動画のタイムライン上にもっていくだけで、簡単に音楽と映像を合わせることもできます」と説明した。

楽曲データ量産AI

AI作曲によって自動生成される楽曲の組み合わせは理論上、数億もの数に上るという。「数えるのは途中でやめました」と楠氏は笑顔で話すが、開発に至るまでの2年間はテストをしては壊してを繰り返すなど苦労を重ねてきた。初めは鍵盤をランダムに叩いているだけといったフレーズが生まれてきたという。

楠氏はインプットするデータの質には特にこだわって独自開発を進めた。SOUNDRAWには作曲家が2人おり、インプット用のデータを実際に制作して貯めてきたでは「Melody」「Backing」「Bass」「Drum」と、楽曲を4つの要素に分解し、それぞれAIで生成したフレーズを組み合わせて楽曲を生み出す。

どのような基準で楽曲を作り上げているのか気になるが「あまり詳しくは言えません。ただ、いわゆるヒットソングを学習させているわけではありません」と楠氏はいう。楠氏はSOUNDRAWにおける質の高い楽曲には、独自に作り上げた学習モデルなどが大きく関わっているとの説明にとどめた。

楽曲数の追加と海外進出を

右から3番目がSOUNDRAWの楠太吾代表

SOUNDRAWは数億に上る楽曲の組み合わせを有しているものの、楠氏は「人間の耳で聴くと『どこか似ているな』といったものはどうしても出てきます」と話した。SOUNDRAWは2021年3月1日に3500万円の資金調達を実施し、累計調達額は1億円を超えた。今後は資金調達を元に楽曲数の追加などに力を入れる考えだ。

楠氏は「楽器1つとっても、ピアノならオルガンやエレクトリックといった音色・フレーズの幅などを増やしていくことで、将来的には『聞いたことがある』という状況を回避できるはずです。今は外部人材も加えてチームを作って取り組んでいる最中です」と語った。

また、SOUNDRAWは海外市場への進出も視野に入れている。「これまでは国内を中心にアプローチしていましたが、音楽は非言語であり、デジタルで提供できるため、国境を越えやすい。SOUNDRAWが持つカスタム性やクオリティが高いAI作曲ツールは、海外でもまだ多くはありません。SOUNDRAWは世界で戦うレベルに達していると思っています」と楠氏は意気込む。

関連記事:

カテゴリー:人工知能・AI
タグ:SOUNDRAW音楽日本動画編集

画像クレジット:SOUNDRAW

TRUST SMITHとADEKAが荷姿・ラベル位置・種類を問わずラベル内情報を自動認識するシステムの実証実験

TRUST SMITHとADEKAが荷姿・ラベル位置・種類を問わずラベル内情報を自動認識するシステムの実証実験

AI・数理アルゴリズム・ロボティクス領域の東京大学発スタートアップTRUST SMITHと、化学品事業・食品事業などを展開するADEKAは4月30日、「ラベル自動認識システム」の実証実験を開始したと発表した。早くとも年度内の完成を目指し、研究開発に努めるとしている。また「ラベル自動認識システム」にとどまらず、将来的には、アイテムごとに仕分け作業を行う原料受け入れラインの開発を目指す。

ラベル自動認識システムは、任意のアイテムをカメラで撮影することで、荷姿、ラベルの位置・種類を問わず、ラベル内の情報を自動で読み取るという技術。具体的には、OCR(文字認識)技術、画像認識技術を用いている。また「ダンボール・ドラム缶・紙袋など荷姿が異なる場合」「アイテムごとにラベルの位置が異なる場合」「ラベルの種類が様々である場合」などを対象としている。

同技術は今後、食品・医療品・化学品を取り取り扱うメーカーをはじめ、ラベルを利用するあらゆる現場において必要不可欠な技術になることが期待できると同時に、国内だけでなく海外での需要も見込んでいるという。

TRUST SMITHとADEKAが荷姿・ラベル位置・種類を問わずラベル内情報を自動認識するシステムの実証実験

現在、あらゆるメーカーにおいてロット番号・品質保証期限・賞味期限などを記載した「ラベル」は、頻繁に利用されている。

ADEKAにおいても、化学品事業では樹脂添加剤、情報・電子化学品、機能化学品、また食品事業では洋菓子店・スーパーなど向けのパンや菓子などで様々なラベルを採用している。これら取り扱いアイテムは、荷姿やラベルの位置・種類が多種多様であるためラベルを自動で読み取ることが難しく、人間が確認せざるをえないという。

ただ、属人的な作業にはミスがつきものであり、人為的な過誤による損失、作業効率の低下などの課題を抱えているそうだ。

この課題を解決すべく、OCR技術・画像認識技術に強みを持つTRUST SMITHと、食品の管理技術・トラッキングシステムに強みを持つADEKAは、ラベル自動認識システムの実証実験を開始したという。

同技術によって、食品・医療・化学をはじめ、ラベルを取り扱うあらゆる現場における労働力不足の解消・作業コストの軽減・ヒューマンエラー防止を目指すとしている。

TRUST SMITHは、AI・数理アルゴリズム・ロボティクス分野の最先端のテクノロジーを活用してイノベーションを創造する、東京大学発スタートアップ。ハード・ソフト問わず、様々な技術領域において自社製品の研究開発に取り組むとともに、オーダーメイドで企業の課題に合わせたソリューションの提供や研究の支援を行っている。

関連記事
東大発スタートアップTRUST SMITHが創業以来金融機関からの融資のみで総額1.1億円を調達
東大発AIスタートアップTRUST SMITHが障害物回避型アームのアルゴリズムで特許取得

カテゴリー:人工知能・AI
タグ:ADEKA(企業)AI / 人工知能(用語)OCR / 光学文字認識(用語)画像認識(用語)東京大学(組織)TRUST SMITH(企業)日本(国・地域)

SLAITのリアルタイム手話翻訳はオンラインでのコミュニケーションをアクセシブルにする

世界中で多くの人が手話を使っているが、スペイン語や中国語、ラテン語にまで自動翻訳があるのに手話を使えない人たちのための自動翻訳はない。SLAITは一般的に利用できる最初の手話翻訳ツールであると主張している。普通のコンピュータとウェブカメラだけで、出発点としてまずはおよそ200語と単純な文を翻訳することができる。

聴覚に障がいのある人や何らかの状況で音声による発話が困難な人はたくさん存在し、健聴者と同じ一般的なITツールを使っている。もちろん現在はメールやテキストチャットが便利に使われているが、顔を合わせてのコミュニケーションの代わりにはならない。そして残念ながら手話を書き言葉や話し言葉に変える手軽な方法はなく、大きなバリアとして残っている。

我々は自動手話翻訳(ほとんどはアメリカ手話)の試みを何年も前から見てきた。2012年にMicrosoftは、同社のイマジンカップで手袋で手の動きを追跡した学生チームを表彰した。筆者は2018年に、複数のカメラを使って位置を3Dで把握する手話翻訳ブースに取り組むSignAllの記事を書いた。2019年には、GoogleのAIラボが研究しているMediaPipeという新しいハンドトラッキングのアルゴリズムが将来的には手話の読み取りにつながるかもしれないことに注目した。そして実際に、ほぼその通りになった。

SLAITはドイツのAachen University of Applied Sciencesでの研究から生まれたスタートアップで、共同創業者のAntonio Domènech(アントニオ・ドメネク)氏はこの大学でMediaPipeと専用のニューラルネットワークを使った小規模なアメリカ手話認識エンジンを開発した。基本的な概念を実証したドメネク氏は、共同創業者のEvgeny Fomin(エフゲニー・フォーミン)氏、William Vicars(ウィリアム・ビカーズ)氏とともにSLAITを始めた。その後メンバーは、最初は100種類、現在では200種類のアメリカ手話の動きと単純な文を認識するシステムを構築した。翻訳はオフラインで実行され、比較的最近のスマートフォンやコンピュータ上でほぼリアルタイムに動作する。

画像クレジット:SLAIT

SLAITはこのシステムを教育や開発に使えるようにする計画で、重要度の高い一般向けのアプリケーションにする前に、データセットを拡張してモデルを向上させる。

現在のモデルは少人数のチームで驚くほど短期間で開発されたが、もちろん簡単ではなかった。MediaPipeは手や指の動きを追跡できるオープンソースの有効な手段であることは確かだが、強力な機械学習モデルに欠かせない構成要素はデータだ。この場合のデータとは実際に使われているアメリカ手話のビデオのデータで(ビデオを翻訳することになるので)、利用できるデータはそれほど大量には存在しない。

SLAITが最近DeafITカンファレンスのプレゼンテーションで説明したように、チームはまずMicrosoftの古いデータベースを使って評価をしたが、オーストラリアの新しい学術データベースの方がたくさんあり質も良いことを発見した。これにより200種類の手話をリアルタイムに92%の正確性で識別するモデルを作ることができた。これにソーシャルメディアから集めた手話のビデオ(もちろん許可を得た上で)や、手話通訳付きの行政発表を加えた。しかしまだ足りない。

プロトタイプの動作を示すGIF。一般向けのプロダクトにはもちろんワイヤフレームは表示されない(画像クレジット:SLAIT)

SLAITはこのプラットフォームを聴覚障がい者やアメリカ手話学習者のコミュニティに公開する意向だ。コミュニティは自分たちの利用がシステムの改良に生かされることに対して抵抗がないことが望ましい。

当然、SLAITのシステムは現状でも大きな意義のあるツールであると考えられる。同社の翻訳モデルは開発途上ではあるものの、多くの人の生活を変える可能性があるからだ。現在、ビデオ通話は増え続け、おそらく今後も増えていくが、アクセシビリティは置き去りにされている。自動キャプション、文字起こし、要約を提供するプラットフォームはわずかにあるが、手話を認識するプラットフォームはない。しかし同社のツールがあれば、無視されがちなチャット機能ではなく通常の手話でビデオ通話に自然に参加できるようになるだろう。

SLAITのエフゲニー・フォーミン氏は次のように述べた。「短期的には200語のモデルが利用できることを実証し、結果は日々進歩しています。中期的には手話を読み取れるコンシューマ向けアプリをリリースする予定です。しかし、あらゆる手話の動きをカバーするライブラリにするには、すべきことがたくさんあります。我々は将来的にこれを現実にするために懸命に努めています。我々のミッションは聴覚に障がいのある人々のコミュニティのためにアクセシビリティを徹底的に向上させることです」。

左から、エフゲニー・フォーミン氏、アントニオ・ドメネク氏、ウィリアム・ビカーズ氏。画像クレジット:SLAIT

フォーミン氏は「完全な」完成品にはならないだろうと慎重な姿勢を見せる。どんな言語の翻訳も置き換えも近似値でしかないのと一緒で、重要なのは多くの人にとって実用的なものになることであり、数百語はその長い道のりの出発点だ。データが増えれば新しい語が語彙に追加されるし、複数の動きを組み合わせた新しいフレーズも同様だ。そしてコアセットのパフォーマンスは向上していく。

現在SLAITは、プロトタイプを公開し創業者以外の人材を雇ってチームを大きくするための最初の資金を求めている。フォーミン氏は、関心は寄せられているものの計画とビジョンを真に理解してくれる投資家と関係を構築したいと述べた。

SLAITはデータを増やし機械学習モデルを改良してエンジン自体の信頼性が向上したら、開発をさらに進めてアプリを他の製品やサービスと統合しようと検討している。現時点の製品はPoC(概念実証)の段階だが、実証はされている。さらに開発を進めれば急成長して、聴覚に障がいのある人々が何十年も待ち望んできたものを提供できるだろう。

関連記事
ウクライナの学生チームが手話を通訳する手袋を開発した
SignAllはゆっくりと、しかし着実に手話通訳プラットフォームを構築中

カテゴリー:人工知能・AI
タグ:SLAIT手話機械翻訳アクセシビリティ

画像クレジット:Slait.ai

原文へ

(文:Devin Coldewey、翻訳:Kaori Koyama)

アマゾンがML学習用カーレースDeepRacerデバイスソフトのオープンソース化を発表

Amazon(アマゾン)が2018年にAWS DeepRacerを発表した際、それは開発者が機械学習を学ぶのを助ける楽しい方法として意図されていた。その後進化を遂げ、DeepRacerのコンペを取り入れてきたが、米国時間4月27日に同社は新しい機能を追加することを発表した。それは、ミニカーを走らせるために同社が作成したソフトウェアをオープンソース化するというものだ。

DeepRacerは、Ubuntu LinuxとアマゾンのRobot Operating System(ROS)を搭載したミニコンピュータを中核としている。同社はデバイスソフトウェアを開発者に公開することで、クルマのデフォルト動作を変更できるようになり、よりクリエイティブな利用を促進できると考えている。

「AWS DeepRacerのデバイスコードがオープンソース化されたことで、現在トラックで使用されているレーシングカーのデフォルト動作を迅速かつ簡単に変更できます。対策を講じて他のクルマが追い越すのをブロックしたいですか?A地点からB地点まで自動車を速く走らせるために、独自のカスタムアルゴリズムを導入したいですか?あなたはそれを夢見てコードを書くだけでいいのです」と、アマゾンはオープンソース化を発表したブログ記事で述べている。

2018年に車両を導入した後、アマゾンはDeepRacerのリーグを展開し、最近ではバーチャルレースも実施している。実際に同社は2020年3月にリーグを再編し、新たな人々がこの技術に関わるのを奨励した。オープンソースのコンポーネントを追加することで開発者が自分で作る機会を得て、これまで不可能だった新しい利用層を車両に追加しさらに関心が高まる可能性がある。

AWSのMarcia Villalba(マルシア・ビラルバ)氏が3月のブログで述べたように、これは開発者に機械学習の基礎を教えることを目的としている。

「AWS DeepRacerはAWS DeepRacerコンソールで仮想的にレースをしたり、AWSや顧客のイベントで物理的にレースを行ったりすることで、『強化学習』モデルをテストするために設計された1/18スケールの自律的なレースカーです。AWS DeepRacerはMLの経験のありなしに関わらず、あらゆるスキルレベルの開発者を対象としています。AWS DeepRacerを使ってRLを学ぶ際には、AWS DeepRacer Leagueに参加して楽しくかつ競争の激しい環境で機械学習を体験できます」。

クルマのソフトウェアをカスタマイズしたい場合、プロジェクトのドキュメントはGitHubAWS DeepRacer Open Sourceページで入手でき、6つのサンプルプロジェクトから始めることができる。

関連記事
Amazonが開発者たちに機械学習を教えるために、縮小版自動運転車を発表
AWSがML学習用カーレースDeepRacer Leagueの敷居を下げて新人を歓迎

カテゴリー:人工知能・AI
タグ:AmazonDeepRacerAWS機械学習

画像クレジット:Amazon

原文へ

(文:Ron Miller、翻訳:塚本直樹 / Twitter

AIスタートアップ英Facultyが将来の医療需要を予測する事業を同国保健サービスから受注

VCが支援する人工知能スタートアップのFaculty(ファカルティ)が、新型コロナウイルスパンデミック対応状況から抽出したデータに基づいて、患者が将来必要とするサービスの予測を向上させることを目的とするNHS(英国民保健サービス)の事業の入札を勝ち取った。

Facultyは2019年12月にシリーズAラウンドで英国拠点のVCであるLocal Globe、GMG Ventures、そしてSkypeの創業チームのエンジニアの1人であるJaan Tallinn(ジャン・タリン)氏から1050万ドル(約11億3500万円)を調達し、評価額は約1億ドル(約108億円)になった。

Facultyは、パンデミック中にNHSのために開発したEarly Warning System(EWS)の上に患者の将来の予測システムを構築するためにNHSイングランド、NHS Improvementと協業する。ベイズの階層モデリングに基づいて、EWSは病院が必要とするスタッフやベッド、機器を配置できるよう、新規感染者数が急増する可能性について病院に警告するために、集合データ(たとえば新型コロナの陽性患者数、救急通報、モビリティデータなど)を使う、とFacultyは話す。この学習をパンデミック対応だけでなく、サービス提供や患者のケアの改善、A&E(救急外来)需要や冬場のプレッシャーの予測など、サービス全体に応用しようとしている。

Facultyはまた、英国新型コロナの胸部画像データベース(NCCID)を開発したNHS AI LabのためにパートナーとしてNHSXとも協業する。

Facultyは、テロリストのデータベースにAIを応用するために英国内務省と、そしてBBCやeasy Jetとも協業していると報じられていた

筆者はFacultyのCOOであるRichard Sargeant(リチャード・サージェント)氏に、Facultyが「英国におけるPalantir」だと思うか尋ねた(ビッグデータ分析のソフトウェア会社であるPalantirもパンデミック中にNHSと協業した)。するとサージェント氏は「私が思うに、当社はかなり効果的でスケーラブルなAIの会社です。英国においてだけでなく、当社は米国、欧州、アジアでも展開しています。当社は引き続き事業を拡大します。当社は成長していて、今後も成長します。というのも、AIは市民や顧客のために物事を良くすることができると確信しているからです。Palantirは実際にはAIを実行していません。大まかに言えば彼らはデータエンジニアリングをしています。そしてNHSでは効果的だということがわかりました。Facultyはある種、独自の立場をとっていると思います」と述べた。

サージェント氏は、FacultyがPalantirとは異なる役割を持っていると話した。「Palantirはデータパイプラインでサポートしました。そしてPalantirは多くのデータを引き出すのに自前のソフトウェアを使っています。しかしPalantirは機械学習の会社ではなく、データを集結することを専門としています。NHS全体のデータはむしろ群島のようです。数百もの異なる場所からのデータであり、それらのデータをまとめられることで、中央レベル、ローカルレベルの両方で機械学習を行うのがかなり簡単になります。初期の警報システムと異なるのは、機械学習を使っているだけでなく、医療関係者や管理者になぜモデルがその結果を予想しているのかを理解できるよう説明しています。これはかなり最先端のものであり、Facultyが専門とするものです。Palantirは専門としていません」。

なぜFacultyがVCをひきつけたのかについても筆者は尋ねた。通常VCはスケーラブルなプロダクトを持っているスタートアップに投資する。「いい質問で、当社がよく尋ねられるものです。サービス事業として、Facultyは他の昔ながらのソフトウェアとは少し異なっていると思っています。AIは『一度で完了』のプロダクトではありませんし、人々が毎回最初から作り出すものでもありません。しかし我々が行うことの構成要素があります。繰り返し使えるものです。またモデルそのものは常にあつらえのものです。オーダーメードであること、一般的であること、あるいは包括的であることの組み合わせであり、それがFacultyを形成していて、その点が少し異なります」とサージェント氏は答えた。

Facultyは政府との契約に関して議論を巻き起こしてもいる。2020年、NHSの新型コロナデータストア運営をサポートするという230万ポンド(約3億4500万円)の契約を同社が獲得したとき、英国の大臣がFacultyの株式9万ポンド(約1350万円)分を所有していたことが明らかになった。

カテゴリー:人工知能・AI
タグ:NHSFacultyイギリス新型コロナウイルス

画像クレジット:Win McNamee / Getty Images

原文へ

(文:Mike Butcher、翻訳:Nariko Mizoguchi

ディープフェイク技術が衛星地図を模造

AIが作り出した合成画像いわゆる「ディープフェイク」に関して、主に本人の同意なく作られた人間の画像が激しく非難されているが、この技術は他の分野でも危険であり、そしてときにはおもしろい。たとえば研究者たちは、衛星画像を操作して、本物そっくりだが完全に偽のオーバーヘッドマップを作れることを示した。

ワシントン大学の助教授Bo Zhao(ボー・ジャオ)氏が指導し論文も書いたその研究は、警告のためではなく、このやや悪名高い技術を地図の作成に応用した場合にありうるリスクとチャンスを示すために行われた。彼らのやり方は、一般的にディープフェイクとして知られているものよりもむしろ、画像を印象派風、クレヨン画風など任意のスタイルに変換する「画風変換」に似ている。

チームは機械学習のシステムを、シアトルとタコマ近郊、および北京という3つの都市の衛星画像でトレーニングした。絵が画家や媒体によって違うように、それぞれの画像には視像としての明確な違いがある。たとえばシアトルは市街地を覆う大きな緑があり道路は狭い。一方、北京はもっとモノクロームだ。研究に使われた画像では、ビルが長い影を地上に落としている。システムは、GoogleやAppleの街路地図を、これら衛星からのビューに結びつけることを学んだ。

その結果得られた機械学習エージェントは、街路地図を与えられると本物らしく見える偽の衛星画像を、それらの都市のように見えるものがあれば返す。下の画像では、左上の地図は右上のタコマの衛星画像に対応している。一方その下の画像は、色調などの画風がシアトル風と北京風だ。

画像クレジット:Zhao et al.

よく見ると、フェイクマップは本物ほどシャープでなく、行き止まりの道路といった論理的な不整合性もある。しかしざっと見ると、シアトルと北京の画像は完全に本物のようだ。

このようなフェイクマップは、合法的であってもなくっても、その利用についてはよく考える必要がある。研究者たちが提案しているのは、衛星画像が手に入らないような場所の作成シミュレーションだ。そのような都市の、衛星画像らしきものを作ることはできるだろうし、緑地を拡張するといった都市計画にも利用できる。必ずしもこのシステムを、他の場所の模造に使う必要はない。たとえば同じ都市の人口過密地や、道路が広い地区で訓練することもできるだろう。

想像の羽を広げれば、やや遊びにも近いようなこのプロジェクトで、古代の手描きの地図から本物そっくりの現代的な地図を作ることもできるのではないだろうか。

このような技術があまり建設的でない目的で使われた場合に備えて、この研究論文は、色や特徴をよく調べてそのような模造画像を検出する方法にも目を向けている。

ワシントン大学のニュース記事の中でジャオ氏は、この研究が「衛星画像などの地理空間的データの絶対的な信頼性」という一般的な想定に挑戦している、と述べている。他のメディアでもそうだが、新たな脅威が登場すれば、そんなおめでたい考えは棚上げにされるべきだ。論文の全文はCartography and Geographic Information Scienceで読むことができる。

カテゴリー:人工知能・AI
タグ:地図ワシントン大学ディープフェイク

画像クレジット:SEAN GLADWELL/Getty Images

原文へ

(文:Devin Coldewey、翻訳:Hiroshi Iwatani)

組織や企業の教育コンテンツに特化したAIビデオ生成プラットフォームSynthesiaが13.5億円調達

Alが進歩し、テクノロジーを活用して私たちにできることは急激に増えている(良くも悪くも)。Alビデオ生成プラットフォームのSynthesiaは、動画コンテンツ制作をできるだけシンプルに効率良くすることを目指している。そしてFirstMark Capitalは、Synthesiaが世の中を悪くするのではなく良くすることに賭けている。

SynthesiaはFirstMark Capitalが主導したシリーズAを1250万ドル(約13億5000万円)で完了したと発表した。このラウンドにはNetlifyのCEOであるChristian Bach(クリスチャン・バッハ)氏やTwilioのVPでコミュニケーション担当のMichael Buckley(マイケル・バックリー)氏といったエンジェル投資家、そしてこれまでにも投資してきたLDV CapitalMMC VenturesSeedcamp、Mark Cuban(マーク・キューバン)氏、Taavet Hinrikus(ターベット・ヒンリクス)氏、Martin Varsavsky(マーティン・バルサフスキー)氏、TinyVCも参加した。

Synthesiaのテクノロジーには多くの使い道があるが、同社は今のところ組織や企業の教育コンテンツに特化している。トレーニングビデオや、企業や部署の最新情報を伝えるビデオを制作するようなケースだ。

使い方はこんな感じだ。ユーザーは、用意されている俳優から登場人物を選んだり(俳優には登場するビデオに応じてギャラが支払われる)、自身のビデオをアップロードしてアバターを作ったりする。ユーザー自身の声やアバターを使うにはどのようなビデオやオーディオを送信すればいいか、ユーザーに対して手順が示される。

その後、ユーザーは台本を入力し、テキストや画像、図形などのコンポーネントを追加する。すると最終的にはビデオ制作や編集のスキルをまったく使わずに、ビデオが生成される。ビデオのアップデートや編集も従来のようなビデオ編集の作業をする必要はなく、とても簡単だ。

Synthesiaはこのプラットフォームが悪用されかねないことを十分に承知した上で、セキュリティと認証のレイヤーを複数組み込み、自分のアバターがビデオ内でどのように使われるのかをユーザーが確認し、生成や公開の前に台本やビデオをチェックできるようにしている。

このプラットフォームは企業が毎年提供するトレーニングや教育用のビデオに使うだけでなく、もっとクリエイティブな用途で使うこともできる。一般に、ビデオコンテンツはテキストやその他のコンテンツよりも説得力と魅力がある。そこで、上司やCEOから最新情報を知らせる毎週のメールがビデオのかたちで送られてくるとしたらどうだろうか。Synthesiaを使えば、そのようなビデオをとても簡単に安いコストで迅速に制作することができる。

Synthesiaには1シートで1カ月30ドル(約3200円)のエントリーレベルプランがあり、1カ月に10分間のビデオを作ることができる。1カ月500ドル(約5万4000円)からのエンタープライズレベルプランも用意され、もっと長時間のビデオを作ることができて追加の機能もある。

同社は調達した資金で顧客獲得と製品開発を加速させる計画だ。

Synthesiaはエンタープライズビデオプラットフォームからさらに拡張して、組織がSynthesiaのテクノロジーを自社のシステムに組み込み、さらにビデオの配布もできるようにするAPIも開発している。共同創業者でCEOのVictor Riparbelli(ビクター・リパーベル)氏は、ユーザーが株式の銘柄を選択して自分の電話番号を関連づけると、自動で毎日の株価情報を示すビデオが作られて指定した電話番号に送られるという例を示した。

エンタープライズ向け製品のSTUDIOは2020年夏にパブリックベータが公開され、それ以降1000社を超える企業に使用されている。

カテゴリー:人工知能・AI
タグ:Synthesia動画制作資金調達

画像クレジット:Synthesia

原文へ

(文:Jordan Crook、翻訳:Kaori Koyama)

貨物船にコンピュータービジョンを後付けして衝突事故を防ぐOrca AIがシリーズAで約14億円調達

テルアビブのOrca AIは、貨物船に後付け搭載して航行や衝突回避を改善できるコンピュータービジョンのスタートアップだ。同社はこのたびシリーズAラウンドで1300万ドル(約14億円)の資金を調達し、調達総額を1550万ドル(約16億7500万円)以上に引き上げた。ほとんどの貨物船には防犯カメラが搭載されているが、コンピュータービジョンカメラは珍しい存在だ。Orca AIは同社のソリューションによって、すでに海上にいる船舶に自律的な誘導方法を導入できると期待している。

海難事故は年間4000件以上発生しており、その主な原因はヒューマンエラーだ。同社によると、新型コロナウイルスのパンデミックにより定期的な乗組員の交代が難しくなっているため、この状況は悪化しているという。最近のスエズ運河での事故は、この業界がいかに重要であるかを浮き彫りにした。

今回の資金調達はOCV Partnersが主導し、同社プリンシパルのZohar Loshitzer(ゾハール・ロシッツァー)氏がOrca AIの取締役に就任した。Mizmaa VenturesとPlayfair Capitalも本ラウンドに参加した。

この会社は、海軍技術のエキスパートであるYarden Gross(ヤルデン・グロス)氏とDor Raviv(ドル・ラヴィヴ)氏によって設立された。後者は、元イスラエル海軍のコンピュータービジョンの専門家だ。同社の顧客には、Kirby、Ray Car Carriers、NYKなどがある。

Orca AIのAIベースのナビゲーションと船舶追跡システムは、ビジョンセンサー、赤外線カメラ、サーマル・低照度カメラに加え、環境を見て危険な状況を乗組員に知らせるアルゴリズムを使い、航行が困難な状況や混雑した水路で船舶をサポートする。

今回の発表にあたり、共同創業者兼CEOのグロス氏は次のように述べた。「海運業界は、技術革新の面で航空産業に比べまだ大きく遅れています。船舶は、ますます混雑する水路、悪天候、視界の悪い状況に対処し、しばしば高価な貨物を積んで困難な航海を強いられています。当社のソリューションは、世界中のあらゆる船舶にユニークな洞察力とデータを提供し、将来的にこのような困難な状況や衝突を減らすのに役立ちます」。

OCVのプリンシパルであるロシッツァー氏はこう述べた。「商業海運は歴史的に規制が厳しく、伝統的な産業でした。しかし現在では、安全性と効率性を高めるための技術的なソリューションの導入に前向きな変化が見られるようになりました」。

カテゴリー:人工知能・AI
タグ:Orca AIコンピュータービジョン資金調達イスラエル海運業

画像クレジット:Orca AI

原文へ

(文:Mike Butcher、翻訳:Aya Nakazato)

データ活用支援のDATAFLUCTが3億円調達、スタートアップスタジオモデルで2年後の上場目指す

「多くの企業は、データを会社の中で腐らせてしまっています」。そう話すのは、データサイエンスビジネスを展開するDATAFLUCT(データフラクト)CEOの久米村隼人氏だ。同社は2021年4月20日、東京大学エッジキャピタルパートナーズよりシリーズAで3億円の資金調達を行ったと発表した。

埋もれているデータに「価値」を与える

DATAFLUCTは、企業がもつデータを最大限に活用するためのさまざまなサービスを提供している。企業に「埋もれているデータ」と、同社が保有する外部データや機械学習アルゴリズムを組み合わせることで、新しいインサイトを創造する。

同社が提供するサービスの1つは、大型スーパーの新規出店候補地を探すサポートだ。これは、クライアントであるスーパーの過去の出店履歴や売上データなどを取得し、立地条件を当てはめるという手法をとる。例えば、駅からの距離・フロアの面積・周辺エリアの人流・近隣にある学校や企業など、200から300ポイントにおよぶデータをAIに学習させる。これにより「○○の条件下では売上は○○」といった推測を行い、新規出店の場所を決定していく。

画像クレジット:DATAFLUCT

久米村氏は「もちろん、実際に出店してみないことには正確な売上げはわかりません。例えば、周辺に橋があると人の流れが大きく変わったり、ライバル店の商圏に影響されたりなど、科学できない部分はある。でも私達が大切にしているのは、『ダメな選択肢を削る』ということです。仮に毎月100件の物件を検討するときに、そもそも商機がないところをあらかじめ除外できるサービスは、企業にとって非常に大きいインパクトをもたらします」という。

同社の事業領域は、不動産にとどとどまらない。メディア企業向けに「さまざまな媒体での広告出稿の効果」をクリック1つでビジュアル化するツール。食品メーカー向けに「油を変える最適なタイミング」を示すツール。物流会社向けには「最も効率よく配送を完了できる道順」を示すツールなど、多岐にわたる業界にDXソリューションを提供している。

同時多発的にプロダクトをローンチ

しかし「データを活用したDXソリューション」は、DATAFLUCTが展開する事業のほんの一部にすぎない。同社は創業から約18カ月間でモビリティ、スマートシティ、EdTech、スマートグリッド関連など13プロダクト(SaaS)を矢継ぎ早にローンチ。これは、同社が各ユニットに独立採算制を採用するスタートアップスタジオだからこそ実現した。一方で「JAXA認定ベンチャー」としての顔も持ち、衛星データ解析を活用したSDGs事業を意欲的に行う。久米村氏自身も「うちは常識から逸脱していることが多すぎて、VCにも理解されにくい」と苦笑いだ。

それにしても「なぜさまざまな業界に同時に参入する必要があるのか?」と思われる読者がいるかもしれない。久米村氏はこう説明する。「私達のサービスは、そもそも社会課題を解決するという出発点から始まっています。例えば、食品廃棄ロス問題を解決したいとすると、生産者(農家)、製造業、卸売、スーパーなど、サプライチェーン上のすべての課題を解決する必要がある。私達は、これらをデータで統合することで解決に導きたいと考えています。例えば、衛星データを活用した野菜の収穫支援から、店舗での需要予測アルゴリズム、ダイナミックプライシングの導入まで、包括的にデータを活用することでサプライチェーンの効率化を実現したい。そのために、これまで同時多発的にプロダクトをローンチし、全領域を攻めてきました」。

データ活用を通じて社会の変革を目指す

DATAFLUCTのCEOである久米村氏は、これまでベネッセコーポレーション、リクルートマーケティングパートナーズ、日本経済新聞社などを渡り歩き、データ分析を活用した新規事業開発を主にてがけてきた。「私自身、DXコンサルで約70業界に携わり、立ち上げた新規事業は30を超えます。物流のことを聞かれてもおおよそわかるし、ヘルスケアのことを聞かれてもおおよそわかる。顧客が言ったことに対して、すぐに打ち返せるパワーが強みだと思っています」。

独立のきっかけは、同氏が会社員時代に持っていた不満だった。「ハッキリいうと、コンサル会社に金を払いすぎていると思ったのです。彼らの働きを見て『自分だったらもっとうまくできるのではないか』と」。それでも独立後は、新型コロナウイルスの影響により、リアル店舗を対象とした初期のプロダクトから一時撤退を余儀なくされた。しかし、データ活用のニーズを持つ多様な業種の企業から声がかかり、DXソリューションの提供へとピボットしていくうちに事業が軌道に乗った。

今回調達した3億円の主な使途は人材採用だ。久米村氏は「2年後の上場を目指しています。でも2年だとできることは少ない。お金稼ぎはできるかもしれないが、社会の変革はできない。5年先、10年先にはじめてDATAFLUCTの価値がでてくるのかな、と考えています」と話す。

「21世紀の石油」ともいわれるデータ。もし今後、多くの企業が社内に眠ったままだったデータの価値を掘り起こすことができるようになれば、DATAFLUCTが目指す社会課題の解決も夢物語ではなくなるだろう。

関連記事:DATAFLUCTがビッグデータを活用した青果物サプライチェーンの垂直統合・DXを支援するサービスを開始

カテゴリー:人工知能・AI
タグ:DATAFLUCTデータサイエンス東京大学エッジキャピタルパートナーズ資金調達DX日本

画像クレジット:DATAFLUCT