BlueOceanはAIを活用し迅速にブランドパフォーマンスを測定、改善の提案もしてくれる

BlueOceanは企業ブランドのパフォーマンス測定と改善を目的とするスタートアップだ。同種のこれまでのサービスと比べて比較的手頃なコストでスピードも非常に速い。

CEOのGrant McDougal(グラント・マクドゥーガル)氏、COO兼プレジデントのLiza Nebel(ライザ・ネベル)氏にインタビューした。BlueOceanのファウンダーはこの2人に加えてチーフデータサイエンティストのMatthew Gross(マシュー・グロス)氏となる。ファウンダーたちはこのテクノロジーを2年前から開発してきた。BlueOceanのこのほど正式にスタートしたところだが、すでにMicrosoft(マイクロソフト)、Panda Express、Pabst Blue Ribbonなどの著名ブランドに協力している。

BlueOceanはブランドオーディットの分野に焦点を当てている。これはブランドの詳細なパフォーマンス分析で、機能している側面と機能していない側面を識別し評価するものだ。ネベル氏(Ogilvyでのブランドとデジタル戦略を担当した経験がある)によれば、従来のブランド分析は1回に数百万ドル(数億円)の費用がかかり、「机上の空論」のようなレポートが提出されることがよくあるという。

これに対してBlueOceanでは、ブランド側は自社のウェブイトとライバルのリストという2種類の情報を用意するだけでよい。これだけで1週間後にはブランド審査を受けるが、その費用はわずか1万7000ドル(約180万円)で、改善に関するに推奨事項も含まれている。

これが可能になったのはBlue Oceanが「オートメーションファースト」というアプローチを取ったからだ。 同社はAIのアルゴリズムを利用してそれぞれの業種ごとに数百のデータソースを選び出す。マクドゥーガル氏によればアルゴリズムは「正しい分類法はどのようなものか?」「 どのようにして正しいデータを取得できるか?」といった重要な問題に答えを与えてくれるという。

BlueOceanの創業者であるグラント・マクドゥーガル氏とライザ・ネベル氏。(画像クレジット:BlueOcean)

「組織のトップと話し合うのが我々の戦略だ。マーケティングでもその他の分野でも最高責任者クラスと話をする。我々のアドバイスを必要としているのは、このレベルの経営幹部だからだ」とマクドゥーガル氏は付け加えた。

ネベル氏によれば BlueOceanのクライアントに大手酒造会社があり、最近、既存のブランド下にハードセルツァー(アルコール入り炭酸水)のシリーズを立ち上げた。BlueOceanがブランド審査を行ったところ「ハードセルツァーは既存ブランドではなく別ブランドにしたほうがよい」という結果となった。酒造会社は、この提案に基づいて3つの異なるブランドでハードセルツァーを販売する計画だという。

ネベル氏はサービスの説明として、我らがTechCrunchについても簡単なブランド審査をしてくれた。この「5分バージョン」の審査はメディアポジショニング、メッセージ性、提供サービス、既存顧客、見込み顧客といった観点からTechCrunchのパフォーマンスを分析するもので、総合評価のスコアは「そこそこよい」程度の97(ただし「記憶に残る」と「刺激的」の2点では優秀なスコア)だった。改善の提案には「コンテンツを着実にソーシャルメディアに継続的に公開する」「モバイルアプリのユーザーエクスペリエンスを改善する」などが含まれていた。

マイクロソフトのブランド戦略担当ディレクターであるTim Hoppin(ティム・ホッピン)氏は声明の中で「BlueOceanのツールを利用することで、すべてのプロダクトをブランドというレンズを通してモニター、理解し、施策を実行する能力を改善できる。我々の製品を毎日使っている世界の何千万ものユーザーとの関係をさらに深めることができるのはエキサイティングな経験だ」 という。

関連記事:Startup branding: how much does it really cost?(未訳記事)

画像クレジット:BlueOcean

原文へ
(翻訳:滑川海彦@Facebook

Amazonが購入品を自ら識別するスマートなショッピングカート「Dash Cart」をテスト

Amazon(アマゾン)は米国時間7月14日、最新のスマートストア技術であるAmazon Dach Cart(ダッシュカート)を披露した。これは食料品スーパー用のショッピングカートで、中に入れた商品を識別し代金を請求するというものだ。このカートはまず、2020年中にカリフォルニア州ウッドランドヒルズに開店予定のAmazonの食料品スーパーに導入される。

今のところこのカートは、カート一杯に商品を積み上げるようないつもの買い物には向かず、ショッピングバッグ1つか2つの少量から中量の買い物に対応するとAmazonは説明している。

これは、カートに入れられた商品の識別に関する技術的な制約によるものだ。

Amazon Dash Cartは、コンピュータービジョンアルゴリズムとセンサーフュージョンの組み合わせでカートの中の商品を識別すると、Amazonは話している。そして店内のDash Cart専用レーンを抜けるとセンサーがカートを識別し、Amazonアカウントに登録したクレジットカードで精算が行われる。

カートを使用するには、まずAmazonアプリで示されるQRコードをカートのリーダーに読み取らせる。そしてカートにショッピングバッグを1つまたは2つセットすれば、買い物を始められる。カートに商品を入れたら、ピーという確認音を待つ。確認に失敗するとカートがオレンジ色に光るので、そのときはやり直す。

センサー技術に加えてこのカートの上面には、自分のAlexa(アレクサ)買い物リストにアクセスできる画面もあり、そこでリストに印を付けたり、現在の合計金額の確認ができる。クーポンのスキャナーも備えているので、買い物をしながらクーポンを使うことも可能だ。

Amazonが提供している動画(非常にざっくりした内容だが)によると、商品のバーコードをカートに見せる必要があるようだ。例えばこの動画には、買い物客が商品をカートに入れる前に、指でバーコードが見えるようにしている場面がある。また、買い物客はバーコードを自分とカートの画面に向けてからカートに入れている。

別の場面では、野菜など「バーコードのない商品の入れ方」も示されている。この場合は買い物客が画面でPLUコードを入力して、重さを確認している。

Amazonのウェブサイトではバーコードの読み取りに関する詳細は説明されていないが、カートが「コンピュータービジョン」と「センサーフュージョン」を利用していることが書かれている。それは、このカートがAmazonの既存の技術を一歩先に進めたものであることを示唆している。「Just Walk Out(そのまま店を出られる)」というのがAmazzon Goストアの売り文句だ。だがJust Walk Outの店舗には、商品の陳列棚に組み込まれたセンサー技術とカメラを搭載したシステムからのデータをコンピュータービジョンで処理し、商品を取ったり戻したりを認識している。それに対してDash Cartは、Amazon Goストアではなく一般の食料品スーパーでのテストが予定されている。

このカートが単なる車輪付きのバーコードリーダーではないことは明らかだが、Amazonはそのバーコードの読み取り技術を完全には明らかにしていない。

この新技術の仕組みついてAmazonに問い合わせたところ、実際にカートは「素早く商品を特定するために、最初にバーコードを探す」のだと教えてくれた。

買い物客の手でバーコードが隠れて読み取れない場合などは、コンピュータービジョンのアルゴリズムが商品の特定を試みるという。

コンビニ程度の広さのAmazon Goストアと違い、Just Walk Out技術を一般の食料品スーパーに持ち込むのは大変な困難がともなう。食料品スーパーの商品点数は多く、すべてを識別できなければならない上に、新しい商品がどんどん入ってくるからだ。

2020年3月にAmazonは、「レジなし」ストアの技術を他の小売店に販売すると発表した。スマートカートの技術がテストを重ね改良されたなら、この技術にも同様の計画が進められるかも知れない。そこを聞いてみたが、Amazonは将来の計画については何も話さなかった。

画像クレジット:Amazon

原文へ
(翻訳:金井哲夫)

位置情報データ分析のクロスロケーションズが2.2億円の資金調達、顧客の推定居住エリアにSNS広告配信

位置情報 ロケーションテック クロスロケーションズ Location AI Platform

位置情報ビッグデータ活用のクロスロケーションズは7月14日、第三者割当増資により2億2000万円の資金調達を実施したと発表した。引受先は東京理科大学ベンチャーファンド。合わせて、位置情報ビッグデータ活用クラウド型プラットフォーム「Location AI Platform」(LAP。ロケーション エーアイ プラットフォーム)の大幅刷新を明らかにした。

クロスロケーションズは、「多種多様な位置情報や空間情報を意味のある形で結合・解析・可視化し、誰でも活用できるようにすること」をミッションとする、2017年11月設立のスタートアップ企業。位置情報ビッグデータの収集・集計、AIによる分析・視覚化、また活用法開発などにより、新しい情報と価値の創出を可能とする技術「ロケーションテック」の開発・推進に注力している。

今回調達した資金は、 LAPのバージョンアップ開発をはじめ、同社独自技術である位置情報データ解析技術「Location Engine」の高度化や市場導入の推進に対応する資金として活用する。

LAPは、AIが位置情報ビッグデータから消費者行動の分析・見える化を行った上で、エリアマーケティングの実施と効果測定を一気通貫で実行できるプラットフォーム。

新型コロナウイルス感染症拡大の影響を受けた消費者行動など、毎日更新される位置情報ビッグデータから読み取れる市場変化および消費者行動変化を捉え、部門ごと・業務ごとに把握・確認でき、即座にマーケティング活動に利用できるようLAPの大幅なバージョンアップを行った。

LAPの位置情報ビッグデータ解析機能である「人流モニタリング」や「商圏分析」などの各機能のウィジェット化と、ウィジェットを自由に組み合わせて1つのユーザーインターフェースとして把握・確認できる「LAP ダッシュボード」機能をリリース。LAPの解析結果をマーケティング活動につなぎ、商圏が変わった場所・ユーザーに消費者調査を行える「XL ロケーションベースアンケート」、サイネージ広告やSNS広告が出稿可能な「XL ロケーションベース広告」も提供を開始している。

位置情報 ロケーションテック クロスロケーションズ Location AI Platform

XL ロケーションベース広告では、SNSで保有するユーザープロファイルでのターゲティングに加え、LAPから抽出した位置情報ビッグデータの解析結果により、消費者のリアルな行動変化を組み合わせたターゲティングユーザーの設定が可能。特にLAPによる解析では、任意の店舗利用者の居住エリア(推定)だけでなく、前日に来店したと推測される人々も広告配信のターゲットに選定できるという。

また、スマホアプリへのオンライン広告、サイネージ広告に加え、LINE、Facebook、InstagramといったSNSへの広告配信も可能としている。

関連記事
米国でケンタやマックが活用する位置情報データスタートアップのBluedotが約9.8億円を調達
位置情報データ分析のPlacer.aiがシリーズAで約13億円を調達
位置情報アプリ「Family Locator」からリアルタイムで情報が流出していた
位置情報からライフスタイルを推測して広告を配信するジオロジックが1億円を資金調達

大阪大学発スタートアップPGVが1.5億円の調達、小型軽量な脳波センサー・脳波AIモデルを開発

大阪大学 PGV 脳波センサー 脳波AIモデル ニューロマーケティング

大阪大学発のスタートアップ企業PGVは7月14日、第三者割当増資として総額約1.5億円の資金調達を発表した。引受先は大阪大学ベンチャーキャピタル(OUVC)。

2016年9月設立のPGVは、大阪大学産業科学研究所・関谷教授の研究成果を基に「小型で軽量な脳波センサー」を開発し、脳波AIモデル開発・サービス事業に取り組んでいる。同社脳波センサーは、額に貼れるほど小型で装着感を感じさせない形状でありながら医療機器と同程度の高い計測精度を実現できているなど、優れた技術性を有しているという。

また、同社では得られた脳波データから脳波モデルを生成する解析アルゴリズムの開発も進行。様々な状況下での脳波を計測・析を通した多くの脳波モデルのカタログ集積を行い、「PGV=脳波モデルの総合図書館」としての位置づけを目指すという。取得した脳波データを利用したニューロマーケティングビジネスをはじめ、疾患の早期検知、睡眠ステージの判定といったヘルスケア分野への展開など、脳波データを活用した様々な分野でのビジネス展開を進めている。

大阪大学 PGV 脳波センサー 脳波AIモデル ニューロマーケティング
OUVCを無限責任組合員とするOUVC1号投資事業有限責任組合(OUVC1号ファンド)は、PGV対して2016年11月に5000万円、2017年8月に2億円、2020年1月に5000万円の投資を実行しており、今回は4回目の投資実行にあたる。OUVCとしては、PGVが2020年1月に調達した資金を活用し、一定の事業開発が進んだことが確認できたため、追加投資を決定した。

オフィスビルの賃料をAIで正確に判定するestieが2.5億円調達、ゼンリンとの提携で都内20万件の入居企業情報も取得

オフィスビルを借りたい法人、管理事業者や仲介事業者などを対象にした不動産データプラットフォームを開発・運営するestieは7月14日、プレシリーズAラウンドで2億5000万円の資金調達を明らかにした。第三者割当増資による調達で、引受先はグロービス・キャピタル・パートナーズ、東京大学エッジキャピタルパートナーズ(UTEC)。今回調達した資金は、プロダクト開発、人材採用、マーケティングなどに投下する。

estieは、不動産の公開情報を基に独自のAIアルゴリズムによって各地域のオフィスビルの推定賃料を算出する技術を擁する2018年12月設立のスタートアップ。賃貸マンションなどとは異なり、オフィスビルの賃料はネット上に集約されておらず、これまでは地域の不動産会社などに問い合わせて賃料などの情報を入手するのが一般的だった。

同社のサービスによって各地域のオフィスビルのおおよその賃料を調べられるほか、全国7万棟の基礎物件情報、2万件の空室情報、東京23区のビル入居テナント情報なども収集・解析。今回の資金調達にあわせたリニューアルによって、50社を超える不動産デベロッパーや管理会社、仲介会社の独自情報を集約してデータの精度をより高め、市場予測や業務プロセスの改善を進める。

同社のサービスは、オフィスビルを借りる法人向けのestie、ビルのオーナーや管理会社向けのestie proの2つがある。estieは、都道府県や市区町村、最寄り駅を指定すると、条件に合ったオフィスを検索できるというサービス。検索結果から内覧したい物件を問い合わせることも可能だ。

オフィスビルのオーナーや管理会社向けのestie proは、周辺地域のオフィスビルの賃料の推移を見ながら自社ビルの賃料を決められるというメリットがある。その地域で適正な賃料の設定が可能になり、結果的には空室期間の短縮につながるわけだ。

同社代表取締役CEOの平井 瑛氏は「estieではこれまで不動産業者同士の会食に席などでやり取りしていた非公開情報などを集めて、データの精度を高めています」と語る。不動産業者側は当初、独自情報を公開することにネガティブな印象を持っていたそうだが、各業者が提供する独自情報以上のものをestie上で得られることがわかったことで、データ提供について前向きになったという。具体的には、これまでの事業活動では入手が難しかった東京23区内では20万社のビル入居テナントの情報などがestie proを利用することで手軽に手に入る。なお、20万社のビル入居テナントの情報については、独自のデータ収集のほか、ゼンリングループとの連携で実現したもの。どのビルにどういった企業が入居しているのかを簡単に調べられる。

「大手不動産デベロッパーは、競合の大手不動産デベロッパーが建てたビルの賃料の情報は喉から手が出るほど欲しいわけですが、これまでは懇意の仲介業者などから情報を仕入れる必要があり、手間と時間がかかっていました」と平井氏。さらに「新型コロナウイルスの蔓延により、実際に会って情報を引き出すことが難しくなった現在、estie proの重要度は高まっている」と続ける。

EAGLYSが東芝と協業検討、リアルタイムビッグデータ分析にセキュリティ・秘密計算を適用へ

秘密計算 EAGLYS 暗号化 ビッグデータ 準同型暗号

秘密計算技術のEAGLYS(イーグリス)は7月13日、東芝が新規事業創出を目指し開催した「Toshiba OPEN INNOVATION PROGRAM 2020」において、協業検討企業として選抜されたと発表した。

EAGLYSは、秘密計算技術で常時暗号化したデータ操作が可能なデータベース向けプロキシソフトウェア「DataArmor Gate DB」と、東芝のIoT・ビッグデータに適したデータベース「GridDB」との製品連携の実証を重ね、ビッグデータのリアルタイム分析における高セキュリティ・秘密計算機能の実現と価値創出に向け協業検討を進めるという。

Toshiba OPEN INNOVATION PROGRAM 2020は、東芝グループが持つローカル5G、IoT、ビッグデータ、画像認識などの技術を活用し、共に新規事業の創出や協業検討を行うプログラム。EAGLYSは、プログラム採択企業として2020年9月25日の成果発表会までに実証実験を重ねて検討をブラッシュアップ、より本格的なビジネスソリューションとしての事業化を目指す。

秘密計算技術とは、データを暗号化したまま復号することなく任意のデータ処理ができる暗号技術の総称。ゼロトラスト時代のデータセキュリティには、ネットワークなどの境界に依存したセキュリティ対策ではなく、「データそのもの」を守るアプローチが求められ、それを実現する基盤技術として期待されている。

秘密計算 EAGLYS 暗号化 ビッグデータ 準同型暗号

EAGLYSの秘密計算技術は、格子暗号をベースとする準同型暗号を採用。暗号処理に伴う計算量の増加が準同型暗号実用化の課題となっていたが、IEEEをはじめ各種国際学会に採択された同社秘密計算エンジン「CapsuleFlow」(カプセルフロー)関連の研究成果によって、大幅な高速化と省メモリー化を達成。業界に先駆けて準同型暗号の実用化に成功した。

DataArmor Gate DBは、EAGLYSが開発・提供するセキュアコンピューティング・プラットフォーム「DataArmor」シリーズのデータベース向けの高機能暗号プロキシーソフトウェア。このソフトウェアでは、データを暗号化したまま透過的に検索・集計クエリなどのデータベース操作が可能。データベース側に鍵をもたない設計により、通信中・保管中・処理中(検索・集計などのクエリ)を常時暗号化し、セキュリティレベルの向上と高パフォーマンスを両立している。

また、プロキシー型で提供しているため、データベースの種別に依存しない連携が行える。同製品にはデータを暗号化したまま計算可能な秘密計算機能も搭載しており、IoTなどセンシングデータの計算処理などのユースケースにも適用可能。

関連記事
量子コンピュータ対応の暗号化セキュリティ技術を擁するPQShieldが7.5億万円調達
マイクロソフトがセキュリティスタートアップのCyber​​Xを買収、Azure IoT事業のセキュリティ強化に超本腰
暗号化したままデータ解析可能な「秘密計算」の実用化めざすEAGLYS

サブスク向けLTV・解約率改善ツールのKiZUKAIが総額8000万円を資金調達

KiZUKAI キヅカイ LTV サブスクリプション

AI活用のLTV(Life Time Value)・解約率改善ツールを提供するKiZUKAIは7月13日、STRIVE(ストライブ)とReality Acceleratorから、総額8000万円の資金調達を実施したと発表した。

同社は、LTV・解約率を改善するための専門ツール「KiZUKAI」(キヅカイ)を提供。AIにより「解約の可能性が高い顧客」を抽出し、対象顧客に先読みしたアプローチを行うことで、解約率の改善に取り組める。データ分析のリテラシーがなくても簡単に高度分析が行えるという。

KiZUKAIのAIアルゴリズムは、顧客行動から顧客の解約傾向(顧客ニーズ)を自動分析するとともに、同様傾向の顧客リストを自動作成。それぞれに適したコミュニケーション施策の検討・実施が可能になる。また解約の要因も把握できるので、サービス改善にも有効としている。

KiZUKAI キヅカイ LTV サブスクリプション

サブスクリプションサービスにとって継続率(=解約率)は非常に重要なテーマとなっており、膨大な顧客データの分析・要因把握を行った上で、顧客との関係構築をしていく必要がある。しかし顧客分析には、高度なシステムおよびそれを扱うハイスペック人材が必要となり、なかなか企業活動に根付かないというボトルネックがあった。

KiZUKAIを利用することで、高度な分析の自動化、顧客の状態の可視化が可能となり、分析にかかる時間を低減し、継続率(解約率)改善に注力可能となるという。

マイクロソフトが中国製チャットボットXiaoiceをスピンアウト

Microsoft(マイクロソフト)は、共感的チャットボットのXiaoice(シャオアイス)を独立した組織にしようとしている。同社は中国時間7月13日にこの発表を行い、6月に中国のニュースサイトChuhaipost(チューハイポスト)が行っていたレポートを追認した。

この発表に先立ち、数ヶ月前の昨年末には、Microsoftは音声アシスタントのCortana(コルタナ)を中国で閉鎖することを発表していた

Xiaoiceは長年にわたり、人工知能の最優秀な人材を採用し、中国内に留まらず、日本やインドネシアなどの国々へも進出していた。Microsoftはこのことを、Xiaoiceの「ローカライズされたイノベーション」とチャットボットの「商用エコシステム」の開発を加速するための宣言だと述べている。

スピンオフ会社は、Xiaoiceにおける今後の研究と開発のために、Microsoftからの新しい包括的技術ライセンスを使い、Xiaoiceブランド(日本では「りんな」)を引き続き使用する。一方Microsoftは、新会社の株式の持分を保持し続ける。

2014年、MicrosoftのBing研究者たちの小さなチームがXiaoiceを発表した。これは中国語で「Little Bing」(小冰=Xiǎobīng)を意味する。このボットは、すぐに中国でセンセーションを巻き起こし、多くの人たちからバーチャルガールフレンドと見られるようになった。このチャットボットが登場したのは、Microsoftが中国内でCortanaを展開してから、わずか数週間後のことだった。Xiaoiceは、10代の少女をパーソナリティのモデルとしており、同社はチャットボットに対して、人間的で社会的な要素をさらに追加することを目指している。Microsoft自身の言葉によれば、彼女はユーザーの友達になりたいと思っているということだ。

すべての外国企業と同様に、Microsoftは中国の検閲にしっかりと取り組む必要がある。2017年にXiaoiceは、政治的に問題を含む発言の疑いで、Tencent(テンセント)のインスタントメッセンジャーQQから削除された。

このプロジェクトには、AIの世界で最も権威のある科学者たちが参加していた。例えばLu Qi(ルー・チー)氏はその後Baidu(バイドゥ)に最高執行責任者として移籍して、Y Combinatorを中国に連れて来たし、Jing Kun(ジン・クン)氏は検索大手Baiduのスマートデバイス部門の責任者となり、またMicrosoftの名高い人工知能および研究部門の元幹部であるHarry Shum(ハリー・シャム)氏は、現在新進のニュースアプリNews Break(ニュースブレイク)のボードメンバーとなっている。

シャム氏は、今回Xiaoiceから生まれる新しい独立企業の会長を務める。 またXiaoiceのゼネラルマネージャーであるLi Di(リー・ティー)氏が最高経営責任者(CEO)を務める。 日本版のチャットボット「りんな」の開発者であるChen Zhan(チェン・サン)氏は、日本オフィスのゼネラルマネージャーになる。

新会社は、「Xiaoice」および「りんな」ブランドを使用する権利を保持し、中国語圏、日本、インドネシアの顧客基盤をさらに発展させることを使命とする。

Microsoftは、Xiaoiceは世界中で、6億6千万人のユーザーと4億5000万台のサードパーティスマートデバイスに使われていると述べている。またそのチャットボットは、金融、小売、自動車、不動産、ファッションなどの分野に応用を見出し、そこでは「テキストからコンテキスト、雰囲気、感情を抽出して、数秒でユニークなパターンを作成できる」と 主張している。

原文へ
(翻訳:sako)

ZOZO研究所のファッションコーデ関連論文がコンピュータービジョンの国際会議ECCVで採択

ZOZOテクノロジーズ ZOZO研究所 ECCV 深層集合マッチング

ZOZOテクノロジーズの研究開発組織「ZOZO研究所」は7月13日、同研究員らが執筆した論文「Exchangeable Deep Neural Networks for Set-to-Set Matching and Learning」(置換不変ニューラルネットワークによる深層集合マッチング)が、コンピュータービジョン分野における世界3大国際会議のひとつ「European Conference on Computer Vision(ECCV)2020」に採択されたと発表した。ZOZO研究所は、8月24日~27日にオンライン開催のECCV 2020本会議でポスター発表(プレゼン・ディスカッション)を行う。

この研究成果は、同研究員の斎藤侑輝氏、中村拓磨氏、共同研究者・和歌山大学講師の八谷大岳氏、統計数理研究所・総合研究大学院大学教授 福水健次氏(斎藤の博士課程指導教員)によるもの。

ECCVは、CVPR(Computer Vision and Pattern Recognition)・ICCV(International Conference of Computer Vision)と並ぶ国際会議(トップカンファレンス)。隔年ごとに開催されており、第16回目となる今回は、5025本の投稿から1361本の論文が採択された。

今回採択の論文では、ファッションアイテムの推薦から1歩先んじて、ファッションコーディネートの推薦について研究。例えば、ユーザーが持つアイテム群(下図左)と推薦候補のアイテム群(下図右)が複数あるとき、どのアイテム群がユーザーのアイテム群に一番マッチし、2つの群を合わせたときにコーディネートとして適切かを考えるものとしている。

ZOZOテクノロジーズ ZOZO研究所 ECCV 深層集合マッチング

それぞれのアイテム群は集合として表現でき、アイテム群のマッチングは集合マッチングの問題設定として定式化できる。さらに、このように異なるアイテムカテゴリーを持つ集合同士のマッチングには、強力な特徴学習の仕組みとなる深層学習が必要になるという。しかし、集合マッチングと深層学習を組み合わせた研究は、ほとんど行われてこなかった。

そこで同論文では、独自のニューラルネットワークアーキテクチャ、効率的な学習法、学習データ作成手段を提案。特に集合マッチングには「集合内のアイテムや集合同士を入れ替えても出力が不変であること」と「集合間インタラクションに基づく特徴変換」とを備えた手法が重要であると提起。それらを満たすアーキテクチャを考案した。

実験では、各アイテムの画像特徴量を抽出する畳み込みニューラルネットワークと、特徴量の集合を扱う提案手法をEnd-to-endに学習し、マッチする集合の候補を正しく選べるかを調査。その結果、提案手法は比較手法(Set TransformerとBERT)よりも精度が高いことが明らかになり、上述の特性が同論文の提唱する集合マッチングにおいて重要であると確認した。提案手法や実験の詳細については、同社技術ブログ「ZOZO Technologies TECH BLOG」でも、一部紹介している。

論文では、集合マッチングのベースとなる特性を数理的に捉え、集合データに適したアーキテクチャを考案。提案手法は様々な分野での集合マッチングのベースラインとなる可能性を秘めているため、今後さらなる発展を目指すという。

また、現在は研究段階であるものの、具体的にどのようなユースケースに導入し、ユーザーエクスペリエンス向上につなげられるかも検証しており、今後も研究開発に努めるとしている。

関連記事
新型コロナによる非接触需要でスキャン技術のScanditが約86億円調達
廃棄物管理にAIを活用するGreyparrotが約2.4億円調達
コンピュータービジョンで製造作業員の動きのエラーを検知、トヨタも手を組むInvisible AI
コンピュータービジョンを利用して製品写真を重要な属性へと分解するGlisten

静岡銀行が国内地銀で初めて融資審査をAIで高度化、不動産テックのリーウェイズと共同開発

リーウェイズ 静岡銀行 Shizugin Investment Planner

不動産テック開発・運営のリーウェイズは7月13日、融資を求める顧客に対する情報提供や融資審査の高度化を目指し、賃貸不動産の将来の賃料・価格・空室率などを予測する、投資用不動産AIシミュレーション「Shizugin Investment Planner」(SIP)を静岡銀行と共同開発したと発表した。また静岡銀行は、資産形成サポートの現場でSIPの本運用を開始した。

リーウェイズは、不動産価値分析AIクラウドサービス「Gate. Investment Planner」(ゲイト・インベストメント・プランナー)のシステム基盤を静岡銀行に提供。Gate. Investment Plannerは、過去10年間で蓄積された1億件以上の物件データから、全期間利回り・賃料査定・物件価格査定・空室率の推移・賃料下落の推移・50年先まで分析したキャッシュフロー・LTV(Loan to Value。資産価値に対する負債比率)などの詳細な不動産分析が可能という。

SIPは、リーウェイズ保有の不動産ビッグデータを学習したAIによる将来価値の査定モデルと、静岡銀行独自のロジックとを活用する形で開発。SIPは、収益不動産の将来的な稼働率・賃料の下落など、物件所有者にとっての運用リスク、返済の安定性を可視化した資料の提供が可能なため、収益不動産のパフォーマンスに関する客観指標を基にしたアドバイスを行えるという。また、融資審査において市場データに基づく客観的な参考値を取り入れることで、無理のある投資計画から顧客を保護する。

今後さらなるAI査定の精度向上、蓄積情報の活用、顧客への提示情報の拡充を予定しており、国内の資産家をリスクから保護し、より計画的で堅実な資産形成のサポートを行う。

リーウェイズ保有の不動産ビッグデータとAI技術、静岡銀行が保有する独自の融資審査ノウハウを活用し、全国の不動産取引および融資業務の効率化・高度化・標準化を推進するとした。

リーウェイズと静岡銀行は、2019年6月締結の資本業務提携を皮切りに、AI技術などのテクノロジーを取り入れた、不動産関連融資における顧客保護体制の強化と融資審査の厳格化を通じた新たなビジネスモデルの構築に取り組んできた。

リーウェイズは、過去10年以上に渡って蓄積した全国1億件超の不動産物件データをはじめとする不動産取引情報や、人口動態・地価情報などのビッグデータを基に、不動産の将来価値を予測する不動産価値分析AIクラウドサービス「Gate.」(ゲイト)を開発。不動産関連企業や金融機関に提供している。

静岡銀行では、「事業領域の開拓・収益化による地方銀行の新たなビジネスモデルの構築」を推進。異業種との連携を通じ、従来の枠組みや発想にとらわれない新たな収益基盤となるビジネスを創造し、持続可能なビジネスモデルの構築に取り組んでいる。

関連記事
AI活用で最短2日のマンション売却、不動産テックのすむたすが4億円調達
担当者にかわってAIが自動でオススメ物件提案、不動産テックのハウスマートが約3億円調達
不動産テックのEQONが3000万円を調達、査定+エージェント検索で「仲介2.0」に備え

ハンガリーの自動運転スタートアップAImotiveが宇宙における衛星運用の自動化にAIを活用

ハンガリーの自動運転スタートアップであるAImotive(AIモーティブ)は、増大する異なる産業の需要に同社の技術を活用しようとしている。衛星運用の自動化だ。AImotiveは衛星用のAIによる運用のためのハードウェアプラットフォームを開発するために、衛星サプライヤー、宇宙技術のC3Sとチームを組んでいる。AImotiveのaiWareニューラルネットワークアクセラレーターを、衛星での使用向けにC3Sが最適化する。運用は道路を走行する車両に搭載されているものと多くの点で似ているが、パワー管理、そして環境的に運用上の危険という点においてはより厳密な要件をともなう。

2社の取り組みの最終目標は、2021年後半までにAImotiveの技術を実際に軌道を回っている衛星で活用することだ。2社によると、搭載されるニューラルネットワークアクセラレーターは通信、地球画像・観測、他の宇宙船との衛星の自動ドッキング、深宇宙探索など多くの異なる機能に活用される予定だ。

大半の衛星が、すでに本質的には自動で動いているのは事実で、常にマニュアル操作で飛んでいるわけではない。しかし特定のエリアの画像処理、地上や宇宙のターゲット地の探索といったタスクを実行するときに、ニューラルネットワークベースのAIがより自主性を提供することになる。また、AImotiveとC3Sはデータのローカル処理が衛星ビジネスにおいてかなりのゲームチェンジャーとなる可能性を秘めていると確信している。

現在、衛星が収集したデータの処理の大半は未加工情報として地上のステーションに送信される。実際のところこの方法では、データの収集から加工データの顧客への提供までにかなりのラグタイムがある。衛星オペレーターや他の仲介者が未加工情報を単に提供するのではなく、クライアントに代わって処理業務を行うときは特にそうだ(もちろん、このような分析を行うことでデータプロバイダーにとっては儲けが大きくなる)。

AImotiveの技術により、情報が取り込まれた衛星上でのデータ処理ができるようになる。地上のIoT世界では、このような「エッジコンピューティング」の方向へ大きなシフトチェンジが行われている。データを提供する時間の削減を含めて、地上と同様の理由で、宇宙でもそうしたデータ処理を再現するのは理にかなっている。これにより有料顧客にこれまでよりもレスポンスの良いサービスを提供することになる。

画像クレジット:AImotive

原文へ
(翻訳:Mizoguchi

人種的偏見と闘うAIの新分野が求められている

人種間の不平等に関する抗議活動が拡大してから、IBMは警察権行使の際の人種的平等を推進するため、顔認識技術の提供を中止すると発表した。  Amazon(アマゾン)はRekognitionソフトウェアの警察への提供を1年間停止し、「顔認識技術の倫理的使用に関するルールを定める強力な内規を導入した」。

だが内規の変更以上のものが必要だ。人工知能(AI)業界全体がコンピューターサイエンスの研究所を超えて成熟し、コミュニティ全体を受け入れる包容力が必要とされている。

偏見を広く排除しながら社会で機能する素晴らしいAIを開発することは可能だ。だが、現在のようにAIがコンピューターサイエンス(CS)やコンピューターエンジニアリング(CE)の単なる一分野にとどまるなら、それは実現できない。人間の振る舞いの複雑さを考慮してAIという学問分野を形成する必要がある。コンピューターサイエンスが支配するAIからコンピューターサイエンスによって何かが実現するAIに移行しなければならない。AIに伴う問題は研究所で発生するわけではない。科学者がテクノロジーを現実世界に移すときに発生するのだ。CSラボのトレーニングデータには多くの場合、あなたや私が住む世界の文脈と複雑さが欠けている。この欠陥が偏見を永続させる。

AIを利用したアルゴリズムは有色人種や女性に不利なバイアスを示すことがわかっている。たとえば2014年にAmazonは、ヘッドハンティングを自動化するために開発したAIアルゴリズムが(Slate記事)が女性の候補者に不利なバイアスがかかるような学習をすることを発見した。MIT(マサチューセッツ工科大学)の研究者らは2019年1月、顔認識ソフトウェアの方が色素が暗い人を識別する精度が低いと報告した。最近では、昨年末に米国立標準技術研究所(NIST)が実施した調査(NISTリポート)で、研究者らは約200の顔認識アルゴリズムに人種的バイアスの証拠を発見した。

AIの間違いに数え切れないほどの例があるにもかかわらず、熱意は続いている。IBMとAmazonの発表が多くの肯定的な報道を生み出した理由はそれだ。2015~2019年にかけて、世界における人工知能の利用量は270%増加(Venture Beat記事)し、市場は2025年までに1186億ドル(約1兆3000億円)の収益を生み出すと予想(OMDIA記事)されている。米国人の90%近くがすでにAI製品を日常生活で使用している(Gallup記事)、多くの場合それとは気づかずに。

AI開発は技術的な課題だが、AIを使用するには、社会科学、法律、政治などのソフトウェア開発以外の重要な学問分野の知識体系が必要となることを認めなければならない。だが、AIの利用がますますユビキタスになっているにもかかわらず、研究対象としてのAIはCSおよびCEの分野にまだ集中している。たとえば、ノースカロライナ州立大学では、アルゴリズムとAIはCSプログラムで教えられている。MITはCSとCEの両方でAIの研究を行っている。AIは人文科学プログラム、人種およびジェンダー研究のカリキュラム、ビジネススクールに取り入れなければならない。政治学科でAIのコースを開発しよう。筆者はジョージタウン大学のプログラムで、セキュリティ研究の学生にAIと機械学習の概念を教えている。これが普通のことになる必要がある。

AIの専門化に対し包括的にアプローチしなければ、我々はほぼ確実に今日存在する偏見と差別的慣行を永続させることになる。より低いコストで差別するようになるだけなのかもしれない。テクノロジーの高邁な目標を達成するのではなく。ニューラルネットワークの開発とテクノロジーが適用される社会的文脈の両方を理解することを目的としたAIの分野を意識的に確立する必要がある。

コンピュータエンジニアリングで学生はプログラミングとコンピュータの基礎を学ぶ。コンピュータサイエンスでは、アルゴリズム学習の基礎を含む計算理論とプログラム理論を研究する。これらはAI研究の強固な基盤だが、あくまで一部分として考えるべきだ。そうした基礎はAIの理解に必要だが、それだけでは十分ではない。

AIの普及によって快適な社会が実現するなら、AmazonやIBMなどのハイテク企業、そして数え切れないほどの他の企業はイノベーションを広めることはできる。それにはAIという専門分野全体がCSの研究所を飛び出す必要がある。心理学、社会学、人類学、神経科学(The Conversation記事)などの分野で働く人々が必要だ。人間の行動パターンとデータ生成プロセスのバイアスを理解することが求められる。筆者は行動科学のバックグラウンドがなければ、人身売買、マネーロンダリング、その他の不正行為を特定するソフトウェアを開発することはできなかった。

機械学習プロセスを責任を持って管理することは、もはや進歩のステップとして望ましいものではなく、必要なものだ。人間がもつ偏見の危険性と未来の機械が誤って偏見を再生産してしまう可能性を理解しなければならない。社会科学と人文科学が鍵となる。これを成し遂げるには、すべての学問分野を包括するAIの新しいフィールドを立ち上げる必要がある。

【編集部注】Gary M. Shiffman(ゲーリー・M・シフマン)博士は、「暴力の経済学:行動科学は犯罪、反乱、テロリズムに対する我々の見方を変え得るか」(邦訳未刊)の著者。同氏はジョージタウン大学で経済科学と国家安全保障を教えている。Giant Oak Search Technologyを作ったGiant Oakの創業者兼CEOでもある。

画像クレジット:Henrik Sorensen / Getty Images

[原文へ]

(翻訳:Mizoguchi

グーグルがAI利用のスマート返信をYouTubeに導入、今後多国語展開も

Google(グーグル)のSmartReplyは、4年前にリリースされたAIテクノロジーを利用した省力化ツールで、GmailをはじめAndroidのMessagesPlay Storeのデベロッパーコンソールその他の場所で受信した内容を解析し、ふさわしい返信案の候補を表示する。 この機能をYouTubeのクリエーターも利用できるようになった。

同社の発表によれば、最新版のYouTube向けSmartReplyはビデオのクリエーターがファンのコメントに対して素早く効率的に返信できるようにすることを狙っているという

この機能はYouTubeのオンラインダッシュボードであるYouTube Studioに導入された。これは、クリエーターがビデオを管理し、統計をチェックすることなどによりチャンネルをプロモーションし、ファンとの交流を図るために設けられたツールだ。クリエイターはYouTube Studioのコメント欄からチャンネルのコメント全体を表示し、返信処理ができる。

YouTubeで多数のフォロワーを持つクリエイターにとってコメントへの返信は非常に時間のかかる作業だ。SmartReplyはこの問題の軽減を狙っている。

クリエイターは視聴者からのコメントをいちいち読んで返信を手入力せず、提案された返信案の1つをクリックして返信できる。たとえばファンが「次のビデオのテーマは何?」と尋ねている場合、SmartReply機能は「ありがとう!」や「どんどん続くよ!」といった返信を提案する。

GmailのSmarReplyは単語と短いフレーズを解析できるが、YouTube向けにの新バージョンはさらに幅広い子コンテンツ解析能力が必要だった。グーグルによればYouTubeコメントでは「絵文字、アスキーアート、言語種類の認識などを必要とした」ということだ。YouTubeのコメント投稿には略語、スラング、つづりの揺れなどが頻繁にみられる。このためYouTubeへのSmartReply実装には大きな困難があった。

Google AI Blogの記事に、こうした課題(やその他の課題)をどのように解決したがが詳しく説明されている。

SmartReplyはクリエーターが返信したいと考える可能性が高いコメントを選び、しかも適切な返信内容をを提案する必要があった。コメント内容を正しく認識するために機械学習をトレーニングするシステムが必要だったと同社は述べている。

スタートの時点はSmartReplyは英語とスペイン語のコメントで利用可能となっている。これはSmartReplyとして初のシステム言語の自動切り替えを含む複数言語サポートとなる。言語の種類や絵文字を認識するため文字符号を利用するシステムだという。

「SmartReplyはこうしたアプローチを利用しているため、この機能を今後さらに多数の言語に拡張することが可能となっている」と同社は説明する。

原文へ

(翻訳:滑川海彦@Facebook

カーネギーメロン大学が文章を自動で丁寧な表現に直すエンジンを開発

普段はぶっきらぼうなメッセージを送っているが、もっと丁寧な文章が書ければ日常のコミュニケーションが改善されるだろうにと考えているなら、カーネギーメロン大学(CMU)の新しい研究が救いになるかもしれない。CMUの研究チームは、お願いや連絡のための文章を自動的に丁寧な表現に直してくれる技術を開発した。この技術は応用の幅がとても広い。要は文法チェックソフトのGrammarly(グラマリー)のように文章の基本を教えてくれるわけだが、単に文法的に正しい文章にするというより、文章の調子を整えるようにデザインされている。

Language Technology(言語技術)研究室の博士課程に在籍するShrimai Prabhumoye(シュリマイ・プラブモエ)氏をはじめ、修士課程のAman Madaan(アマン・マダーン)氏、Amrith Setlur(アムリス・セトラー)氏、Tanmay Parekh(タンメイ・パレク)氏らを含むこのCMU研究チームが開発したこのエンジンは、スタイル変換メカニズムをベースにしている。AIを使って写真を別の画像の雰囲気に合わせて変換するソフトウェアと同類のものといえばおわかりいただけるだろうか。このプロジェクトでは、Enron(エンロン)の従業員が交わしたおよそ50万通の電子メールからなるデータセットを利用している。このメールは、同社の不正取引に関連する訴訟手続きの際に公開されたものだ。

不正を働いた企業ではあるが、その従業員たちが互いに交わした電子メールの文面は、大きな企業に勤めたことのある人ならおわかりのとおり、要望や返答は共通の儀礼に則った丁寧な形式に当てはめられていた。これが、コンピューターに言語学アルゴリズムを学習させるためのよい基準となった。そして必要最低限の、あるいは礼節を欠く要求文を、より人間らしい思いやりや品位のある文章へ変換できるようになる。例えば「Show me last month’s reports(先月の報告書を見せてくれ)」という文章は「Could you please send me the reports from last month?(先月分の報告書を送付願えますか?)」となる。

比較的単純な処理のように見える。どんな文章でも「お願いします」や「ありがとうございます」を付ければ済みそうなものだと考えているかもしれないが、しかし研究チームによれば、実際にはもっと微妙な調整が必要だという。なぜなら、私たちが丁寧な文章を書こうとするとき、上の例のように、命令をお願いに変えるなど、より多くの要素が絡んでくるからだ。

CMUの研究チームが開発したこの自動化方式では、今のところは、改まった環境(職場など)で使われる北米英語にしか対応できない。その他の地方に合わせるためは、地域によって丁寧とされる言葉遣いが大きく異なるため、膨大な作業が必要になるという。しかし現在のレベルでも、例えば自動カスタマーサービスのチャットボットや電子メールクライアントによるテキスト入力候補の提案などには大いに活用できそうだ。

事実、テキスト入力候補の提案を多用する企業は、すでにこの技術に興味を示している。Apple(アップル)も米空軍研究所、米海軍研究事務所、全米科学財団、Nvidia(エヌビディア)とともにこの研究を支援している。

画像クレジット:Getty Images

原文へ
(翻訳:金井哲夫)

DatabricksがRedashを買収してデータサイエンティストのためのデータ視覚化を充実

データと分析のサービスのDatabricksが米国時間6月24日、データ視覚化サービスのRedashを買収したことを発表した。Radashはデータサイエンティストやアナリストが必要とするデータの視覚化を助け、そのためのダッシュボードを提供する。

Redashの顧客にはAtlassianやCloudflare、Mozilla、Soundcloudなどがおり、同社のサービスには、そのツールのオープンソースで自己ホスト型のバージョンと同社がホストする有料のオプションがある。

両社は、買収の財務的詳細を明かしていない。Crunchbaseによると、テルアビブのRedashはまだ外部資金を調達していない。

Databricksの共同創業者でCEOのAli Ghodsi(アリ・ゴーシ)氏によると、両社が出会ったのはDatabricksの顧客にRedashを使っている企業がいたからだ。「彼らのチーム全体とその質へのこだわりに感銘を受けた。これまでのデータサービス業界には、RedashとDatabricksを組み合わせたようなものが欠けていた。この組み合わせによりLakehouseのすばらしいバックエンドと、Redashからのフロントエンドの視覚化およびダッシュボードが一体化し、マジックが起きる」とゴーシ氏はいう。

画像クレジット: Databricks

これはまた、Databricksにとって同社のサービスが企業のデータチームが必ずアクセスするプラットフォームになり、データから価値を取り出すためにやるべきことのすべてを、単一のプラットフォームでできるようになるという機会だ。

「両社はオープンソースの遺産を背負っている点で共通しているだけでなく、データとAIへのアクセスを誰にとっても容易にして、ビジネスインテリジェンスのユーザーがイノベーションをより迅速に実現できるようにするというミッションでも一致している。すでに両社の技術が一体化したことによる顧客のためのすばらしい成果が出ているため、引き続きさらなる成長を目指したい」とゴーシ氏は述べている。

DatabricksはRedashの買収に加えて、同社のDelta Engineのローンチも発表した。こちらは、同社のトランザクションレレイヤーであるDelta Lakeとともに利用するハイパフォーマンスのクエリエンジンだ。

これについて同社は、次のように説明している。「Delta Lakeのために新たに開発されたDelta Engineは、データ分析とデータサイエンスのためにクエリの高速な実行を可能にし、しかもそのためにデータをデータレイクの外に移す必要がない。このハイパフォーマンスなクエリエンジンはまったく新たに構築され、モダンなクラウドハードウェアを利用してクエリのパフォーマンスを加速する。この改良により、Databricksの顧客は統一的なデータアナリティクスプラットホームへ移行でき、そしてそれはデータのどのようなユースケースでもサポート可能で、オペレーションにとって意味のある効率とコスト節減ができる」。

原文へ

(翻訳:iwatani、a.k.a. hiwa

IEEE主催のサーモ画像超解像化コンペで東京・渋谷のクーガーが世界2位を獲得

近い将来、AIは人間には見えない景色、例えば温度分布を見て周りの状況を把握するようになる——スパイ映画かSFの設定のようなテクノロジーをまた一歩現実に近づける、コンピュータビジョンのコンペティションが開催された。

主催者は、電子工学・情報工学分野で世界最大の学会であり、国際的な技術標準化機関でもあるIEEE(アイトリプルイー)。彼らが開催したコンペ「Thermal Image Super-Resolution Challenge」は、解像度の低いサーモグラフィー画像から、機械学習で高解像度の画像を生成する手法を競うものだ。

6月14日に結果が発表されたこのコンペでは、東京・渋谷に拠点を置くクーガーのAIリサーチャー、Sabari Nathan氏とPriya Kansal氏によるモデルが2位に入賞。コンピュータビジョンの2大カンファレンスのうちの1つ「CVPR」に論文が採択された。

自動運転やロボへの応用も期待されるサーモ画像解析

クーガーは、AI、IoT、AR/VR、ブロックチェーンなどの技術を組み合わせて、人型AI「バーチャルヒューマンエージェント」の開発を進めている企業だ。同社はこの開発の一環として、AIエージェントの視覚を担う画像情報の分析・解析についても研究開発を行っている。

クーガーのAIチームは2019年9月、Facebookが主催するアイトラッキングの認識精度を競うコンペで、2D画像の眼球位置を推定する「Semantic Segmentation Challenge(セマンティックセグメンテーションチャレンジ)」においても世界3位を獲得している。今回のIEEEのコンペでクーガーから提出されたモデルは、Facebookのコンペで使われたコンピュータビジョンのためのアイデアを応用したものだという。

IEEEが今回のコンペを実施した目的は、画期的で新規性のある、精度の高いサーモグラフィー画像解析の機械学習ソリューションを探すためだ。

写真などの画像データが可視光を扱うのに対し、サーモグラフィー画像は熱を扱うため、照明その他の環境条件の影響を受けない。このため医療や軍事、物体検出など幅広い用途で利用が可能だ。例えば空港や学校といった施設で熱がある患者を見分けることでウイルス感染拡大を防ぐ、夜間の運転時に人を検知することで事故を防ぐといった場面では既に活用が進んでいる。

IEEEが2004年から開設する「Perception Beyond the Visible Spectrum(PBVS)」(可視域外の知覚)に関するワークショップでも、こうした可視光以外の画像解析には、さまざまな応用範囲があるとして期待が寄せられてきた。

例えば自律走行中の自動運転車が、可視光のみでは逆光のときに進行方向の状況が判別できない、といった場合に、サーモグラフィー画像が視野を補えば、障害物や標識などを見分けることが可能になる。自動運転モビリティやドローン、ロボットなどへの応用のほか、人工衛星からの画像や、光の届かない水中の画像分析などにも活用できるサーモグラフィー画像解析へのニーズは、今後ますます高まるはずだ。

ここで課題となるのが、センサーで撮影されたサーモグラフィー画像の解像度、質である。一般にサーモグラフィー画像の解像度は、写真などの画像の解像度に比べると低い。このため、機械学習による解析・処理によって画像の質を上げることで、何が写っているかが判別できるようにする必要がある。今回のコンペでは、低解像度のサーモグラフィー画像から、より精度の高い高解像度画像(超解像画像)をつくり出す手法が競われた。

従来、低解像度画像の解像度を上げるために行われる機械学習では、与えられた画像にダウンサンプリングを行い、ノイズやぼかしを加えた質の悪い画像と元の画像とを使って学習を行うアプローチが取られてきた。一方、異なる解像度のカメラから得られた一対の画像を使って学習を行うアプローチはほとんど採用されてきていない。

今回のコンペでは、3つの解像度が異なる赤外線カメラで撮影された実際の低・中・高解像度の画像セットを学習データとして用いる、新しい機械学習の手法が評価された。

コンペの評価は2種類の方法で行われた。1つは3つの異なる解像度で撮影された元画像にノイズを加えてダウンサンプリングし、それぞれのデータから元の解像度と同じ解像度の画像を生成して、元画像と比較するというもの。もう1つは、中解像度カメラで撮影された実画像から超解像画像を生成して、対になる高解像度画像と比較するというものだ。2つめの課題ではクーガーチームが1位に評価されており、トータルで2位を勝ち取る結果となった。

高解像度画像の生成例(左が実画像、右が生成画像)

実用に耐えるサーモ画像認識ソリューション目指す

クーガーチームが用いた手法では、3レイヤーでのアップサンプリングと、畳み込みブロックアテンションモジュール(Convolutional Block Attention Module:CBAM)を組み合わせている。

3層化したのは、1層につき1つの特徴量に対応するため。1レイヤーでは同種画像の分析には強いが、複数の特徴量、今回の場合では解像度の異なる画像の分析を1度にこなすのが難しい。そこで3レイヤーで3種のスケールの高解像化に対応できるようにすることで、アウトプットの精度を担保したという。

通常は調整パラメータが多くなるため、こうした構造のアプローチは取られないそうだ。学習データを豊富に持つ研究室ならデータ量でカバーしようとするところを、少ないデータでも処理できるように工夫した結果がこのアプローチだという。またCBAMで、注目する特徴量として何を有効にするかを決めることで、うまく処理が行えているとのこと。Sabari Nathan氏は「Facebookのコンペティションの経験もあり、やり切れることは分かっていたので」このアプローチを採用したと述べている。

クーガーの手法を使った超解像画像の生成は1秒以下と、高速での処理が可能だ。「動作が軽いので、実際にいろいろな場面で使える」とクーガー代表取締役CEOの石井敦氏は話している。

「今回のコンペでは、軽量であることは評価対象ではなかったが、我々としてはバーチャルヒューマンエージェントで動かすことを前提に実用化を目指しているので、そこにもこだわった。人間の視覚は複雑で、色や距離、雰囲気などを瞬時に見て取る力がある。今回のチャレンジは熱を使うことによって、視覚をより分解した取り組みになる。サーモグラフィー画像は可視光の画像よりデータが小さく、高速で処理できるため、応用範囲は広い」(石井氏)

クルマやドローンなどの小さなスペースに搭載できて、安価なカメラで撮影した画像でも認識性能を向上したいというニーズには、こうしたソリューションが大きく貢献するだろう。

「今後、コンピュータビジョンはますます頼りにされる。世の中の変化によって、学習データは日々変わる中で、精度の高いソリューションを生み出し続けるために、今回のようなコンペが実施された。解像度を上げて、それっぽくきれいに見えるというだけでは意味がない。低解像度のサーモグラフカメラでも、いい結果が出せて、また広い範囲で正しく認識できる。無人の自動運転車やドローンを運行するときなどには必要な、リアルタイムでの画像分析で求められる成果だ」(石井氏)

誤差1cmで全身をAI採寸できるBodygramアプリが登場

Bodygram Japan

AI採寸技術のBodygram Japanは6月26日、服を着たまま全身の推定採寸を行える「Bodygram」アプリのiOS版Android版を公開した。従来同社は、一部の企業・サービスにAI採寸技術を提供していたが、自社アプリとして公開。一般ユーザーも手軽に身体サイズを推定採寸し、測定結果を取得できるようになる。あわせてトランスコスモスとのパートナーシップ締結も明らかにした。

これまでBodygramは、人工知能(AI)による学習機能を利用し身体サイズを推定する技術をアパレル(ユニクロ、SHOPLIST.com by CROOZ)、ヘルスケア(花王 ヘルシアの「モニタリングヘルス」)、寝具(エアウィーヴ オンラインショップのレコメンドサービス)といった業界に提供。

今回配信のBodygramアプリでは、年齢・身長・体重・性別を入力し、服を着たままスマートフォンで正面・側面の2枚の写真を撮影するだけで被写体のボディラインを自動検出。腹囲・肩幅・手足の長さなど24ヵ所の全身サイズを±1cmの差異で推定できる。

Bodygram Japan

アプリにユーザー登録を行った者には、計測データを記録しておけるBodygram IDを発行。Bodygram技術を導入している企業のアプリ・サービスを利用する際に、Bodygram IDおよび記録データを流用できる。登録ユーザーが自分のIDやデータを安全に管理できるよう、共有する企業を選択可能となっている。

またBodygramアプリは、一般ユーザー向けの提供ではあるものの、企業も自社サービスに組み合わせた運用が行える(Bodygram Japanへの申し込みが必要)。企業が独自アプリを開発する前段階のステップとして、またはシンプルに採寸機能のみを利用したい場合にも利用できる。

法人としてのアプリ導入先としては、クロスフィットみなとみらい、クロスフィット辻堂への導入が決定済みで、このほか小売分野などで共同展開の検討が進行しているという。

トランスコスモスは、Bodygramとのパートナーシップ締結を受け、AI採寸技術「Bodygram」に関連する開発・運用・分析・サポートまでを統合的に支援するBodygram特設チームを設立。業務アプリへの組み込みサポートほか、身体採寸データのナレッジ化に伴う分析などの付加価値サービスも提供する。

リテール・アパレル店舗での試着レスのニーズに対しては、非接触採寸や店舗・ECとの連携、身体データ活用の健康管理サービスの推進を目指す。また、顧客企業が保有するデータベースと身体データを活用した新しいアナリティクスサービスを展開。保険業界には、Bodaygramを介した、健康増進型保険などの基礎データの提供・分析サービスを提供していく。

関連記事
オーダースーツD2C「FABRIC TOKYO」が3Dスキャン採寸の新ブランド「STAMP」を公開
スマホ撮影の写真とA4用紙で衣服の寸法を測定、AI採寸アプリ「MeasureBot」公開
ZOZOTOWN用の採寸ボディースーツをスタートトゥデイが無料配布(ただし送料はかかる)
手持ちのシャツから自動採寸する機能も追加、Original Stitchがブランド向けカスタマイズプラットフォームを発表

顔認識ソフトを利用した犯罪予測ソフトウェアには人種的偏見と欠陥があるAI研究者たちが非難

1000人を超える人工知能の研究者、学者、専門家の集まりが、まもなく発表される予定のニューラルネットワークを使用して「犯罪を予測する」と主張する研究に対して反対している。この記事を執筆している時点ではFacebook(フェイスブック)、Google(グーグル)、Microsoft(マイクロソフト)などの企業でAIに取り組んでいる50人以上の従業員が、研究に反対し、出版の再考を促す公開書簡(Medium記事)に署名している。

論争の的となっている研究は、ネイチャーの出版元である、Springer(スプリンガー)による書籍シリーズで、今後取り上げられる予定になっている。その研究の著者たちは、彼らの自動顔認識ソフトウェアはある人物が犯罪を犯すか否かを予測することが可能で、このような研究の法執行機関による予防的治安維持への応用の有用性を主張している。

「潜在的な脅威の識別を、偏見なく自動化することで、私たちは暗黙の偏見や感情的反応による影響を受けにくい犯罪予防活動、法執行機関そして軍隊に役立つツールを生み出そうとしているのです」と、ハリスバーグ大学教授で共著者のNathaniel J.S. Ashby(ナサニエル・J.S.・アシュビー)氏は語る。

他の研究者として名前が載せられているのは(Harrisburg Universityリリース)、ハリスバーグ大学のRoozbeh Sadeghian(ルーズベ・サデギアン)助教授、そしてプレスリリースの中でNYPD(ニューヨーク市警)のベテランとして強調された、Ph.D学生のJonathan W. Korn(ジョナサン・W・コーン)氏らである。コーン氏は、犯罪行為を予測できる彼らのソフトウェアの能力を「法執行機関に対して重要な強みを与える」ものとして称賛している。

研究の発表に反対する公開書簡の中で、AIの専門家たちは研究に対する「重大な懸念」を表明し、Springerのレビュー委員会にその出版を取り下げるよう要請している。同書簡はまた、他の出版社に対しても同様の将来的な研究の出版を辞退するよう呼びかけ、顔認識技術と犯罪予測技術に対して細心の注意を払ってアプローチすべき理由や、すでに脆弱なコミュニティに対して利用してはらない理由を連綿と綴っている。

関連記事:グーグル社員が警察への同社技術の提供に抗議

今回の出版に対する反対者たちは、単に研究者たちが倫理的な困難さを引き起こしたことだけを心配しているのではなく、こうした研究そのものに対して疑問を投げかけ「私たちのそれぞれの分野にまたがって何年もの間否定されてきた不健全な科学的前提、研究、方法だ」と批判している。

顔認識アルゴリズムは、この種のソフトウェアに対して頻繁に提起される他の多くの科学的および倫理的懸念の中でも、非白人の顔を識別するパフォーマンスが低いことを、長い間批判されてきている(参考1参考2参考3)。問題の研究が、予防的治安維持目的に適用可能な顔認識ソフトウェアを開発したことを考えると、技術への懸念はこれまでになく高いものとなった。

「機械学習プログラムは中立ではない。研究計画とそれが扱うデータセットには、しばしば世界についての支配的な文化的信念が継承されているからだ」と、書簡の著者たちは警告している(Medium記事)。

「デフォルトの仮定の無批判な受け入れは、必然的にアルゴリズムシステムの差別的な設計につながり、社会階層を固定化し疎外されたグループに対する暴力を正当化する考えを、繰り返し生み出すことになる」。

関連記事:IBMが顔認識技術から撤退、CEOは偏向と不平等の廃絶を訴える

原文へ
(翻訳:sako)

AI業績予測のゼノデータ・ラボが日銀短観など6指標の日次予測サービスを提供開始

xenodata lab xenoNowcast

AI業績予測のxenodata lab.(ゼノデータ・ラボ)は6月24日、金融情報のSaaS型AI分析サービス「xenoBrain」(ゼノブレイン)の機能のひとつとして、月次発表の業界統計値を日次で予測する独自の予測値「xenoNowcast」(ゼノナウキャスト)を発表した。

初回リリースとして、日銀短観(大企業・先行き・製造業)、日本製半導体製造装置(SEAJ速報値)、「景気の現状判断DI(季節調整値)」(全国、合計)を含む6指標について日次予測値の提供を開始する。また4指標の予測値を期間限定で無料公開。今後は、予測対象指標をユーザーの要望に応じ追加する予定。

xenoBrainは、AIにより経済ニュースや決算情報を自然言語処理技術で解析し、さまざまな経済事象の関連性を読み解き、経済・企業の将来予測をリアルタイムで提供するSaaS型AIサービス。

xenoBrain

xenoNowcastは、ニュースから学習した経済状況ベクトルを用いて、月次や四半期で発表される基準指標(日銀短観など)の今日時点の数値を毎日予測する独自の指標。xenoBrainの1機能として、希望ユーザー向けに毎日その前日の予測数値をメールで配信する。

予測数値の信頼性については、2014年1月1日以降のニュースをもとに基準指標の学習を行った結果を用いて日次で過去指数を算出し、基準指標と高い相関があることを確認しているという。

xenodata lab xenoNowcast

日銀短観や各種業界統計は、経済全体・各業界の景況感を判断する指標として用いられているものの、新型コロナウイルス感染拡大により業界環境や経済の先行きが不透明となっており、統計の数値が大きく変動する「変化点」を捉える重要性が増している。xenodata labは、xenoNowcastについて月次統計の数値を日次予測することで、統計発表前に変化点を捉えられる指標と位置付けており、xenoBrainユーザーの投資判断、事経営判断などをサポートするとしている。

関連記事
将来予測をする「Forecast Tech」領域のカオスマップ、ゼノデータ・ラボが公開
ニュースからAIで業績予測を行うゼノデータが7.8億円を資金調達

Googleドキュメントの文法チェック機能が英語に続いてスペイン語もサポート

スペイン語を書くことの多い人に朗報だ。米国時間6月23日にGoogle(グーグル)は、オンラインテキストエディターであるGoogleドキュメントのニューラルネットワークを使った文法チェック機能がスペイン語にも対応した。ただし英語の場合と同じく、この機能は目下G Suiteの利用者でないと使えない。G Suiteユーザーなら、今すぐ使うことができる。グーグルによると、この機能は今後一般ユーザーや教育機関にも提供される予定だ。

さらにグーグルは、ユーザーに代わってセンテンスを完成させるSmart Composeと自動スペルチェック機能のスペイン語版が2020年の終わり頃にGoogleドキュメントに追加されると発表した。。また、スペイン語の文法チェック機能は近くGmailにも搭載される。英語の文法チェック機能はGmailにすでに搭載されている。

グーグルが英語の文法チェックを導入したのは2019年2月のことで、Google Cloud Nextで発表されたのは2018年半ばのことだ(未訳記事)。Googleドキュメントには文法チェッカーが以前から搭載されていたが、新ツールではグーグルが翻訳サービスで培った機械学習の技術を利用している。ということは、グーグルは新しい言語をサポートするたびに新しいニューラルネットワークを訓練していることになる。

近い将来、他の言語もサポートして欲しいが、なにしろ現在、Googleドキュメントでサポートしているのは英語とスペイン語だけだ。

なおグーグルのツールは、ユーザーが書いている言語を自動的に認識するため、Googleドキュメントでは入力する言語を切り替える必要はない。

 

グーグルとMicrosoft(マイクロソフト)、Grammarlyが次世代型のスペルチェックと文法チェックを提供するようになり、数カ月前と比べてその競争が激しくなってきている。マイクロソフトとGrammarlyのまた違うアプローチをとっており、複数のアプリケーションで使えるエクステンション(拡張機能)を提供している。Microsoft Editorは一部のウェブアプリケーションでテキストフィールドをサポートしている。ただしMicrosoft Editorでは、Microsoft Wordが20以上の言語をサポートしているが、いずれも最先端のツールはしばらくの間、有料のユーザーだけが利用できるようになっている。それは、ニューラルネットワークはそれ自体だけでは動かないためだ。

[原文へ]
(翻訳:iwatani、a.k.a. hiwa