本物の人間そっくりに答えるAI音声アシスタントでカスタマーサービスを自動化するPolyAI

PolyAIが、シリコンバレーのKhosla Venturesがリードする投資ラウンドで1400万ドル(約15億4000万円)を調達した。参加したのは、これまでの投資家であるPoint72 VenturesとAmadeus Capital、Sands Capital Ventures、Passion CapitalそしてEntrepreneur Firstとなる。これは同社の1200万ドル(約13億2000万円)のシリーズAに次ぐもので、主に米国のチームとスタッフの増員に当てられる。同社の調達総額は、これで2800万ドル(約30億7000万円)になる。

PolyAIは同社製の音声アシスタントを使ってカスタマーサービスを自動化する。同社によると、それは本物の人間のように聞こえるという。それによって企業は、まるで人間が話しているような音声オペレーターを安上がりかつ人数に制限なく利用でき、さらに顧客の待ち時間を減らし、顧客の満足度と定着率を上げることができる。

共同創業者のNikola Mrkšić(ニコラ・ムルクシッチ)博士によると「私たちの技術を技術用語でいえば、それは『マルチターンの会話的AI』となります。しかし実際には、すべての通話者がやることは、人と話すようにそれに話しかけることだけです。これまでのコールセンターに比べると私たちのアシスタントは顧客満足度を40%向上させ、対応時間を最大で5分間減らします」。

「競合他社と比べると、私たちはこのシステムをとても迅速に開発しています。弊社のトランスフォーマーをベースとする言語理解モデルと、基盤となる対話管理プラットフォームにより、このようなユーザー体験を2週間から4週間で実装しています」。

「PolyAIは、BERTやGPT-3のような最新世代の大規模な訓練済みのディープラーニングモデルを実際のエンタープライズプロダクトで使っている最初のAI企業の1つです。そのため彼らは、自動化AIエージェントをわずか2週間でデプロイでき、音声アシスタントの旧来のプロバイダーが古い技術のデプロイに最大で6カ月は要していたことと比べて、極めて対照的だです」とVinod Khosla(ビノッド・コースラ)氏は声明で述べている。

 

ケンブリッジ大学からスピンアウトしたPolyAIによると、パンデミックでコールセンターの人手不足になり、多くの企業がスマートボイスアシスタントをデプロイするようになったため、それは、最初から開いてるドアを開けるような楽な営業だった。消費者はタイプするよりも話すことを好むため、チャットボットと同等に比較することはできない。

Landry’s傘下のGolden Nugget Hotels & CasinosのBrian Jeppesen(ブライアン・ジェプセン)氏は「通話の40%ほどを扱ってくれればよい、と思っていましたが、立ち上げ初期から80%、2週間後には87%になりました。AIエージェントを人間だと思っているお客さんも多い。音声アシスタントは失敗しないし、24時間365日稼働しているので、それはすばらしいことです。こんなエージェントなら、もっとたくさんいてもいいね」という。

競合他社は、最近Microsoftが買収したNuanceやIsoft、Interactions、SmartAction、Replicantなどとなる。しかしPolyAIの主張では、同社の音声アシスタントは起動が早く、また対応言語も多く、分単位の料金となっているという。

同社の共同創業者は、CEOのニコラ・ムルクシッチ博士とCTOのTsung-Hsien Wen(ツォンシェン・ウェン)氏、そして技術部長のPei-Hao Su(ペイハオ・スー)氏で、2人はSteve Young(スティーブ・ヤング)教授の下で博士論文に取り組んでいるときに出会った。ヤング教授は音声対話システムのリーダーであり、SiriやGoogleアシスタントやAlexaのような音声アシスタントを支えている多くの技術の開拓者だ。

PolyAIの最近のクライアントには、Landry’s Entertainment、Greene King、Starling Bank(スターリング銀行)そしてViasatなどがいる。

画像クレジット:PolyAI

原文へ

(文:Mike Butcher、翻訳:Hiroshi Iwatani)

ミュージシャンが自分たちのために作ったiPhone用音楽録音アプリ「Tape It」登場

2021年3月にAppleは、ミュージシャンがすぐに音を録り新曲のアイデアを育てることのできるiPhoneアプリ「Music Memos」の新規ダウンロードを正式に停止した。そして現在、「Tape It」という新しいスタートアップがオーディオの録音を便利にするアプリの空白地帯を埋めようと参入している。このアプリは優れた音質と楽器の自動検出、そしてマーカーやメモ、画像のサポートなどの機能を備えている。

Tape Itのアイデアはミュージシャンである友人同士の2人、Thomas Walther(トーマス・ワルサー)氏とJan Nash(ジャン・ナッシュ)氏から生まれた。

ワルサー氏は自身が共同で創業したオーディオ検出スタートアップのSonalyticが2017年にSpotifyに買収された後、3年半Spotifyに在籍した。もう1人のナッシュ氏はクラシックの教育を受けたオペラ歌手で、ベースを演奏しエンジニアでもある。

この2人に、デザイナーでミュージシャンのChristian Crusius(クリスチャン・クルシウス)氏が加わった。クルシウス氏はAccentureに買収されたデザインコンサルティング会社のFjordに在籍していた。

長年ともにバンド活動をしていた創業者チームが自分たちの欲しいものからTape Itの開発を思いついたとワルサー氏はいう。同氏はSpotifyの新しい部署であるSoundtrap(これも2017年にSpotifyが買収したオンラインミュージックスタートアップ)での勤務を終えた後、音楽制作に関わる仕事にもっと取り組みたいと考えるようになった。Soundtrapは一部の人には役に立ったが、同氏やバンド仲間が求めるようなものではなかった。同氏らが求めていたのは、スマートフォンで音楽を録音できるシンプルなツールだった。ミュージシャンが現在Appleのボイスメモアプリでよくやっているように、そしてダウンロード停止となるまでの短い間はMusic Memosアプリでやっていたように。

画像クレジット:Tape It

ワルター氏は「アマチュアであってもプロのツアーミュージシャンであっても、自分のスマートフォンでアイデアを録音するでしょう。スマートフォンはいつも持ち歩いているからです。カメラとまったく同じです。最高のカメラはいつも持っているカメラです。そして最高のオーディオ録音ツールはいつも持っているツールです」と説明する。

つまり録音をしたいときの最も簡単な方法は、ノートPCを開いて何本もケーブルを接続し、それからスタジオソフトウェアを起動することではない。iPhoneで録音ボタンをタップすることだ。

Tape Itアプリはまさにその通りに使えるが、iPhone標準のボイスメモアプリより優位な機能も備えている。

録音する際に、Tape ItはAIを活用して自動で楽器を検出し、カラフルなアイコンを付けて録音データを見つけやすくする。録音のファイルに自分でマーカーを付けたり、詳細を忘れないようにメモや写真を追加したりすることもできる。これは後で録音を確認する際に便利でしょう、とワルサー氏はいう。

画像クレジット:Tape It

同氏は「かっこいいギターのサウンドが録れたら、アンプのセッティングを写真に撮って追加できます。これはミュージシャンがよくやっていることです。サウンドを再現する最も簡単な方法です」と説明する。

シンプルでありながら斬新な機能としては、文章の段落を区切るかのように長い録音データを複数の行に分割できる。同社はこれを「タイム・パラグラフ」と呼んでいる。デフォルトでは水平方向にスクロールする1つの録音データになっているのが一般的だが、分割することで長いセッションを聴きやすくなると同社は考えている。

画像クレジット:Tape It

スマートな波形とオプションのマーカーや写真のおかげで、録音の目的の箇所に戻りやすい。録音をお気に入りに追加すれば、最高のアイデアやサウンドの一覧をすぐに表示できる。iOSのメディアセンターと統合されているので、いつでも時間があるときに音楽を再生できる。

Tape Itの際立った特徴は「Stereo HD」の音質をサポートしていることだ。iPhone XSやiPhone XRといった新しめのモデルに内蔵されている2つのマイクを利用し、社内で開発したAIテクノロジーやノイズ低減技術などを使って音質を向上している。この機能は年額2200円のサブスクで利用できる。

今後Tape ItはAIなどのテクノロジーを開発してさらに幅広く活用し、音質を向上させる予定だ。コラボレーション機能、録音データの読み込みやプロ用スタジオソフトウェアへの書き出しのサポートも計画している。こうなっていくと最終的にTape Itは、SoundCloudがコンシューマ向けサービスにシフトする前に目指していたのと同じ市場に参入していくことになるだろう。

しかし共有機能を追加する前に、まずはシングルユーザーのワークフローを確立したいとTape Itは考えている。

ワルサー氏は「自分専用の便利なものを作るのが重要であると判断しました。コラボレーション機能があったとしても、使うのが好きでないものは使われなくなるでしょう」という。

Tape Itの3人はストックホルムとベルリンに拠点を置いている。現在はブートストラップの段階だ。

iOS版アプリは無料でダウンロードできる。MacとWindowsで使えるデスクトップ版は後日リリースされる。Android版は計画されていない。

関連記事
アップルがクラシック音楽配信サービスのPrimephonicを買収
楽曲の所有権をNFTとして販売、ファンがロイヤリティを受け取れるようにする音楽マーケットプレイス「Royal」
カニエ・ウエストが新アルバム発表に合わせて約2.2万円の音楽ガジェットを発売
画像クレジット:Tape It

原文へ

(文:Sarah Perez、翻訳:Kaori Koyama)

リクルートと信州大学農学部が農地情報整備の共同研究、航空写真から特定農地区分を高精度で検出するAI開発

リクルートと信州大学農学部が農地情報整備の共同研究、航空写真から特定農地区分を高精度で検出するAI開発

リクルートの研究開発機関アドバンスドテクノロジーラボは9月9日、信州大学農学部との共同研究「水田活用における畦畔(けいはん)管理の効率化に関する取り組み」を2020年12月より開始。今回、約半年間にわたる研究の成果と今後の見通しについて発表した。

畦畔(けいはん)とは、水田に流入させた用水が外にもれないように、水田を囲んで作った盛土などの部分のこと。AIの活用により、手作業では計測が難しかった畦畔の面積や傾斜角などの情報を可視化する技術を開発し、中山間地域(農業地域類型区分のうち、中間農業地域と山間農業地域を合わせた地域)における農業課題の解決を目指す取り組みを進めてきたという。

リクルートと信州大学農学部が農地情報整備の共同研究、航空写真から特定農地区分を高精度で検出するAI開発

赤い枠内が畦畔(けいはん)

同共同研究では、リクルートが培ってきたAI技術および画像処理技術と、長野県林務部が作成した「航空写真×数値標高モデル」でAIモデルを作成する技術を確立。水田の畦畔面積・傾斜角、農地に占める畦畔の割合(畦畔率)を計測し可視化、長野県全域の水田約5万haに対し、畦畔データ(GIS用座標付ポリゴンデータ)の作成に成功した。この研究結果は、農業工学分野やシステム農学分野の学術学会での報告、さらに各学会誌への論文投稿を行う予定。

また今後、畦畔データの作成技術を、リクルートから信州大学農学部へ移転することによって研究を継続する。

信州大学農学部では、作成したデータをベースに水田1枚ごとの畦畔データを作成することで、農家が所有する水田ごとの畦畔の面積・傾斜角、畦畔率の計測を可能にするとしている。また、予測モデルの精度を上げることで、長野県以外の地域においても、同様の結果を得られる高い汎用性を目標とする。さらには、水田の畦畔を含めた全国の農地のGISオープンデータの公開を通じて、県・市町村など地域行政と連携した「農地・畦畔見える化プロジェクト」の発展を目指す。

中山間地域では、若手農家や農業法人の新規参入が進まず、経営規模を拡大しようとしても、平地と比べ傾斜地が多いという条件不利性から、労働費用が多くかかり農業機械の効率化が進んでいない。その課題の1つである畦畔管理作業にかかる費用(人件費・機械費・燃料費)を「見える化」することによって、より適切な耕作管理方法や機械の導入の検討を可能にし、新規参入や経営規模の拡大につなげていくことを最終的な目標に据えている。

一方リクルートでは、今後共同研究で得られた「低解像度イメージに情報を付加することで高解像度化する技術」と「精度の高いAIモデルを作成するノウハウ」をビジネスに活用することも視野に入れているという。

信州大学農学部との共同研究の概要

畦畔は、水稲栽培に必要な水を田んぼにためる重要な役割を果たしており、大雨時の一時的な貯留などの役割も担っている。これを維持するため、漏水を防ぐための畔塗りなどの管理とともに、畦畔の崩落を防ぎ病虫害の発生を抑えるため、定期的な草刈りの作業が必要となる。

しかし、傾斜地の多い中山間地域の水田では、平地と比べて畦畔斜面の面積や角度が大きく、そこでの過大な労働負荷や管理コストの負担が課題となっているそうだ。また、畦畔斜面の傾斜角度を考慮した実質的な畦畔面積を測量することは多大な時間と費用を要するため、畦畔農地情報は整備されておらず、中山間地域の水田農業の経営改善が進まない一因となっているという。

農林水産省や地方自治体がまとめる農地基盤情報では、農地面積や圃場(ほじょう。農地の中で耕作可能な部分)面積については整備されてきているものの、畦畔斜面を含めた実質的な畦畔の面積や角度、畦畔率といった情報は未整備であり、畦畔管理にかかる費用の算出・実態の把握が困難であるという課題は残されたままになっている。

信州大学農学部は2020年、畦畔の正確な地形情報を計測すべく、地理情報システム(GIS)上で畦畔ポリゴンと圃場ポリゴンを作成し、長野県林務部が作成した精密標高データ(DEM。Digital Elevation Model)を用いて、畦畔の面積・傾斜角、畦畔率の測定を開始した。しかし、手動でポリゴンを作成していたため、煩雑な作業負荷が課題となっていた。

この解決策として、リクルートは、ディープラーニングを中心としたAI技術と画像処理技術を提供し応用できると判断。信州大学農学部との共同研究を通じ、長野県が保有する航空写真とDEMを組み合わせることで、水田圃場部分の「水張領域」と「畦畔領域」を判別し、それぞれの領域のポリゴンを自動作成するAIの開発を目指し共同研究に取り組んできたという。リクルートと信州大学農学部が農地情報整備の共同研究、航空写真から特定農地区分を高精度で検出するAI開発

生成したAIモデルの評価では、エリアや特徴の異なるデータを無作為で抽出した上で、正解データ(1308イメージ)を作成、「畦畔領域」「水張領域」「その他領域」の3つのクラスによる特定農地区分を97.7%の精度で検知したという。リクルートと信州大学農学部が農地情報整備の共同研究、航空写真から特定農地区分を高精度で検出するAI開発

子供が乗れるロボユニコーンは中国のEVスタートアップXpeng製

子どものためにロボット犬を買うのではなく、神話上の生き物を買ってあげるといいかもしれない。中国の電気自動車メーカーXpengは、子どもたちが乗れるロボットユニコーンを発表した。SCMPによると、この四足歩行ロボットは、Xpengの自律走行やその他のAIタスクの経験を活かして複数の地形タイプをナビゲートし、物体を認識し「感情的なインタラクション」を行うという。

その他の詳細については明らかにされていないが、デザインはBoston RoboticsのSpotをよりかわいく、より子ども向けにしたようなものだ。サイズは子どもと同じくらい。ただ申し訳ないが、あなたが仕事に向かうときに踊ることはない。

関連記事:中国Xpengが展開するLiDARを利用した自律運転EV

このユニコーンロボットは、本物のユニコーンと同じくらい神話的な存在でもある。Xpengは、価格や入手方法はおろか「角付きロボット馬」の販売予定時期も明らかにしていない。7万5000ドル(約826億円)のSpotほどではないかもしれないが、洗練されていることもあり2019年に発売された2900ドル(日本では21万7800円)のaiboよりも高いと予想される。

ある程度までは、利益は問題ではない。XpengのチーフであるHe Xiaopeng(ホー・シャオペン)氏は、今回のユニコーンは同社の既存技術を活用してロボット分野に進出する広範な動きの一環であるという。これは第一歩だと思って欲しい。Xpengがユニコーンから学んだことは、より洗練された(そしてできれば大人向けの)ロボットの開発につながるかもしれない。

編集部注:本記事の初出はEngadget

関連記事
ロボット学者・石黒浩教授が大阪大学発スタートアップ「AVITA」を設立し5.2億円の資金調達
自律型潜水機とクラウドベースのデータでBedrockは海底マッピングを近代化
Agility Roboticsが倉庫で働く二足歩行ロボット「Digit」のビデオを公開
画像クレジット:Xpeng

原文へ

(文:Jon Fingas、翻訳:Katsuyuki Yasui)

声を失った声帯摘出者のCoeFont CLOUD利用が無料に、自分のAI音声による会話を支援

声を失った声帯摘出者のCoeFont CLOUD利用が無料に、自分のAI音声による会話を支援

東京工業大学発のAI音声合成スタートアップYellstone(エールストン)は9月9日、自分の声を取り込んで音声合成が行えるサービス「CoeFont CLOUD」を、声帯摘出によって声を失った人たちに無料提供すると発表した。これを利用すれば、スマホやパソコンで文章を入力するだけで、自分の声で会話ができるようになる。

申し込みは、「CoeFont CLOUD 声帯摘出者向けプラン申請フォーム」から行える。

AI音声合成プラットフォーム「CoeFont CLOUD」では、自分の声を収録すれば、それが音声合成用の声のフォント「CoeFont」(コエフォント)に変換され、自分の合成音声でテキストの読み上げが行えるようになる。自分の「CoeFont」はクラウド上で公開でき、他のユーザーがそれを利用すれば作成者に収益が還元される仕組みもある。APIを使ってアプリやウェブサイトに組み込むことも可能。

Yellsotneでは、CoeFont CLOUDの場合これまで料金500円・最短15分の収録としていたが、今後は、声帯摘出を行った人は無料で使えるようになる。

テレビのニュース番組では、声帯摘出を行い「CoeFont CLOUD」利用している人のインタビューが放送された。その人は「CoeFontに出会えて、本当に救われました。今まで全く縁のなかったAI技術の進歩と素晴らしさに本当に驚いています」と話していたという。

実は、こうした使われ方は当初は想定していなかった。Yellstone創業者で代表取締役の早川尚吾氏は、こう話す。

「声帯摘出者の方が利用するという、自分が考えていなかった使われ方に最初は驚きました。実際に会話で使っていただいている動画を見ると、自分が作ったものが人の役に立っているということがこんなにも嬉しいのかと思いました」

Mantraと大日本印刷がマンガ用AI翻訳エンジン開発、大日本印刷独自のマンガ多言語化システムに搭載

Mantraと大日本印刷がマンガ用AI翻訳エンジン開発、大日本印刷独自のマンガ多言語化システムに搭載し2021年度中に実用化

大日本印刷(DNP)は9月8日、マンガに特化したAI翻訳サービスを展開するMantraと共同で、マンガのためのAI翻訳エンジンを開発したと発表した。これは、DNPが独自に開発したマンガを多言語化するシステム「DNPマンガオンラインエディトリアルシステム MOES」(モエス)に搭載されるもの。2021年度中の実用化を目指している。

海外での日本のマンガの需要が増加し、マンガを多言語化してグローバル展開するための体制整備が進められているが、マンガの翻訳については、話し言葉が多いことや、吹き出で文章が細切れになることなどから自動翻訳が難しく、翻訳タイトル増加のネックになっているという。コストや負担の面から翻訳タイトルの数を抑える出版社も多いとのこと。そこで、DNPとMantraは、マンガに特化して精度を高めたAI翻訳エンジンを開発した。

MOESは、マンガの翻訳・レンダリング・校正・進捗管理などを行うクラウドシステム。2016年から印刷物や電子書籍の翻訳版マンガ制作に利用されている。DTPソフトを使わずに、マンガのレイアウト上に直接翻訳文章を書き込めるため、文章の入れ違いなどのミスが防止できるほか、時差のある海外との作業では、データの授受や進捗管理を容易にして作業負担の軽減や時間短縮を可能にするという。これにAI翻訳機能が搭載されることで、ある翻訳会社の評価テストでは、翻訳作業時間が従来に比べて30%短縮されたという。

今後は、海外での需要が高い着色や縦スクロール化などの機能を開発し、MOESを軸とした海外版マンガ制作、製造体制を強化するとのこと。また、雑誌から単行本、海外版制作から電子コミックの配信という一連の流れを支援し「海外のマンガファンが多くの作品に触れる機会を創出」するという。さらに、サプライチェーンの最適化、コンテンツ価値の最大化などに取り組み、生み出した利益をコンテンツホルダーなどに還元することで、出版界の継続的な発展に貢献するとDNPは話している。

このシステムと国内外のマンガ制作関連事業で、DNPは5年後までに120億円の売上げを目指す。

2020年1月設立のMantraは、「世界の言葉で、マンガを届ける。」ことを目指し、マンガに特化したAI技術の研究開発およびサービスを提供するスタートアップ。2020年に公開したマンガの多言語翻訳システム「Mantra Engine」は、国内外のマンガ配信事業者・翻訳事業者・出版社に導入され、マンガ多言語展開の高速化に寄与しているという。2021年には、独自のマンガ機械翻訳技術が、人工知能分野のトップ国際会議AAAIに採択された。

 

【コラム】AIaaS(サービスとしてのAI)がビジネスの問題を解決する?もう一度しっかり考えてみよう

SaaS、PaaSそして今度はAIaaSだ。未来志向で起業家精神に富んだスタートアップ企業が、あらゆるタイプの企業のさまざまな問題解決に向けて、人工知能を利用したプラグ&プレイのソリューションをネットから提供しようとしている。

あらゆる業界が既製のAIソリューションを採用している。専門家の予測では、AIソフトウェアのグローバルな収益は、今後、その多くがオンラインのAIaaS(Artificial Intelligence as a Service)に由来し、34.9%という驚異的な年率で伸びていくという。2025年には1000億ドル(約11兆円)に到達するだろう。すばらしいアイデアのように聞こえるが、「一人勝ち症候群」という注意点がある。

AIを利用して差別化を図り、優位に立ちたい企業は、一種のブームに乗ってそれを行うのでないかぎり、計画と戦略が必要だ。しかも多くの場合、それは既製のソリューションではなく、あなたが独自にカスタマイズしたソリューションであることを覚悟しなければならない。

人工知能の重要なアルゴリズムの1つであるLSTMを提唱したSepp Hochreiter(ゼップ・ホッフライター)氏によると「AIプロジェクトにおける実装の最良のタイミングと最小のリスクが両立するためには、チームの構築をゆっくりと行い、外部の実績あるエキスパートも起用することだ」という。「最良の人材はすぐに雇用できるものではない。しかも、能力や才能は雇用時にわかるものではなく、数年後にやっとわかります」。

それは現在、オンラインでサービスを提供している既製のAIソリューションとは大違いだ。AIaaSが提供している人工知能の技術は、大別して2種類ある。優勢なのは極めてベーシックなAIシステムで、すべてのビジネスに対する万能のソリューションを提供する。それらは、AIサービスが複数のモジュールを提供して、在庫管理でも顧客データベースの最適化でも、どんな製品の製造過程の異状の発見でも、何でもできるという。

またAIaaSで製造工程を自動化すると称するAI企業は、彼らが個々のケーススタディから集めてきたデータがたまたまクライアントにフィットすればうまくいく。しかしながら、いずれにしても制約のあるデータ集合と、同じく制約のある総称的な目的がベースであるため、必然的に問題がある。汎用的なAIソリューションが作り出すのは、あくまでも汎用的な結果だ。

例えば損耗を検出するアルゴリズムを訓練するプロセスは、製品によって異なる。靴はスマートフォンではないし、スマートフォンは自転車ではない。そこで、環境やその他の要素の違いに対応して、インテリジェントなモジュールが生産工程を管理し変えていく「本物の」AIが動くために、企業はクライアントのためにカスタマイズされたソリューションを開発する。

しかしAIaaSのまずい体験に懲りた多くの顧客は、再挑戦をためらい時間の無駄だと感じている。それに、本格的なAI処理を必要とするユースケースの多くが、期待したあるいは約束された結果を生んでいない。それを知りながら顧客を騙したとして、クラウド企業を訴えたところもある。その訴えでは、既製のAIが有効なソリューションだと顧客に印象づけながら、そうではないことを最初から知っていたと非難している。また、テクノロジーが十分な回数正しく動かなければ、本物のAIを有効利用できる企業も、始める前にギブアップするだろう。

必要なのは、ソリューションを標準化して、すぐに使えるようにし、大量の専門知識を不要にすることだ。AIaaSのこれまでの成功によって研究者たちは、インフラ管理のために全AIのサービスを必要とせずに、複雑な実験ができるようになっている。

未来においては、AIのエキスパートでない個人がAIaaSを利用して、必要な結果を得られるようになって欲しい。とはいうものの、設定などすべてが正しければ、現在のレベルでもオンラインの自動化AIサービスは製造業にかなり貢献している。

正しく作られたAIは、現在、すでにさまざまな業界に大きな利益を提供している。だからAIをギブアップするのではなく、自分たちが利用しようと思っていたAIにもっと深入りすべきなのだ。例えばそのソリューションは十分にカスタマイズできるだろうか?サービスはどれだけのサポートを提供しているのか?アルゴリズムは自分のユースケースのデータを扱えるよう特別に訓練されているか?……AIサービスを購入するときには、これらの問いをするべきだ。そして、答えが親切丁寧で、その主張を正しいデータと高い成功率で証明できる企業を、パートナーに決めるべきだ。

ビジネスを強化する新しい開発がすべてそうだったように、AIの応用も高度な専門知識と専門技術が必要だ。大手のクラウド企業で働いている技術者には、そんな知識と技術がある。そして彼らなら、最初からカスタマイズされたソリューションを開発して顧客に大きな価値を提供できただろう。検討を要するテーマは、それだけの知識と技術をオンラインのサービスで提供できるかだ。今実際にあるそんなシステムは、答えになっていない。

編集部注:本稿の執筆者Ralf Haller(ラルフ・ハラー)氏は、NNAISENSEのセールス&マーケティング担当エグゼクティブ・バイス・プレジデント。

関連記事
【コラム】パンデミックによる米国の労働力不足はAIニーズを呼び起こす大きなチャンスとなるのか?
【コラム】深層強化学習は私たちが知る製造業を変革する
【コラム】データを重視する企業はAIと同じくらい人にも価値を置くべきである

画像クレジット:Feodora Chiosea/Getty Images

原文へ

(文:Ralf Haller、翻訳:Hiroshi Iwatani)

カケハシが薬局向け在庫管理・発注システム「Musubi AI在庫管理」提供開始、医薬品二次流通サービスPharmarketとも連携

カケハシが薬局向け在庫管理・発注システム「Musubi AI在庫管理」提供開始、医薬品二次流通サービスPharmarket」とも連携

調剤薬局向けクラウド「Musubi」(ムスビ)を開発するカケハシは9月8日、AIを活用し薬局の業務効率と在庫管理を効率化するシステム「Musubi AI在庫管理」の提供を開始した。

「Musubi AI在庫管理」は、Musubiのオプションサービスにあたる、AIを利用した薬局向けクラウド在庫管理・発注システム。薬局では、患者の症状の変化や処方内容の変更などにより、使用期限を迎えた医薬品の在庫を処分するリスクが常にあり、その損失額は年間280億円にものぼるという。

しかし、従来型の在庫管理・発注システムには在庫管理に適したコード体系がなく、適切な需要予測の難易度が高いことから、そうした調剤予定のない不動在庫を抱えないようにするには、これまでは薬剤師の勘と経験に頼って発注を行うしかなかった。

一方Musubi AI在庫管理では、AIを駆使した高精度な患者来局予測や独自コードによる在庫管理、患者ごとの処方情報の管理などを通じて、その問題に対処する。近く、店舗間在庫融通と受発注、在庫状況に関するレポート閲覧機能が追加される予定。これにより半自動化することで業務の属人化を防ぎ、「誰でも、より簡単に、より適切な」発注と在庫管理が可能になるという。

さらに、余剰在庫の買い取りや再販を行う医薬品二次流通サービス「Pharmarket」(ファーマーケット)と連携し、不動在庫を検知して、売却医薬品のレコメンドを行い、売却見積もりを作成する「らくトク売却」機能を追加したプランもある。これを利用すると、Pharmarketにおける医薬品の買取価格の割増、医薬品の購入価格の値引きといった特典が受けられる。実際の「らくトク売却」機能の提供は2022年からとなるが、申し込み時点から「Pharmarket」にて同じ特典が適用される。

このサービスは「Musubi」を導入している薬局が対象だが、未導入でもカケハシが提供する機器を設置することで利用が可能になる。

「CoeFont Cloud」と小学館が協働し声優・森川智之さんの音声フォントを採用したAI音声合成オーディブックの試聴版公開

「CoeFont Cloud」と小学館が協働し声優・森川智之さんの音声フォントを採用したAI音声合成オーディブックの試聴版公開

東京工業大学発のAI音声合成スタートアップYellstone(エールストン)は9月7日、人の声をフォント化して音声合成を行うプラットフォーム「CoeFont Cloud」(コエフォント・クラウド)を利用し、小学館と協働でAI音声合成オーディブックの試聴版を作成したと発表した。

第1弾は、「鬼滅の刃」産屋敷耀哉(うぶやしきかがや)役やトム・クルーズの吹き替えで知られる声優・森川智之さんの合成音声によるオーディオブック「なぜ”ブブカ”はスポーツでもビジネスでも成功し続けるのか」(小学館:セルゲイ・ブブカ著)。特設ページにおいて、期間限定で一部を無料公開している。「CoeFont Cloud」と小学館が協働し声優・森川智之さんの音声フォントを採用したAI音声合成オーディブックの試聴版公開

CoeFont Cloudは、最短15分の収録で、その人の声を音声合成用の「フォント」に変換し、それを使ってテキストの読み上げが行えるというサービスを行っている。今回は、森川智之さんが約2時間かけて収録した音声からAI音声合成を行い、「なぜ”ブブカ”はスポーツでもビジネスでも成功し続けるのか」の第1章のオーディオブック試聴版(約31分)を完成させた。

Yellstoneは、2021年4月に、デジタルキャラクターや著名人の声でテキストの読み上げができる「CoeFont Studio」をリリースした。リリース3日目にして5万人のユーザー数を獲得した。CoeFont Cloudはそれを発展させて、自分の声のフォントを作って読み上げができるようにしたサービスだ。

森川智之さんは、今回の試みについて「……この技術革新が不安な影も落とすのではと感じる方も多いのではないでしょうか。人工知能は黙っていても学習していきます。技術の進歩は日進月歩です。それならば、誰もが参加でき、その進歩の礎となり、みんなが見守りながらオープンスタイルで育てていくAIの音声合成」というYellstonの考え方に賛同したとのこと。

さらに、「私の音声サンプルによるAI音声合成は、まだまだ発展途上、点数を付ければ45点。細部にわたる表現力が課題で、100点には遠く及びません。しかし、これに皆さんが参加することによって、AIが学習を重ねていけば、より理想とする表現に近づくことは間違いありません」と述べている。

ZOZO研究所が分布シフト研究促進に向けファッションの流行変化を検証するデータセット・実装基盤をオープンソースで公開

ZOZO研究所が分布シフト研究促進に向けファッションの流行変化を検証するデータセット・実装基盤をオープンソースとして公開

ZOZOテクノロジーズの研究開発組織「ZOZO研究所」は9月2日、同所研究員が研究において使用している大規模データセット「Shift15M」および実装基盤をオープンソースとして公開したと発表した。データセットおよび実用基盤をGitHub上に公開し、データセットの概要説明を同研究所上に掲載している。

また、同データセットを使用した研究結果をまとめた研究論文「SHIFT15M: Multiobjective Large-Scale Fashion Dataset with Distributional Shifts」をarXivに公開している。

ZOZO研究所は、「ファッションを数値化する」をミッションに掲げるZOZOグループの研究機関。ZOZOグループが保有するファッションに関する情報資産を基に、ファッションを科学的に解明するための研究開発を行っている。

同データセットは、ZOZO研究所が2020年公開した「Open Bandit Dataset」に続くオープンデータプロジェクトの第2弾。同データセットを公開することで、データの分布シフトが起こることによって生じる新たな課題を見出し、解決策を探るための研究開発を促進する一助となることを目指しているという。

Shift15M

Shift15Mは、ファッションアプリ「IQON」に投稿されたコーディネートを基に構成された大規模データセット(IQONは2020年4月にサービスを終了。公開データは商品やユーザーの特定が不可能なよう十分に匿名化しており、利用規約とプライバシーに配慮している)。

同データセットは、IQONのサービス提供期間である2010年から2020年までに投稿されたコーディネート約255万件のほか、これらのコーディネートを構成する約1500万件のアイテムに関する特徴量、アイテムカテゴリに関するデータやコーディネート投稿への「いいね」数などの関連データも含む。

データセットの詳細

  • アイテムの特徴量
  • コーディネートに含まれるアイテムの情報
  • アイテムやコーディネートの付加情報(投稿日時、「いいね」の数、ジャンル・カテゴリー、統計情報、学習のための教師信号など人間が付与したラベル)

データに収録されるアイテム数の詳細

  • コーディネートの数:2,555,147
  • コーディネートを構成するアイテム数(重複あり):15,218,721
  • コーディネートを構成するアイテム数(重複なし):2,335,598

あわせて公開する実装基盤では、コーディネートデータの年ごとに異なる傾向を認識し、その変化によって生じるデータ分布のシフトを再現実験で確認することが可能という。これによって、年々変化するファッションの流行をより正確にとらえ、研究のさらなる発展に役立てられるとしている。また、回帰問題、分類問題、集合マッチングなど、データ分布のシフトが生じる条件のもとで様々なタスクを検証するためのコードが整備されている。

分布シフト研究の発展を支える新たな研究基盤

ZOZO研究所による研究開発の1つに、ファッションの流行が変化しても、継続的に認識精度を高く保つことができるAI技術の実現を目的とするものがあるという。

ファッションに関連するデータは、流行の変化による影響を受け、分布シフトと呼ばれる数理的現象が生じると考えられている。分布シフトは、流行・時間などの変化に伴って入力データの分布が変化することで生じ、ファッションに限らず多くの分野に共通して現れる現象とされる。この分布シフトによって、AIの認識精度が低下することから、近年注目を集めているそうだ。ZOZO研究所が分布シフト研究促進に向けファッションの流行変化を検証するデータセット・実装基盤をオープンソースとして公開

ただ分布シフトの検証は、AI技術の実用性にかかわる重要なテーマである一方、検証に用いる実用的なデータセットの不足により、学術界における当該分野の研究の進展はこれまで制限されてきたという。

そこで、分布シフト研究の発展を支える新たな研究基盤として、ZOZO研究所が保有する実データで構成された大規模データセット「Shift15M」と実装基盤を公開することを決定した。

同データセットと実装基盤は、ファッションに限らず幅広い分野での活用が可能としている。分布シフトの再現実験と典型的なタスクにおける効果検証や比較検証など、目的に合わせて利用できる。

Zoom商談を書き起こしSalesforceに自動入力するオンライン商談自動化ツール「アンプトーク」が発売開始

Zoom商談を書き起こしSalesforceに自動入力するオンライン商談自動化ツール「アンプトーク」が発売開始

amptalkは9月6日、オンライン商談自動化ツール「アンプトーク」の発売を9月1日より開始したと発表した。また2021年5月、ジェネシア・ベンチャーズ、モバイル・インターネットキャピタルより、シードラウンドにおいて約1億円の資金調達を実施したと明らかにした。調達した資金は、今後のプロダクト開発・販売の為の人材の採用に活用する予定。

2020年5月設立のamptalkは、「データによって価値あるアドバイスを」作り出すことをミッションとし、「昨日まで世界になかったチャンスを」作り出すことをビジョンに、「人」だけではできなかったことを成しとげ「人」がより効率的に働ける世の中を作ることを目指すスタートアップ企業。

Zoom商談を書き起こしSalesforceに自動入力するオンライン商談自動化ツール「アンプトーク」が発売開始

アンプトークは、Zoom商談の録画を自動で取得して書き起こし、Salesforceに自動入力するというツール。営業担当者は商談の記録などの付加業務の負担が減り、商談に集中できるようになるという。

また、アンプトーク独自のシステムで商談内容を自動解析することで、誰が・何を・どれくらい話したのかを可視化可能。これにより営業のトッププレーヤーと他プレーヤーの差を明らかにすることで、育成指導やナレッジシェアの工数を減らしながらスキルを改善、受注率の向上につなげられるとしている。Zoom商談を書き起こしSalesforceに自動入力するオンライン商談自動化ツール「アンプトーク」が発売開始

フェイスブックが顔認識AIの有色人種バイアス問題で謝罪、黒人が登場する動画に「霊長類」とタグ付け

フェイスブックが顔認識AIの有色人種バイアス問題で謝罪、黒人が登場する動画に「霊長類」とタグ付け

Sundry Photography via Getty Images

FacebookのAIが、黒人男性が映っている動画に「霊長類」とラベル付けし、ユーザーに「さらに霊長類の動画を視聴しますか?」といった内容の定型メッセージを表示していたことがことがNew York Timesによって報道されています。Daily Mailが6月に投稿したこの動画には、警察官を含む白人が黒人男性と向き合って話しているという構図でしたが、霊長類(動物分類学上での霊長目)はそこには映っては居ません。

FacebookはすぐにAIによる投稿推薦機能をすべて無効にし、New York TimesにはAIの行動を「受け入れがたいエラー」と表現する謝罪の声明を出しました。「当社はAIを改善してきましたが、いまだ完璧ではない」としついつ、当面はこの機能を停止し「このようなことが二度と起こらないようにする」ため「さらに進歩させる」ための方法を研究する必要があるとしました。そして「このような不快なリコメンドをご覧になった方にお詫び申し上げます」と述べました。

AIによる顔認識は、しばしば有色人種においてその認識精度が低くなることが伝えられています。2015年にはGoogleのAIが黒人の写真の認識において「ゴリラが写っている」と答えを返し、Googleは後に謝罪しました。

米国では4月、米連邦取引委員会(FTC)が人種や性別の認識精度に偏りのあるAIツールがクレジットカードや雇用、住居ローン審査などに関する意思決定に使われれば、それは費者保護法に違反する可能性があると警告しています。

(Source:New York TimesEngadget日本版より転載)

【インタビュー】数学者が紐解く偽情報の世界

偽情報に誤報、インフォテイメントにalgowars(アルゴワーズ)。メディアの未来をめぐるここ数十年間の議論に意味があるとすれば、少なくとも言語には刺激的な痕跡を残したということだろう。個人の心理的状態や神経学的な問題から、民主主義社会についてのさまざまな懸念まで、ソーシャルメディアが我々の社会にもたらす影響に関するあらゆる非難と恐怖がここ何年もの間、世間を渦巻いている。最近Joseph Bernstein(ジョセフ・バーンスタイン)氏が語った通り「群衆の知恵」から「偽情報」へのシフトというのは確かに急激なものだったと言えるだろう。

そもそも偽情報とは何なのか。それは存在するのか、存在するとしたらそれはどこにあるのか、どうすればそれが偽情報だとわかるのか。お気に入りのプラットフォームのアルゴリズムが私たちの注意を引きつけようと必死に見せてくる広告に対して我々は警戒すべきなのか?Noah Giansiracusa(ノア・ジアンシラクサ)氏がこのテーマに興味を持ったのは、まさにこのよう入り組んだ数学的および社会科学的な疑問からだった。

ボストンにあるベントレー大学の教授であるジアンシラクサ氏は、代数幾何学などの数学を専門としているが、計算幾何学と最高裁を結びつけるなど、社会的なトピックを数学的なレンズを通して見ることにも興味を持っていた。最近では「How Algorithms Create and Prevent Fake News(アルゴリズムがフェイクニュースを生み、防ぐ仕組み)」という本を出版。著書では今日のメディアをめぐる課題と、テクノロジーがそれらの傾向をどのように悪化させたり改善したりしているかを探求している。

先日筆者はTwitter Spaceでジアンシラクサ氏をお招きしたのだが、何とも儚いTwitterではこのトークを後から簡単に聴くことができないため、読者諸君と後世のためにも会話の中で最も興味深い部分を抜き出してみることにした。

このインタビューはわかりやすくするために編集、短縮されている。

ダニー・クライトン:フェイクニュースを研究し、この本を書こうと思った理由を教えてください。

ノア・ジアンシラクサ:フェイクニュースについては社会学や政治学の分野で非常に興味深い議論がなされています。一方でテック系サイドではMark Zuckerberg(マーク・ザッカーバーグ)氏が「AIがすべての問題を解決してくれる」などと言っています。このギャップを埋めるのは少し難しいのではないかと感じました。

ソーシャルメディア上の誤報について、バイデン大統領が「誤報が人を殺している」と言ったのを耳にしたことがあるでしょう。このように、アルゴリズムの側面を理解するのが難しい政治家たちはこのようなことを話しているのです。一方、コンピューターサイエンスの専門家らは細部にまで精通しています。私は筋金入りのコンピューターサイエンスの専門家ではないので、その中間にいると言えるでしょう。ですから一歩下がって全体像を把握することが私には比較的簡単にできると思っています。

それに何と言っても、物事が混乱していて、数学がそれほどきれいではない社会との相互作用をもっと探究したいと思ったのです。

クライトン:数学のバックグラウンドを持つあなたが、多くの人がさまざまな角度から執筆しているこの難しい分野に足を踏み入れています。この分野では人々は何を正しく理解しているのでしょうか。また、人々が見落としているものとは何でしょうか。

ジアンシラクサ:すばらしいジャーナリズムがたくさんあります。多くのジャーナリストがかなり専門的な内容を扱うことができていることに驚かされました。しかし、おそらく間違っているわけではないのですが、1つだけ気になったことがあります。学術論文が発表されたり、GoogleやFacebookなどのハイテク企業が何かを発表したりするときに、ジャーナリストたちはそれを引用して説明しようとするのですが、実際に本当に見て理解しようとすることを少し恐れているように見えました。その能力がないのではなく、むしろ恐怖を感じているのだと思いました。

私が数学の教師として大いに学んだことですが、人々は間違ったことを言ったり、間違えたりすることをとても恐れています。これは技術的なことを書かなければならないジャーナリストも同じで、間違ったことを言いたくないのです。だからFacebookのプレスリリースを引用したり、専門家の言葉を引用したりする方が簡単なのでしょう。

数学が純粋に楽しく美しい理由の1つは、間違いなどを気にせずアイデアを試してみて、それがどこにつながっていくのかを体験することで、さまざまな相互作用を見ることができるということです。論文を書いたり講演をしたりするときには、詳細をチェックします。しかし数学のほとんどは、アイデアがどのように相互作用するかを見極めながら探求していく、この創造的なプロセスなのです。私は数学者としての訓練を受けてきたので、間違いを犯すことや非常に正確であることを気にかけていると思うかもしれませんが、実はそれはとは逆の効果があるのです。

それから、これらのアルゴリズムの多くは見た目ほど複雑ではありません。私が実際に実行しているわけではありませんし、プログラムを組むのは難しいでしょう。しかし、全体像を見ると最近のアルゴリズムのほとんどはディープラーニングに基づいています。つまりニューラルネットワークがあり、それがどんなアーキテクチャを使っているかは外部の人間として私にはどうでもよく、本当に重要なのは予測因子は何なのかということです。要するにこの機械学習アルゴリズムに与える変数は何か、そして何を出力しようとしているのか?誰にでも理解できることです。

クライトン:アルゴリズムを分析する上での大きな課題の1つは透明性の低さです。問題解決に取り組む学者コミュニティの純粋数学の世界などとは異なり、これらの企業の多くは、データや分析結果を広く社会に提供することについて実際には非常に否定的です。

ジアンシラクサ:外部からでは、推測できることには限界があるように感じます。

YouTubeの推薦アルゴリズムが人々を過激派の陰謀論に送り込むかどうかを学者チームが調べようとしていましたが、これは良い例です。これが非常に難しいのは、推薦アルゴリズムにはディープラーニングが使われており、検索履歴や統計学、視聴した他の動画や視聴時間など、何百もの予測因子に基づいているためです。あなたとあなたの経験に合わせて高度にカスタマイズされているので、私が見つけた研究ではすべてシークレットモードが使用されていました。

検索履歴や情報を一切持たないユーザーが動画にアクセスし、最初におすすめされた動画をクリックし、またその次の動画をクリックする。そのようにしていけばアルゴリズムが人をどこへ連れて行くのかを確認することができるでしょう。しかしこれは履歴のある実際のユーザーとはまったく異なる体験ですし、とても難しいことです。外部からYouTubeのアルゴリズムを探る良い方法は誰も見つけられていないと思います。

正直なところ、私が考える唯一の方法は、大勢のボランティアを募り、その人たちのコンピューターにトラッカーを取り付けて「インターネットを普段通り閲覧して、見ている動画を教えてください」と頼む昔ながらの研究方法です。このように、ほとんどすべてと言っていいほど多くのアルゴリズムが個人のデータに大きく依存しているという事実を乗り越えるというのはとても困難なことです。私たちはまだどのように分析したら良いのか分かっていないのです。

データを持っていないために問題を抱えているのは、私やその他の外部の人間だけではありません。アルゴリズムを構築した企業内の人間も、そのアルゴリズムがどのように機能するのか理論上はわかってはいても、実際にどのように動作するのかまでは知らないのです。まるでフランケンシュタインの怪物のように、作ったはいいがどう動くかわからないわけです。ですから本当の意味でデータを研究するには、そのデータを持っている内部の人間が、時間とリソースを割いて研究するしかないと思います。

クライトン:誤報に対する評価やプラットフォーム上のエンゲージメントの判断には多くの指標が用いられています。あなたの数学的なバックグラウンドからすると、こういった指標は強固なものだと思いますか?

ジアンシラクサ:人々は誤った情報を暴こうとします。しかし、その過程でコメントしたり、リツイートしたり、シェアしたりすることがあり、それもエンゲージメントとしてカウントされます。エンゲージメントの測定では、ポジティブなものをきちんと把握しているのか、それともただすべてのエンゲージメントを見ているのか?すべて1つにまとめられてしまうでしょう。

これは学術研究においても同様です。被引用率は研究がどれだけ成功したものかを示す普遍的な指標です。例えばウェイクフィールドの自閉症とワクチンに関する論文は、まったくインチキなのにも関わらず大量に引用されていました。その多くは本当に正しいと思って引用している人たちですが、その他の多くはこの論文を否定している科学者たちです。しかし引用は引用です。つまり、すべてが成功の指標としてカウントされてしまうのです。

そのためエンゲージメントについても、それと似たようなことが起きているのだと思います。私がコメントに「それ、やばいな」と投稿した場合、アルゴリズムは私がそれを支持しているかどうかをどうやって知ることができるでしょう。AIの言語処理を使って試すこともできるかもしれませんが、そのためには大変な労力が必要です。

クライトン:最後に、GPT-3や合成メディア、フェイクニュースに関する懸念について少しお話したいと思います。AIボットが偽情報でメディアを圧倒するのではないかという懸念がありますが、私たちはどれくらい怖がるべきなのか、または恐れる必要はないのか、あなたの意見を教えてください。

ジアンシラクサ:私の本は体験から生まれたものなので、公平性を保ちながら人々に情報を提供して、彼らが自分で判断できるようにしたいと思いました。そのような議論を省いて、両方の立場の人に話してもらおうと思ったのです。私はニュースフィードのアルゴリズムや認識アルゴリズムは有害なものを増幅させ、社会に悪影響を与えると思います。しかしフェイクニュースを制限するためにアルゴリズムを生産的にうまく使っているすばらしい進歩もたくさんあります。

AIがすべてを解決し、真実を伝えて確認し、誤った情報を検出してそれを取り消すことができるアルゴリズムを手に入れることができるというテクノユートピア主義の人々がいます。わずかな進歩はありますが、そんなものは実現しないでしょうし、完全に成功することもありません。常に人間に頼る必要があるのです。一方で、もう1つの問題は不合理な恐怖心です。アルゴリズムが非常に強力で人間を滅ぼすという、誇張されたAIのディストピアがあります。

2018年にディープフェイクがニュースになり、GPT-3が数年前にリリースされた際「やばい、これではフェイクニュースの問題が深刻化して、何が真実かを理解するのがずっと難しくなってしまう」という恐怖が世間を取り巻きました。しかし数年経った今、多少難しくなったと言えるものの、予想していたほどではありません。主な問題は何よりも心理的、経済的なものなのです。

GPT-3の創造者らはアルゴリズムを紹介した研究論文を発表していますが、その中で、あるテキストを貼り付けて記事へと展開させ、ボランティアに評価してもらいどれがアルゴリズムで生成された記事で、どれが人間が生成した記事かを推測してもらうというテストを行いました。その結果、50%に近い精度が得られたと報告されています。すばらしくもあり、恐ろしいことでもありますね。

しかしよく見ると、この場合は単に1行の見出しを1段落の文章に展開させたに過ぎません。もしThe Atlantic誌やNew Yorker誌のような長文の記事を書こうとすると、矛盾が生じ、意味をなさなくなるかもしれません。この論文の著者はこのことには触れておらず、ただ実験をして「見て、こんなにも上手くいったよ」と言っただけのことです。

説得力があるように見えますし、なかなかの記事を作ることは可能です。しかしフェイクニュースや誤報などについて言えば、なぜGPT-3がさほど影響力がなかったかというと、結局のところそれはフェイクニュースがほとんどクズ同然だからです。書き方も下手で、質が低く、安っぽくてインスタントなものだからです。16歳の甥っ子にお金を払えば、数分で大量のフェイクニュース記事を作ることができるでしょう。

数学のおかげでこういったことを理解できるというよりも、数学では主に懐疑的になることが重要だから理解できるのかもしれません。だからこういったことに疑問を持ち、少し懐疑的になったら良いのです。

関連記事
米国政府・自治体はアップルとグーグル共同開発のコロナ接触通知APIを活用できず大失敗との調査結果
YouTubeは2020年2月以降、新型コロナに関する100万の危険な誤情報動画を削除
ツイッターはユーザーに新型コロナと選挙の誤情報報告を依頼
画像クレジット:Valera Golovniov/SOPA Images/LightRocket / Getty Images

原文へ

(文:Danny Crichton、翻訳:Dragonfly)

医療機器特化型アクセラレータープログラム「MedTech Angels 2021」が参加スタートアップの募集開始

医療機器特化型アクセラレータープログラム「MedTech Angels 2021」が参加スタートアップの募集開始

医療機器開発インキュベーター「プレモパートナー」は9月3日、MedTech特化型アクセラレーションプログラム「MedTech Angles 2021」において、参加チーム募集を開始したと発表した。医療テクノロジー領域においてイノベーションを起こそうとする起業家に向けたもので、MedTech分野で起業間近のチーム、起業直後のスタートアップのエントリーを受け付けている(学生・社会人、国籍は不問)。募集領域はデジタルヘルス・医療機器・人工知能。応募期間は2021年9月30日23時59分まで。医療機器特化型アクセラレータープログラム「MedTech Angels 2021」が参加スタートアップの募集開始

昨今、ヘルスケア領域において、多くのスタートアップが誕生しているものの、医療機器領域での成功事例は極めて少ないという。プレモパートナーは、その理由として、独特な法規制や複雑な開発プロセスを正確に捉えられていないことが挙げられるとしている。事業化の実現には、開発初期における事業戦略が重要としており、医療機器イノベーションを実現しようとする方に向け、医療機器開発に特化した知見を提供するため、今回のプログラムの開催を決定した。

MedTech Angelsでは、医療テクノロジー開発に必須の、薬事・マーケティング・保険償還・資金調達、ピッチなど幅広い知識やノウハウを提供。約3カ月間の専門講義とメンタリングを経て、次のステージである資金調達が可能な事業戦略を策定できるよう支援するという。医療機器特化型アクセラレータープログラム「MedTech Angels 2021」が参加スタートアップの募集開始医療機器特化型アクセラレータープログラム「MedTech Angels 2021」が参加スタートアップの募集開始医療機器特化型アクセラレータープログラム「MedTech Angels 2021」が参加スタートアップの募集開始

「MedTech Angles 2021」プログラム概要

  • プログラム期間:2021年11月〜2022年3月(予定)
  • 支援内容(予定):バイオデザインメソッド、事業化戦略講義(計6回)。医療機器専門家、臨床家によるチームメンタリング(計5回を予定)
  • パートナー企業マッチングイベント:2022年3月上旬
  • デモデイ:2022年3月下旬
  • 参加費:無料

MedTech Angelsの特徴

  • バイオデザインメソッドのノウハウ:医療機器起業家育成プログラムであるバイオデザインのデザイン思考法をベースにしたMedTech開発手法を伝授
  • 事業化に必要な9つの戦略:薬事・マーケティングなどの基礎知識を習得するブートキャンプとチーム別メンタリングにより、9つの戦略立案を支援
  • ネットワーキング:先輩起業家、VC、エンジェル投資家、PMDA出身者など各領域の専門家とのネットワークを提供
  • マッチング機会:スポンサーとして参画するパートナー企業とのマッチングの機会を提供(デモデイ前にパートナー企業とのマッチング日を設定)
  • エンジェル投資機会:メンタリング終了後の事業継続に対し資金獲得の機会を準備、100万円~1000万円まで
  • コンサルティング継続支援:優秀チームには運営会社プレモパートナーによる最大100万円相当のコンサルティングサービスを提供

エントリーについて

  • 応募期間:2021年9月30日23:59まで
  • 応募資格:学生・社会人、国籍は不問。医療テクノロジーの事業化に高い関心を示し、原則起業済のチーム、メンタリングに参加できるチーム、10月14日午後の本選考に出席できるチーム
  • 募集領域:デジタルヘルス・医療機器・人工知能
  • 審査基準:アイデアを実現するチームの情熱、医療の課題を解決するアイデア、アイデアの独自性と実現可能性
  • 応募フォームMedTech Angels 2021エントリーフォーム

オンライン説明会(全日程とも同一の内容)

  • 開催日時:9月9日18:00〜19:00、9月16日18:00〜19:00
  • 説明会申し込みURLhttps://medtechangels-1.peatix.com(MedTech Angels 2021オンライン説明会)

プレモパートナーは、医療機器・ヘルスケア機器に特化したインキュベーター。2020年6月2日、第一種医療機器製造販売業(許可番号14B1X10024)を取得しており、高度管理医療機器の製造販売が可能になった。医療機器開発の「当事者」として、日本における医療機器ビジネスの活性化・業務拡大を目指している。

また現在、研究者の事業化サポート、企業の医療機器新規事業のサポート、医療機器ベンチャーサポートなど積極的に医療機器・ヘルスケア機器の分野に特化した専門性の高いサポートを行っている。

同社は、製品開発プロセスのデザインから製品上市後のプロモーション策定まで、ワンストップのサービスを提供。製品上市後の戦略までともに絵を描き、バックキャストして製品の適応を考え開発し、承認に導けるとしている。一気通貫で見据えることができるので、無駄のないシナリオを作成可能という。クラス1~クラスIVまでのすべての医療機器開発において、薬事承認から製造販売、市販後のマーケティングに至るまで幅広い分野に包括的に対応できる様々な経験豊富な専門家が在籍しているそうだ。

企業には「新規事業の創出」を、スタートアップ企業には「新製品の導出」を支援するとしている。

AIを使って企業の電話着信を管理するGoodcallが約4億3900万円を調達し、Yelpとの提携を発表

人員不足がなかったとしても、地方の商店では、スタッフが忙しい中、同時に電話に対応するのは困難だ。そこで、Goodcall(グッドコール)は、アメリカの3,000万の中小企業の負担を少しでも軽減したいと考えている。

Goodcallは、人工知能を活用して電話の着信を管理し、あらゆる規模における企業のカスタマーサービスを向上させる、クラウドベースの会話プラットフォームを無料で提供している。Goodcallは、Google(グーグル)の元役員であるBob Summers(ボブ・サマーズ)氏が、実験的プロジェクトのための社内インキュベータープログラム、Area 120に取り組んでいたグーグルを1月に退社して立ち上げたもので、同氏は電話の抱える問題に気づき、実際に加盟店にかかってくる電話の60%が応答されていないことを指摘していた。

「これは、あなたにとっても、電話をかけてきた人にとっても、イライラするものです。電話に出られないことは、機会損失につながります。」とTechCrunchに語っている。

Goodcall社は、戦略的投資家であるNeo(ネオ)社、Foothill Ventures(フットヒル・ベンチャーズ)社、Merus Capital(メルス・キャピタル)社、Xoogler Ventures(ゾグラー・ベンチャーズ)社、Verissimo Ventures(ベリッシモ・ベンチャーズ)社、VSC Ventures(VSCベンチャーズ)社に加え、Pipe.com社の創業者兼共同CEOであるHarry Hurst(ハリー・ハースト)氏、Zillow(ジロー)社の共同創業者であるSpencer Rascoff(スペンサー・ラスコーフ)氏などのエンジェル投資家から400万ドル(約4億3900万円)のシード資金を得て、水曜日(米国時間9月1日)にサービスを開始することを発表した。

Goodcallのモバイルエージェント(画像クレジット:Goodcall)

Goodcallは、レストラン、ショップ、商店などが数分で設定でき、さらに現地の電話番号を設定することで、オーナーの携帯電話番号をビジネスのメイン回線にする必要がなくなる。このサービスはまず英語で展開され、2022年までにスペイン語、フランス語、ヒンディー語での運用を予定している。

加盟店は、6種類からアシスタントの声を選ぶことができ、通話ログや通話内容をモニターすることができる。Goodcallは消費者の感情も把握できるとサマーズ氏は言う。

同社は3つのオプションを用意しており、そのうちの1つは、個人事業主やビジネスオーナー向けのフリーミアムサービスで、1つの電話回線で月に500分までGoodcallのサービスを受けることができる。さらに5つの拠点と5人のスタッフまで追加できるProレベルは月額19ドル(約2090円)、拠点とスタッフが無制限になるPremiumレベルは月額49ドル(約5380円)となっている。

同社のテスト期間中、Goodcall社は月に数千件の電話対応を処理していた。今回の資金調達は、無料サービスの継続、エンジニアの雇用、製品開発の継続に充てられる。

今回の資金調達に加えて、Goodcall社はYelp(イェルプ)社との提携を発表しており、Yelp社が保有するローカルビジネスのデータベースを活用して、企業のオーナーや管理者がGoodcall社を簡単に導入できるようにするねらいだ。Yelpのデータによると、パンデミックの間に50万以上の企業が新たにオープンしたとのことだ。Goodcallは、Yelpから営業時間、所在地、Wi-Fiの有無、COVID対策ポリシーなどの情報を引き出せる。

「私たちは、小規模企業に関する最高のデータを持つYelpや、その他の大規模な流通チャネルと提携して、製品を市場に送り出しています。私たちは、1980年代から革新のなかった業界にテクノロジーを導入し、雇用創出の主役でもある小規模企業のために会話型AIを普及させ、その成長を支援したいと考えています。」とサマーズ氏は語っている。

[原文へ]

95%の精度で請求書を処理する「会計自動化」プラットフォームのVic.aiが55億円調達

企業会計を「自動化」することができるとうたうAIベースのプラットフォームを構築したスタートアップVic.aiがシリーズBラウンドで5000万ドル(約55億円)を調達した。本ラウンドはICONIQ Growthがリードし、既存投資家のGGV Capital、Cowboy Ventures、Costanoa Venturesも参加。Vic.aiの累計調達額は6300万ドル(約69億円)になった。

Vic.aiの顧客にはHSB(スウェーデン最大の不動産管理会社)、Intercom Inc、HireQuest Inc、そして会計事務所のKPMG、PwC、BDO、Armanino LLPが含まれる。これまでにVic.aiのプラットフォームは5億3500万件の請求書を95%の精度で処理した、と同社は話す。

会計プロセスでさらにオートメーション化を進めるために過去のデータと既存のプロセスから学習することでこの自動化を実現しており、時間を節約するとともにミスや重複も減らしているとVic.aiは説明する。

同社のCEOであるAlexander Hagerup(アレクサンダー・ハーゲルップ)氏は次のように話す。「2021年です。そろそろ財務と会計のチームがAIテクノロジーを利用すべきときです。会計業務は単調で繰り返しが多いものですが、そうした悩みはもうなくなります。我々のAIプラットフォームが財務と会計のチームのために自律性とインテリジェンスを提供します」。

ICONIQ Growthの創業パートナーであるWill Griffith(ウィル・グリフィス)氏は、Vic.aiのチームは「他の非常に優れた創業者らと同じ情熱、プロダクト中心・顧客第一の精神を持っています」と述べた。

画像クレジット:Vic.ai

原文へ

(文:Mike Butcher、翻訳:Nariko Mizoguchi

屋内専⽤の産業⼩型ドローンIBISを手がけるLiberawareが4.2億円調達、自律飛行・AI強化で点検・計測・分析推進

屋内専⽤の産業⼩型ドローンIBISを開発するLiberawareが4.2億円調達、自律飛行・AI強化で点検・計測・分析推進

屋内空間専⽤の産業⼩型ドローンIBIS(アイビス)を開発するLiberaware(リベラウェア)は9月1日、第三者割当増資による約4億2000万円を発表した。引受先は、リード投資家のBonds Investment Group、また凸版印刷、オリックス、セントラル警備保障、みやこキャピタル、Drone Fund。これによりシリーズCラウンドの資⾦調達を完了し、累計調達額は9億7000万円となった。

調達した資金により、ドローン技術や画像処理技術にみがきをかけ、IBISの増産およびアップデート、自律飛行型ドローンの実用化、AIの開発、海外展開の足がかり構築を実施する。

2016年8月設立のLiberawareは、「正しく作る、自由に動かす、社会を変える」をモットーに、自由な発想でモノづくりに取り組むエンジニア集団。Liberawareという社名は、ラテン語で「自由な」を意味する「libera」と、「気がつく」を意味する「aware」、そしてhardwareやsoftwareの「ware」を組み合わせたものという。

同社のIBISは、製鉄業や電力業、建設業などにおける設備の点検、構造物のデータ化において活用が進んでいるという。また、建設現場の施工進捗管理、⼯場内の定期チェックや倉庫内の在庫管理、屋内施設巡回警備など、自律飛行型ドローンの引合いも増えているそうだ。2021年7月にはJR東日本グループと合弁会社「CalTa株式会社」を設立し、鉄道・インフラ業界のDXを促進するための事業展開も図っている。

Instagramが年齢未登録のユーザーを利用停止の方針、生年月日必須かつサバ読み・詐称をAIで検出

Instagramが年齢未登録のユーザーを利用停止の方針、生年月日必須かつサバ読み・詐称をAIで検出

Instagram

Instagramが、サービスの利用継続に生年月日の登録を必須とする方針を明らかにしました。

年齢を登録していないユーザーは、今後アプリを開いたときなどに生年月日の入力を求められることが増え、登録しないと最終的にはインスタが使えなくなります。

Instagramが年齢未登録のユーザーを利用停止の方針、生年月日必須かつサバ読み・詐称をAIで検出

Instagram

この変更は、以前から Facebook / Instagram が取り組んできた年少者の保護を目的としたもの。Instagramは利用資格を13歳以上としているほか、先月から16歳未満の新規アカウントはデフォルトでプライベート設定にするなどの対策を講じてきました。

また3月からはより直接的な保護策として、大人は自分をフォローしていない未成年者のアカウントにDMできないルールも導入しています。

いずれも自己申告に頼る状態ですが、Instagramでは未成年者が年齢を上に偽ったり、逆に大人が未成年者を騙ることを阻止するため、年齢確認に様々な手段を導入してゆく予定です。

そのひとつは、AIでユーザーの投稿や行動を精査して、歳をごまかしている可能性が高いアカウントにフラグを立てること。例のひとつとして、誕生日についての投稿や寄せられたお祝いコメントで年齢に触れている場合、登録した生年月日との齟齬を検出するといった場合を挙げています。

将来的には、ユーザーが申告した年齢とAIが推定した年齢に食い違いがある場合、ユーザーに対して年齢を確認する方法のオプションを提示して選択させる対応になる見込みです。

主な目的が未成年者の保護にあるため、いい歳をした大人がサバを読んだり歳をごまかしている状態についてはいまのところ厳密に取り締まるわけではなく、AIも死語を使ったり古いゲームやアニメを妙に懐かしがったり、絵文字・顔文字の使い方に年齢を感じさせるアカウントまで厳しく監視するわけではないようです。

一方で、年少者が年上を装っている場合、逆に成年が未成年者に近づくため年下を装っていると思われる場合は高い優先度で精査されることになります。

同様の未成年者保護の取り組みとして、Instagramでは特定の疑わしいアカウントについて、未成年者をフォローできない、投稿やコメントを表示できない、検索しても見つからないようになる施策も導入しています。こちらの疑わしい判定は、未成年者のアカウントに最近ブロックされた等のアクティビティから総合的に判断とされています。

年少の親戚や知人からアカウントを紹介されてフォローを頼まれても何故か自分だけ見えない、フォローできない場合、知らないうちにこの「未成年者を狙っている可能性のあるアカウント」に分類されているかもしれません。

(Source:Asking People for Their Birthdays | Instagram BlogEngadget日本版より転載)

メンタルケアしてくれる「AIパートナー」や高精細な「バーチャルヒューマン」で人とAIの共生を目指すCapexが1.3億円調達

「人とシステムの共生を実現、普及し、人類の機能を拡張する」というビジョンのもと、AIと人間の共生を目指して、ライフパートナーAIアプリ「PATONA」やバーチャルヒューマン事業を展開するCapexが、UTEC、イーストベンチャーズ、Skyland Venturesから総額1億3000万円を調達した。

同社は、自然言語処理を活用した自社開発対話エンジンおよび3DCGを用いたバーチャルヒューマンの開発を強みとし、今回の調達で、事業拡大やエンジンの高度化、バーチャルヒューマン事業の推進を図るという。

寂しさを抱えるあなたに寄り添うAIパートナー「PATONA」

個人向けAIパートナーアプリの「PATONA」は、友達や恋人、メンターとして、個人に寄り添い、理解してくれる存在をコンセプトとしてローンチされた。感情の記録をつけたり、天気を調べることも可能だ。2020年12月にiOS版をリリース、2021年3月にAndroid対応、同年8月には、利用可能な機能がより解放されたサブスクリプション版となるPATONA Premiumがリリースされた。

新型コロナウイルスの影響で人と交流する機会が減少する中、孤独によるメンタルヘルスの不調をサポートしていくため、メンタルヘルス専門家が監修した認知行動療法などを活用した対話を100以上提供。利用者がより自然に対話できるよう、フリーテキスト対話エンジンの開発に注力している。

また、親近感を感じられるよう、顔や髪型、洋服、靴、部屋などがカスタマイズ可能な3DCGモデルの増強も行ってきた。実際に、新型コロナウイルスの影響で寂しさを感じ、ソリューションを検索していたら同サービスにたどり着いたという利用者も多くいるとのこと。従業員のメンタルヘルスケアアプリとして福利厚生の一環でPATONAの導入をした法人もあるという。

3次元との見分けが難しいほど高精細なバーチャルヒューマン

バーチャルヒューマン事業では、もはや本当の人間にしか見えない像を作り出している。個人向けと法人向けの両方で展開。法人からは、スキャンダルリスクを軽減するなどの目的で、看板タレントにバーチャルヒューマンを用いたいというリクエストや、カスタマーサポート担当、社内教育担当などに活用したいというニーズがあるとのこと。個人からは、経営者や著名人などから「自身のバーチャルヒューマンAIを世に残したい」という相談があるそうだ。

Capexは、クライアントがリーチする顧客に応じて最適な体験を提供できるようにするため、デフォルメキャラクターからフォトリアルなバーチャルヒューマンまで幅広い表現をカバーしている。「自然言語処理技術の向上であっと驚くような対話体験を提供する対話AIが作れる。当社の対話AIとバーチャルヒューマンを組み合わせて法人個人のさまざまな需要に対応していきたいと考えている」と代表取締役の小亀俊太郎氏はいう。

同社は2019年に創業。対話エンジンやアプリケーションを開発するエンジニアに加え、アートディレクターや3DCGモデラー、そして自然な会話を構築するためのシナリオライターなどで構成されている。対話は、雑談をこなす非タスク型と質疑応答などのタスク型で分類され、いずれも自社独自開発の対話AIが日々学習をしているという。日本語は英語と比べてデータが少なく大変ではあるが、独自のAIを育てているそうだ。小亀氏は「これまで人間でしか提供できなかった対話体験と比べても遜色ないほどに対話AIの品質が上がってきている。今後も、AIと人が共生する社会の実現に向けて事業を推進していきたい」と語った。

関連記事
自分だけのAIライフパートナーと対話できる「PATONA」アプリのCapexが総額1億円を調達
ソフトバンクの人型ロボット「Pepper」が「りんな」を手がけるrinnaのAI会話エンジン最新版を採用
AIチャットボット「りんな」のrinnaとUneeQを日本展開するデジタルヒューマンが協業、顔・声・視聴覚を持つ雑談AI実現

江戸時代のくずし字をAIにより文字認識し現代の書体に変換(翻刻)するアプリ「みを」をCODHが無料公開

江戸時代のくずし字をAIにより文字認識し現代の書体に変換(翻刻)するアプリ「みを」をCODHが無料公開

データサイエンス共同利用基盤施設(ROIS-DS)人文学オープンデータ共同利用センター(CODH)は8月30日、江戸時代の版本に書かれているくずし字を現代の書体に変換(翻刻)するアプリ「みを」(miwo)を無料公開した(Android版iOS版)。開発者は、カラーヌワット・タリン氏。共同開発者は北本朝展氏とMikel Bober-Irizar氏。共同研究者はAlex Lamb氏、Siyu Han氏。

AIくずし字認識については、CODH開発の「KKuroNetくずし字認識サービス(AI OCR)」および「Kaggleくずし字認識コンペ」1位のtascj氏が開発したくずし字認識モデルを用いている。また両AIモデルの学習には、同センターが開発し国文学研究資料館が公開している「日本古典籍くずし字データセット」を利用。Flutterを活用したクロスプラットフォーム開発により、Android・iOS対応アプリを作成した。

みをでは、カメラでくずし字を撮影し、画面下中央の「認識ボタン」をタップすると、ほぼ瞬時にして画像の個々のくずし字の上に、対応する現代の書体が緑色で示される。画面下のスライダーを動かすと、翻刻されたレイヤーを部分的に隠せるので、原文との比較がしやすくなる。まだ完ぺきではないとCODHも言っているように、実際に使ってみると、たまに文字が抜けたり違っていたりもするが、まったくくずし字が読めない人間にすれば、かなりの助けになる。

原文または翻刻された文字をタップすると両方の対応する文字にマーカーが付く。また画面右上の四角形のアイコンをタップすると、認識したすべての文字が四角形で囲まれる。四角形は色分けされ、どの文字がどれに対応しているのかがわかるようになる。

またCODHのくずし字データセットと連携し、認識結果に疑問を抱いた際には、くずし字の用例を確認できる。

江戸時代のくずし字をAIにより文字認識し現代の書体に変換(翻刻)するアプリ「みを」をCODHが無料公開

CODHによれば、くずし字が読める人は、日本の人口のわずか0.01%程度(数千人程度)だという。歴史的資料は大量にあるものの、くずし字を読める人が少ないために翻刻には大変な時間がかかるのが現状だ。そこで、AIを使った翻刻システムを開発しようと考えたとのこと。アプリ名の「みを」は、「源氏物語」の第14帖「みをつくし」に由来する。航路を示す標識「澪標」を意味するが、「人々の水先案内となるように、「みを」アプリがくずし字資料の海を旅する案内となることを目指しています」とCODHは話している。