AIが声の調子を理解してカスタマーエクスペリエンスを向上させるOtoが5.8億円を調達

SRI Internationalの研究からスピンオフしたスタートアップのOtoは、声の語調を理解してカスタマーサービスの運営に生かそうとしている。このOtoが米国時間12月18日、シードラウンドで530万ドル(約5億8000万円)を調達したと発表した。

画像:filadendron / Getty Images

このラウンドには、Firstminute Capital、Fusion Fund、Interlace Ventures、SAP.iO、SRI Internationalが参加した。Otoによれば、総額には以前のシードラウンドの100万ドル(約1億900万円)が含まれる。

Otoの共同創業者でCEOのTeo Borschberg(テオ・ボルシュベルク)氏によれば、同社はSRI International社内の研究からスタートした。同社は、後にApple(アップル)のSiriのもととなる技術を開発していた研究機関だ。OtoはSRIの研究に基づいて語調のデータを作成し、カスタマーサービスに電話をかけてきた顧客の感情への対処を向上させようとしている。この分野のAIを活用して、カスタマーサービス担当者と顧客との間のやり取りをリアルタイムで改善することが目標だ。

Otoは研究の一環として、セールスに関する200万圏件の会話から3000人の話者の10万とおりの発言を抜き出してデータベース化した。同社はこのデータから、カスタマーサービス業務で語調を自動で理解するツールをいくつか構築した。

ツールの1つは、ライブコーチングだ。マネージャーがすべての通話をモニタリングすることは難しく、モニタリングできるのはごく一部だ。Otoのツールを使うと、カスタマーサービス担当者はすべての通話のコーチングをリアルタイムで受けることができ、担当者の活力を高めたり、問題をエスカレートさせることなくイライラしている顧客を落ち着かせたりすることができる。「リアルタイムで電話担当者の声の響きや意欲について本人に助言し、担当者がもっと前向きになれるように働きかける」とボルシュベルク氏は説明する。

同氏は、このツールには主なメリットが3つあるという。担当者に対するエンゲージメントの向上、セールスのコンバージョンレートの上昇、顧客満足度の向上とコスト削減だ。

これとは別に、コールが終わるごとに語調からカスタマーエクスペリエンスの質を測定しスコアを算出して、担当者(とその上司)がサービスの結果を知るプロダクトもある。スコアはダッシュボードに表示される。ボルシュベルク氏は「我々は語調から満足度に関して普遍的な理解を構築し、ここから好意的、否定的、そのどちらでもない音の特徴を学習することができる」と言う。

ボルシュベルク氏は、昨年SAPに80億ドル(約8750億円)で買収されたQualtricsのように、こうした市場には巨大なチャンスがあると見ている。人々を調査することはストーリーのほんの一部だと同氏は言う。エクスペリエンスがうまくいっているかどうかの語調を理解すれば、カスタマーエクスペリエンスを向上させることができる。尺度を導入することで、うまくいっているのか、いないのかが簡単にわかる。

Otoには現在20人の従業員がいて、ニューヨーク、チューリッヒ、リスボンにオフィスがある。同社のプロダクトを使っている顧客はこれまでに7社で、まだアーリー段階にあると言える。

[原文へ]

(翻訳:Kaori Koyama)

国防総省のDARPA研究所が改悪改竄ビデオを検出する技術で研究助成事業を展開

メンローパークの非営利研究団体SRI Internationalが、国防総省の研究機関DARPA(Defense Advanced Research Projects Agency)から、フェイクニュースと戦うための三つのプロジェクトを受託した。すなわちDARPAのMedia Forensics(メディア犯罪捜査)事業は、ビデオや写真がそのコンテンツを意図的に変えられていることを判定するツールを開発している。

そのようなコンテンツでもっとも悪名高いのが、“ディープフェイク(deepfakes)”と呼ばれているやつだ。通常それは、わいせつな画像やビデオに有名人や人気スターの顔だけ貼り付けるというポルノが多い。ディープフェイクを作るソフトは簡単に作れるし誰にでも使えるが、今あるビデオ分析ツールでは、加工された映像と本物の映像を区別できない。

この難問を解決するために組織されたのが、Media Forensicsグループだ:

“DARPAのMediFor事業は、優秀な研究者を集めてデジタル画像技術のある分野を打ち倒したいと考えている。それは現状では改竄(かいざん)者が優位に立っている分野であり、それを、画像やビデオの真正性を自動的に判定する技術を開発し、エンドツーエンドのメディア犯罪捜査事業に利用することによって崩壊させたい。

その技術の開発に成功したら、MediFor事業は改竄を自動的に検出し、その改竄方法に関する詳細情報を提供し、ヴィジュアルメディアの全体的な真正性に関する判断により、問題ある画像やビデオの使用に関する意思決定を支援できる”。〔これは使えない、という判定を助ける。〕

ビデオがとくに危険なアプリケーションだが、改竄は静止画像においても検出が困難であり、DARPAはそれも研究課題としている。

DARPAのMedia Forensicsグループ、略称MediForは、アプリケーションの募集を2015年に開始し、正式には2016年にローンチ、2020年までの予算がついている。このプロジェクトでSRI Internationalは、アムステルダム大学とスイスのIdiap Research InstituteのBiometrics Security & Privacyグループと密接に協働する。アムステルダム大学については、詳しくは彼らのペーパー“Spotting Audio-Visual Inconsistencies (SAVI) in Manipulated Video”を見よ。Idiapの研究グループは、改悪されたビデオに存在するオーディオビジュアルの齟齬を見つける4つのテクニックにフォーカスしている。それらは、1)唇の同期の分析、2)話者の不整合や矛盾の検出、3)シーンの不整合の検出、4)コマ落ちや挿入の判定、である。

この事業で受託した研究には、有望性が認められる。昨年6月に行われた最初のテストでは、数百のビデオの中から、改悪されたビデオの二つの特徴、“話者の不整合とシーンの不整合”を、75%の精度で見つけることができた。2018年5月には、同様のテストをもっと大規模に行い、そのテクニックを磨き、大量のテストビデオを調べられるようにする。

このプロジェクト自体は軍事目的だが、研究チームは今後この事業の目的が、規制当局やメディアや公共団体などがもっと悪質な種類のフェイクニュースと戦っていくためのメインの武器になる、と信じている。

“近い将来、ビデオの改悪や合成のテクニックが大きく進歩する、と予想している”、SRI Internationalの代表者がこう語った。

“そういうテクニックがあれば、ホビイストやハッカーでも非常にリアルなビデオを作って、その人がしなかった/言わなかったことを、している/言っているように見せかけることができるだろう”。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Siriを生んだSRIから魔法のカレンダー・アプリ、 Tempo登場―ミーティングに関する情報を自動収集して通知してくれる

私のような日程管理が苦手きわまる人間でなくとも会議の直前になって大慌てした経験が必ずやあるだろう。ミーティングの席についてから自分はいったい誰と何の話をするためにここに来ているのだろうと必死に記憶を探ったり、車で走りだしたはいいが正確な住所を知らないことに気づいたり、といった失敗だ。今日((米国時間2/13)リリースされたスマート・カレンダー・アプリのTempoはまさにこうした問題の解消を狙っている。

Tempoは名門の調査研究企業SRI Internationalからスピンオフしたスタートアップだ。SRIといえば最近ではiOSの音声認識アシスタント、Siriのオリジナル開発元(後にApple が買収)としても有名だ。 最近の他のSRIプロジェクトと同様、Tempoもパーソナル・アシスタントの一種だが、Siriとはまったく異なるアプローチのプロダクトだ。

ファウンダーでCEOのRaj Singhは「パーソナル・アシスタント・アプリには大きく分けて2種類ある。質問すると答えてくれるSiriのようなタイプと、もうひとつはユーザーが必要とする情報を必要とする瞬間に届けてくれるタイプだ。Tempoは後者に属する」と説明する。Tempoのようなアプリで重要なのは不必要な情報でユーザーをうるさがらせることなく的確に必要な通知だけをする能力だ。

「ユーザーが日常必要とする情報をわかりやすくひとまとめにするのにどんな方法が一番適しているかを考えた末、われわれはカレンダー形式を選んだ。カレンダーには誰にも直感的に理解できる整然とした構造があり、これからユーザーがなすべきタスクが管理されている。ここがユーザーが必要とするすべての情報を保管するのにもっとも適した場所だとわれわれは結論した」とSinghは語った。

たとえば、会議の前にTempoを開くと、関連するメール、資料、出席者のLinkedInプロフィールなどを見ることができる。もし車を運転してミーティングの場所に向かうのであればカーナビが起動するし、道が混んでいるなどで遅れそうならその旨のメッセージを自動的に送信できる。飛行機に乗るなら、フライト情報が通知される。カンファレンス・コールに参加する場合はTempoがダイアルインとパスコードを保管する。

もちろんいずれも有用な機能だが、個々に取り上げてみれば画期的というほどではない。たとえばXobniやRapportiveのようなプロダクトは友人やビジネスの相手のプロフィールやソーシャル投稿を自動的に取得してくれる。ミーティングに遅れそうなときに通知してくれるアプリにはTwistがある。しかしTempoの独自性は、こうしたさまざまな機能がカレンダーというフォーマットで整理されていることだ。Tempoはそれぞれの会合の役割を理解しようと努め、もっとも適切なツールを選んで情報を提供してくれるところにある(Tempoにいちばん近いアプリは私の知る限りEasilydoというto-doリストだろうと思う。しかしTempoほどカレンダーが決定的な役割を果たしているわけではない)。(Update: 読者から「これに似たCueというカレンダーアプリがある」という指摘があった。

Singhは「ユーザーはTempoを利用するために何か特別な作業を要求されることはない。 単にTempoにiPhoneカレンダーとメールその他の受信ボックスへのアクセスを許可するだけでよい。あとはアプリが自動的に処理する」と説明する。学習するにしたがってこのアプリは一層賢くなっていくが、が積極的にカスタマイズする必要はないまたTempoに日程の詳細をいちいち入力しておく必要もない。ミーティングの参加者の名前を入力しておくだけで、Tempoが自動的に関連情報を取得してくる。

私は短期間だがこのアプリをテストしてみた。なるほど設定は簡単だ(使い始めにTempoが各種の情報を収集して分析する間少々待たされる)。Tempoがミーティングの関連情報を教えてくれるので、直前になって必死にメールを検索したりせずにすむ。ただTempoはiPhoneのカレンダーを利用するのでこのカレンダーに存在する問題も全部引き継いでいる。大部分のユーザーにとってはさして障害にならないはずだが、私は時差をうまく理解させる方法を発見できない。今週は私はサンフランシスコからニューヨークに出張したが、Tempoは3時間前に終わったミーティングのリマインダー通知を送りつけてきた。

Tempoは無料アプリだ。Singhは後で有料のプレミアム機能を加えていくフリーミアム・モデルを考えている。iPhoneアプリのダウンロードはここから(Androidとタブレット版についても開発が進められている)。

[原文へ]

(翻訳:滑川海彦 Facebook Google+