グーグルの会話型AI「Duplex」がコロナ禍で300万件以上のビジネスリスティングを更新

Google(グーグル)は米国時間10月15日、レストランの予約やGoogleビジネスリストの更新などに自然な会話を利用できる同社のAIテクノロジーであるDuplexに関するアップデートを提供した(Googleリリース)。新型コロナウィルスの感染拡大が始まったとき、同社はビジネス拡大のためのDuplexのサービスを8カ国に拡大。それ以来、薬局、レストラン、食料品店などのビジネスリストに300万件以上の更新を行ってきたという。

これらの更新は、GoogleマップとGoogle検索で200億回以上見られていると同社は述べている。

2018年の開発者カンファレンス「Google I/O」で初めて紹介されたこのAIテクノロジーは、企業に電話をかけたり、電話に出た人と対話したりすることができる。予約の場合、日時をリクエストしたり、質問に答えたりできる。さらにはAIをより人間らしく見せるために音を鳴らすことも可能だ。例えば、「mm-hm-hm」や「um」のような微妙な声の区切りを会話に挿入することもできる。

同社は、Googleアシスタント内蔵のDuplexは、ローンチ以来100万件以上の予約を完了したと本日発表している。同社はまた、昨年から米国のGoogleマップとGoogle検索のビジネス情報を自動的に更新するためにDuplexを使用するようになったことにも言及しており、ビジネスオーナーが店舗の営業時間やテイクアウトを提供しているかどうかなどの詳細を、手動で更新する手間を省くことができる。

そのほかにも同社は、昨年に映画のチケットの購入やレンタカーなどの予約を簡単にするために、米国のウェブにDuplexを導入した。本日の発表では、ショッピングや注文した食品をより早くチェックアウトできるようにする機能など、ほかのことでも同じ体験を試験的に開始する予定を明らかにしている。

同社は数週間前にも、Duplex機能に「Hold for Me」(私のために保留して)機能を追加している。これを使えば、Googleアシスタントを使って電話をつないだままにしておき、誰かが電話口に出たときに通知を受け取ることができる。

ニューラル音声認識と合成、そして独自の新しい言語理解モデルの進歩のおかげで、同社は本日、Duplexの通話の99%が完全に自動化されていると説明した。

Duplexのアップデートは、同社が本日開催したSearch On 2020イベントで発表したいくつかの発表のうちの1つで、鼻歌で曲を検索、スペルミスをよりよく推測、質問に答えるためにページの正しい部分をユーザーに指し示す、動画のキーモーメントをタグ付けできるなど、多くの検索機能の改善が紹介されている。

カテゴリー:ネットサービス
タグ:Google、Duplex

画像クレジット:Google

原文へ

(翻訳:TechCrunch Japan)

あなたの製品のAIは誰かを困らせていないか?

人工知能(AI)は、顧客の人生をびっくりするような新しい方法で楽にしてくれるものだと、みんなが想像している。製品開発をする側からすれば、最優先すべきは常に顧客だ。しかし、ある顧客の助けになる開発中のソリューションが、別の顧客を遠ざけてしまうという新しい問題を引き起こすことがある。

私たちには、AIを生活や事業を支える非常に優秀な夢のアシスタントだと思いたがる傾向があるが、そうとばかりは言えない。新しいAIサービスをデザインする人間は、このことを肝に銘じておく必要がある。そのサービスが、人を煩わせたり、負担に感じさせたり、悩ませたりする可能性はないか。それは誰か、どんな形によるものか。そしてそれは、直接的に顧客を襲うのか、それともその顧客と共に第三者を捲き込んでしまうのか。AIサービスを利用して顧客の仕事を楽にさせるために、他の人たちに厄介事を押しつけるようでは、結果としてブランドイメージに大きな傷を付けることになる。

私がAmy.aiを使ったときの経験を例に挙げよう。これは、エイミー・イングラムとアンドリュー・イングラムという名前のAIアシスタントを提供するサービスだ(x.aiの製品)。AIアシスタントのエイミーとアンドリューは、最大4人のスケジュールを調整できる。このサービスは、電子メールを操り、非常に困難な会議のスケジューリングを、少なくともスケジュールを立てる人間の立場で解決してくれる。

「エイミー、来週、トムとメアリーとアヌシヤとシャイビーシュと会議ができる時間を探してくれ」と言うだけでことが済むパーソナルアシスタントなら、誰だって使いたいだろう。こう命令すれば、会議室を抑えたり、全員に電子メールを送って、みんなの返事を聞いて調整をするといった雑務を負わずに済む。私自身は、エイミーを使って4人の同僚の都合がいい時間を見つけて楽ができたのだが、それが私以外の4人に苦痛を与えていたのだ。互いに都合がいい時間と場所が見つかるまで大量の電子メール攻撃にさらされたと、彼らは私を責め立てた。

自動車デザイナーは、運転支援のためのさまざまな新しいAIシステムを導入している、もうひとつのグループだ。たとえば、Tesla(テスラ)は先日、オートパイロットソフトウェアをアップデートして、AIが適当と感じたときに自動的に車線変更ができるようになった。隣の車線のほうが速いと、システムが判断したときなどが想像できる。

これを使えば高速車線に安全に入ることができるので、自分で車線変更するときと違い、ドライバーが一切の認知的負担から解放されて有り難いという考え方のようだ。だが、Teslaのシステムに車線変更を任せてしまうと、ハイウェイでレーサー気分になりたい人や、競争心を満たしたい人たちの楽しみが奪われることになる。

隣の車線を走っているドライバーは、Teslaのオートパイロットに対処せざるを得ない。Teslaがぎこちない走りをしたり、速度を落としたり、ハイウェイの常識から外れる動作を見せたりすれば、他のドライバーをイラつかせることになる。さらに、隣の車線の車が高速走行していることをオートパイロットが認識しないまま車線変更を行えば、これまた他のドライバーを怒らせてしまう。私たちには、高速車線は時速100kmで走るものという共通の認識がある。みんなが100kmで走っているところへ、なんの前触れもなく、まったく周りを見ていないかのように、時速90kmの車が割り込んでくるのだ。

あまり混雑していない2車線のハイウェイなら、Teslaのソフトウェアもうまく動作してくれるだろう。しかし、渋滞しているサンフランシスコ周辺の高速道路では、混み合った車線に針路を変えるごとに、システムはとんちんかんな操作を行い、その都度周囲のドライバーを怒らせてしまうに違いない。そんな怒れるドライバーたちと個人的な面識がなくとも、私なら十分に気を遣い、エチケットを守り、行儀よく、中指を立てられないように車線変更する。

インターネットの世界には、Google Duplexという別の例がある。これは、Androidユーザーのための、AIを使った賢いレストラン予約機能だ。消費者の意見を基に、よさそうな店のディナーを、本人に代わって予約してくれる。予約をしたい人間にとっては、これは便利なサービスだ。なぜなら、店が開いている時間に電話をかけたり、話し中のためにかけ直したりといった面倒がなくなるからだ。

ところが、電話を受ける店の従業員にとっては、厄介なツールになりかねない。システムが自分はAIであると伝えたとしても、従業員はそれに伴う、新手の、融通の利かないやりとりを押しつけられる。それでいて目的は、予約を受けるという、いたって簡単な、以前と変わらない作業だ。

Duplexは店に客を連れてきてくれるわけだが、一方では、そのシステムは店側と客との対話の幅を狭めてしまう。別の日ならテーブルが空いているかもしれないし、早めに食事を終わらせてくれるなら、なんとかねじ込むこともできるかもしれない。しかし、このような例外的な判断はシステムにはできない。AIボットは電話を受ける人を困らせるという考え方も、じつは正しくないようだ。

顧客の生活を楽にしてあげたいと考えるのなら、あなたが夢見る支援のかたち以上に、主要顧客に関わる他のすべての人たちにとって、それが悪夢になりかねないことを考慮しなければいけない。あなたのAI製品に関わる人たちが不快な体験をしたかもしれないと少しでも疑いを持ったなら、周囲の人たちを怒らせずに顧客を喜ばせることができる、より良い方法を、さらに追求するべきだ。

ユーザーエクスペリエンスの観点に立てば、カスタマージャーニーマップは、主要顧客の行動、思考、感情の体験、つまり「バイヤーペルソナ」を知るうえで役に立つ。あなたのシステムと、直接の顧客ではない、何も知らない第三者との接点を特定するのだ。あなたの製品のことを知らないこれらの第三者のために、彼らとあなたのバイヤーペルソナとの関わり方、特に彼らの感情体験を探る。

欲を言えば、そのAI製品の周囲にいる人たちも十分に喜ばせて、購入を見込める顧客へと引き込み、やがては製品を購入してくれることを目指したい。また、エスノグラフィー(生活様式を理解し、行動観察・記録すること)を使って、何も知らない第三者とあなたの製品との関係を分析することもできる。

これは、プロセスに関わるときと、製品に関わるときの人々の観察結果を総合させる調査方式だ。

この調査の指標となるデザイン上の考え方には「私たちのAIシステムは、製品に関わるすべての人の助けとなり、もっと知りたいと思わせるよう働かせるには、どうしたらいいか?」というものが想定できる。

これはまさに人類の知性だ。人工物ではない。

【編集部注】著者のJames Glasnappは、パロアルト研究所上級ユーザーエクスペリエンス研究者。

[原文へ]

(翻訳:金井哲夫)

GoogleのAIが予約申し込み電話をかけるDuplexの25%は人間がかけている

昨年のデベロッパーカンファレンス、Google I/OでGoogle(グーグル)がデモしたDuplexに対し、オーディエンスは実際にどれだけの通話能力があるのか怪しんだ。そのAIを利用する予約申し込みサービスは、マシンとは思えないぐらいできすぎていた。しかもそれはこれまで、実際の予約に使われていた。Googleによると、その頻度はささやかだったらしいが。

同社が最近The New York Times(ニューヨークタイムズ紙)に語ったところによると、Duplexの通話はコールセンターの人間オペレーターがやってるものが少なくない。だいたい、通話の4分の1は生きた人間の声で始まる。マシンが始める通話も、その15%は人間の介入を必要とする。

Googleは昨年のデモで、人間がシステムをモニタして、何かおかしくなったら代わる、と言っていた。もちろん、そうだろうな。でも、あれやこれやの奇癖をやっと直して、AndroidとiOSデバイスで使えるようになった。しかし25%は人間がやってるというのは、高度なAIシステムとしてちょっと寂しいね。

これまでのテスト期間中にGoogleは、そのサービスのためのデータ収集も行った。たしかにDuplexは、ときどきすごく感動的だ。ぼくが試したときも、全部うまく行ったときには騙されてしまう。でもニューラルネットワークは、改良のために膨大な量のデータを必要とする。お店の予約という、たった一つの仕事でさえも。

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

Googleのレストラン電話予約サービスAI「Duplex」がiOS/Androidで使えるように

Googleは、DuplexのAI技術を利用した電話によるレストラン予約を行うGoogleアシスタント機能を、米国全土の英語版AndroidおよびiOS端末向けに提供開始すると発表した。今回初めてクロスプラットフォーム化したことで、広く利用されるための土台を作った。

昨年5月のGoogle I/Oデベロッパー・カンファレンスで披露された最初のデモで、Duplexのシステムがあまり人間そっくりにしゃべったために、AIボットはどこまで人間のように振る舞うべきか、相手に正体明かすべきかについて倫理的問題が直ちに持ち上がった 。デモがニセモノではないかと疑った人たちもいた。

当時明らかにされなかったのが、Duplexが現実世界の製品になるまでにどれだけ時間がかかるかだった。しかし、それは意外に早かった。

発表からわずか数カ月後、Duplexはニューヨーク、サンフランシスコなどの主要都市で公開テストに移行した。その後一年未満に米国43州でPixel 3ユーザー向けに公開された(ケンタッキー、ルイジアナ、ミネソタ、モンタナ、インディアナ、テキサス、およびネブラスカは 現地法の制約のために公開時は非対応だった)。

テクノロジーがコンセプトから運用へと進んだことで、Googleは通話のはじめにメッセージを追加してGoogleからの電話であることを伝え、なぜかかってきたかを説明するようにした。またGoogleは、レストランなどの店舗がこの種の自動発信を受け取るかどうかを選択(オプトアウト)できるようにした。

しかし、新技術を多くの消費者が利用するようになれば、興味を持った顧客を逃したくない店舗オーナーにとって、オプトアウトが現実的な選択肢であるのかどうか定かではない。

GoogleはTechCrunchに、Duplexを利用したGoogle Assistantのレストラン予約は、iOSおよびAndroid 5.0以上の端末の両方で先週配布が開始されたと伝えた。ニュースサイトの9to5Googleは、Googleのヘルプ画面の変更に気づき新機能公開について記事を書いた。

しかし、現時点ではすべての端末に新機能が届いているわけではないようだ。TechCrunchはGoogleに質問したが、配布が完了する時期については回答がなかった。

Duplexはその他の予約を行う機能も持っているが、現在はレストラン予約に絞っている。すでにGoogleと提携しているオンライン予約サービスを利用しているレストランでは、AssistantがReserve with Googleと直接連動して予約を確認する。

Assistantの予約を利用したい消費者は、Google Assistantアプリだけあればよい。Assistantは、予約時間、人数などの詳細を確認したあと、予約プロバイダーの1つを通じて予約する。Reserve with Googleには、数十社の提携プロバイダーがあり、さまざまな問い合わせに対応している。必要に応じてDuplexを使って自動発信を行うこともできる。

Duplexは、Google上で更新されていない営業時間などの店舗情報を確認するためにも利用できる。このデータは、店舗一覧の更新にも使われる、とGoogleは言っている。Googleによると、米国の残りの州にもDuplexを提供するべく準備中だ。

[原文へ]

(翻訳:Nob Takahashi / facebook

Googleアシスタントが音声通話で予約を取ってくれる――マンハッタンのレストランでDuplexのデモに参加してきた

I/Oでのセンセーショナルな発表からひと月後、Googleはさらに改良されたDuplexを少数のジャーナリスト向けにデモした。場所はマンハッタンのイーストサイドの大型タイ料理店。Googleが新しいプロダクトのデモをするにはいかにも不似合いな場所だ。

テーブルは片付けられ、3脚ずつ3列、あわせて9人分の椅子が明るいディスプレイに面し、サイドのデスクが即席のコントロールセンターで、Google社員4人が配置されていた。ここでGoogleはI/Oのキーノートで発表され賛否の議論を沸騰させた新しいプロダクトDuplexをデモした。

I/Oカンファレンスが行われた陽光輝くマウンテビューのショアラインアンフィシアターとは180度雰囲気が違うニューヨークの高級タイ・レストランが舞台となったのには、しかし、十分に理由があった。GoogleはいよいよAIを駆使した音声ベースの予約アプリをデモした――レストラン、Thep Thaiのオーナーは「われわれは毎日100件からの予約を受けているのでこうしたアプリが登場するのは願ってもないことだ」と称賛した(Googleによればアメリのスモールビジネスの6割はオンライン予約システムを備えていないという)。【略】

秘密主義で名高いGoogleとしては、進行中のプロジェクトのベールを一部なりと外すのは珍しい。しかしDuplexにとって情報の透明性は成功のカギとなる要素だ。自動運転車と同様、この種のシステムは現実の世界で繰り返しテストされ、可能なかぎりバグを潰しておく必要がある。

I/OのキーノートでCEOのスンダル・ピチャイは「これからGoogleアシスタントが本当のヘアサロンに電話して予約を取るところをお聞かせする」と述べた。

(Googleアシスタント)ハイ、クライアントの女性のヘアカット、1名予約をお願いします。えー、5月3日はどうでしょう?

(ヘアサロン)オーケー、ちょっと待ってください。

(Googleアシスタント)アーハー…

〔下のビデオでは1:08あたりから通話が再生される〕

ここでカンファレンスの聴衆はジョークだと思って笑った。それから本物だと気づいて喝采した。実際、意味がわかっても信じるのは難しい。電話しているのはAIベースの純然たるロボットだ。それが「えー」と口ごもったり、「アーハー」と頷いたりできるとは。

実はこうした無意味な音声は言語学では非流暢性(speech disfluencies)として知られ、現実の発言で頻繁にみられる重要な要素と考えられている。Duplexの発言が驚くほど自然に聞こえるのはこうした非流暢性を巧みに利用している点が大きい。

またDuplexが相手の返事をはっきり理解できなかった場合にも非流暢性は役立つ。受付担当者が電話の声を聞き取れなかったり聞き違えたりすることは普通にある。たとえば「4人のグループの予約をしたい」と求める場合、「えー、席を4人分です」と表現を変えて言い直すことができる。ここで「えー」は自然さを増し会話を円滑に進めるために効果がある。

こうした細部がDuplexを正しく作動させる秘密となっている。これは私の体験からそうだと言える。実は今回のデモで私はタイ・レストランの受付係の役でGoogleアシスタントの電話を受けたからだ。I/Oでアンフィシアターの巨大スクリーンに写し出された会話も本物だった。さらに興味深いのは、この電話はぶっつけ本番だっただけでなく、電話をかけているのがGoogleアシスタントだとはヘアサロンも知らなかったことだ。Googleがヘアサロンに知らせたのは電話の後だったという。【略】

ただしGoogle Duplexテクノロジーが実用化されるためには、情報の透明性が必要だ。つまり自分が人工知能であること、会話は録音されていることをまず最初に開示しておく必要がある

Googleはプロダクトを紹介したブログにこう書いている。

会話が快適に進められるよう、〔Duplex〕テクノロジーは自然に聞こえねばならない。ユーザーにとっても店舗にとってもサービスの使用体験が快適であることが重要だ。透明性はこの点でもカギとなる。われわれは、ビジネス側がコンテキストを正しく理解できるよう、電話の意図、性質をできるかぎり明確にするよう努める。具体的な手法については今後数ヶ月かけて実験していく。

Duplexの透明性に関するメディアでの議論を受けて、Googleの担当者は「Duplexは情報開示機能を組み込んだデザインとする。これにより受け手がシステムの性質を正しく認識できるようになる。われわれがI/Oで紹介したのは初期段階のテクノロジーのデモであり、今後は各方面からのフィードバックを取り入れながらプロダクトに仕上げていく」と付け加えている。

現在のDuplexの通話はこのような形式でスタートする。

ハイ、私はGoogleアシスタントです。クライアントに代わって予約の電話をしています。これは自動通話で録音されています。

Duplex自身はAIだと名乗っていないが、Googleアシスタントに馴染みがあればおそらくそう気づくだろう。ただし録音されていることは告げている。Googleでは音声、テキスト双方を記録し、品質の検証と今後の改善に役立てるとしている。

タイ・レストランでのデモでGoogleアシスタントの電話を受けたとき、最初の部分を繰り返させようとしてみた。騒々しいレストランなどで電話を取ったとき最初の情報開示部分を聞き落とすことは大いにあり得る。しかしアシスタントはかまわず予約内容に進んだ。つまり受け手が情報開示部分を聞き落とした場合、今のところ繰り返させる方法はない。ともあれ、現在の段階ではそのようだ。録音からオプトアウトしたい場合は電話を切るしかない。しかし常連客を増やすためにはあまり勧められない方法だ。

この点について、Googleのエンジニアリング担当アシスタント・バイスプレジデント、Scott Huffmanによれば「われわれは『オーケー、では録音しません』と言わせるメカニズムはもっている。ただ、具体的にどのようにすればよいか検討中だ。電話を切ればよいのか? 録音を破棄すればよいのか?」と説明した。

私も含めてデモに参加したジャーナリストはシステムをまごつかせようと全力を挙げた。アシスタントが午後6時の予約を取ろうしたので私は店が開くのは午後11時だと答えた。マンハッタンにはとんでもない営業時間の店がいくらもある。アシスタントは諦めて礼儀正しく電話を切った。

ここでDuplexの「聖杯」となるのは「予約のチューリングテスト」に合格することだ。Duplexが混乱すると Googleが用意した人間の担当者が引き継ぎ、いってみれば、飛行機を安全に着陸させる。人間の補助要員はDuplexのテストに常に付随する。Googleによれば誤解が手に負えないレベルに拡大しないよう、当分の間、Dupelxは人間が後見するという。この方式でどの程度の規模まで実験を拡大できるのか注目だ。

もっとも今回のデモではわれわれは誰もDuplexの後ろから人間の要員を引き出すことはできなかった。それでも現在のシステムの限界をいくつか知ることができた。たとえば、「最後の4桁を繰り返してください」と言うとアシスタントは電話番号を全部繰り返した。これは間違いではないが、やはり人間の会話の微妙なニュアンスを理解できていない。一方、メールアドレスを尋ねると、システムは「クライアントから〔メールアドレスを明かす〕許可を得ていません」と答えた。

GoogleによればDuplexは現在5件中4件は全自動でタスクを完了できるという。80%の成功率ならたいしたものだと思うが、Googleではさらに改良を進めている。【略】

DuplexはMacbookにオフィスの電話をつないだ間に合わせのシステムから始まって長い道を歩んできた。これはWaveNetオーディオと深層ニューラルネットワークの上で音声からテキスト、テキストから音声という変換を繰り返す複雑なプロセスだ。最初のデモはリアルタイムでこそなかったが本物だった。Duplexはさらに興味深いプロダクトに成長している。

好むと好まざるととに関わらず、Duplexは近々現実のものとなる。これを避けるには電話を使わないことしかないかもしれない。

[原文へ]

(翻訳:滑川海彦@Facebook Google+