Spotifyの車載デバイス「Car Thing」が米国で一般販売開始

Spotify(スポティファイ)の不思議な名前の車載エンターテインメントシステムで2019年からテストされていた「Car Thing」が、米国で一般販売開始となった。2021年10月の限定販売分よりも10ドル(約1150円)高い89.99ドル(約1万350円)で、AppleのCarPlayやAndroid AutoなどSpotifyに簡単にアクセスできるインフォテインメントシステムを備えていない自動車の所有者を主にターゲットとしている。

Car ThingとスマートフォンのSpotifyアプリを接続し、スマートフォンの携帯回線(または利用可能ならWi-Fi)を利用して音楽やポッドキャストをカーオーディオでストリーミング再生する。カーオーディオとスマートフォンをUSB、Bluetooth、Auxのいずれかで接続して使う。

Spotifyはまず、ユーザーが車内でサービスをどう使うかを知るためにCar Thingの実験を始めた。そこから数年が経ち、デバイスのハードウェアと工業デザインはシガーソケットに差し込む小さいアイテムから、大きいつまみやカラフルなタッチスクリーン、音声コントロール機能、多様な接続やマウントのオプションを備えた親しみやすいプロダクトへと進化してきた。

画像クレジット:Spotify

現在は「Hey Spotify」と話しかける、タッチスクリーンをタップする、ダイアルを回す、上部にある4つのプリセットボタンのいずれかを押すといった操作でSpotifyのサービスを利用する。プリセットボタンには好きなアーティストやステーション、プレイリスト、ポッドキャストを設定しておくことができる。

Spotifyはテストを通じて、ユーザーはそれまでの車内でのメディアの楽しみ方よりもCar Thingを好むことや、音声コマンドでのメディアの操作が気に入っていることを把握した。その結果、ユーザーは車内でSpotifyを聴くことが以前よりも増えたと同社は説明したが、このことを示す具体的な数字は明らかにしなかった(このデバイスを一般に販売するには、プロジェクトはある程度成功する必要があっただろう)。

Spotifyの第3四半期収支報告でCEOのDaniel Ek(ダニエル・エク)氏は、数カ月間でCar Thingのウェイトリストに200万人以上が登録したと述べ、消費者の需要があるとの判断につながった。

一般販売されるCar Thingは以前の製品と同じものだが、小規模なソフトウェアアップデートが予定されている。ナビゲーションアプリと同様のナイトモード機能が追加され、夜は画面が暗くなる。音声コマンドの「Add to Queue」(キューに追加)で音楽やポッドキャストを再生キューに追加することもできるようになる。Spotifyは、これらの新機能を今後のCar Thingのアップデートで公開すると述べている。

画像クレジット:Spotify

これまでCar Thingはウェイトリストに登録し、プレミアム(個人、ファミリー、学生を問わず)の契約をしている米国のユーザーしか購入できなかった。現在もプレミアムの契約は必要だが、ウェイトリストの登録は不要になった。Car Thingは当面、米国のみの製品だ(販売価格には送料を含むとSpotifyは説明している)。

唯一変更されたのが、Car Thingのパッケージだ。以前はピンク色の箱だったが、今度はSpotifyアプリのアイコンで使われているブランドカラーよりもミントっぽい、明るいグリーンになった。箱には、動作しているユーザーインターフェイスを表す画像が配置されている。

Car ThingはSpotifyを車内で聴きたいサブスク利用者には便利だが、結局はSpotifyにとって、ユーザーが移動中にサービスをどのように利用するかについての直接的なデータを収集する手段となる。しかも運転中はハンズフリーで操作する必要があるのだから、同社はユーザーの音声データにアクセスすることにもなり、今後のサービス向上に役立てられるだろう。

画像クレジット:Spotify

原文へ

(文:Sarah Perez、翻訳:Kaori Koyama)

コトバデザイン、5Gとドコモオープンイノベーションクラウドを活用した低遅延通話サービスCOTOBA Talkの招待制試験開始

コトバデザイン、5Gとドコモオープンイノベーションクラウドを活用した低遅延通話サービスCOTOBA Talkの招待制試験開始

対話型AIの開発を行うコトバデザインは1月13日、NTTドコモの提供する5Gサービスおよびドコモオープンイノベーションクラウドを活用した「超」低遅延通話サービス「COTOBA Talk」の招待制試験サービスのエントリー受付開始を発表した。COTOBA Talk紹介サイトよりエントリーできる。

同招待制試験サービスにより得られたフィードバックを基に、通話体験のさらなる向上と作業現場で求められる機能拡張を進める。特に音声アシスタントを中心とする音声によるVUI(Voice User Interface)の高度化により、ハンズフリー通話およびITシステム利用の充実を図り、商用サービス化を加速する。

COTOBA Talkは、PC操作環境が得られないデスクレスワーカー向けに作られた、低遅延・高品質で安全なコミュニケーションを実現するクラウド型通話サービス。スマートフォンアプリとして提供しており、ヘッドセットを使用すれば複数人で映像付きのハンズフリー通話が可能となる。

 

特徴としては、まず5Gの高速通信と通話処理の最適化により200msを切る低遅延通話の実現がある。またドコモ5G網とドコモイノベーションクラウドに閉じた形のサービスとなっているため、インターネット経由の通話よりも高いセキュリティを保てる。さらに、音声指示を理解する音声アシスタントを搭載していることから、様々な外部ITシステムの音声操作が可能にになっており、端末(スマートフォン)を取り出す必要をなくしているという。この音声アシスタントは、コトバデザインが開発した、対話インターフェースを構築・運用するためのクラウドサービス「COTOBA Agent」を利用して実装している。

コトバデザイン、5Gとドコモオープンイノベーションクラウドを活用した低遅延通話サービスCOTOBA Talkの招待制試験開始

COTOBA Talk サービス構成

 

利用シーンとしては、工事・小売店舗・介護など複数人で連携して作業を行う現場を想定。COTOBA Talkでは、各端末のカメラ映像付きで低遅延通話が行えるため、現場の映像を共有しながら快適に利用できるとしている。特に、骨伝導型ヘッドセットを装着すると、周囲音を遮断せず、騒音環境でもクリアな音声で通話できるようになり、長時間の使用にもストレスがないとしている。

2017年8月設立のコトバデザインは、「ヒトに寄りそう、 対話インタフェースの創造と解放」をミッションとして掲げるスタートアップ。世界中のクリエイターがAIを対話インタフェースとして自由にコンテンツ開発できる世界を作ること、またヒトが対話インタフェースを通じてより豊かな生活が可能となることを目指して、対話システムおよびコンテンツの企画・開発・販売・運用を主事業としている。

NASAが「アルテミス1号」にAlexaおよびCiscoのWebex統合、音声操作でテレメトリー読上げやビデオ通話なども可能に

NASAが「アルテミス1号」にAlexaおよびCiscoのWebexを統合、音声操作でテレメトリー読上げやビデオ通話なども可能に

Amazon

NASAは、Amazon、Cisco、ロッキード・マーティンと協力して宇宙飛行士がAI音声アシスタントなど商用技術によって、その活動に利益を得られるかどうかを確認する実験計画「Callisto」を発表しました。

Callistoでは、Amazonの音声アシスタントAlexaおよびCiscoのWebex技術をOrion宇宙船に組み込み、音声アシスタントやビデオ通話およびホワイトボード機能といった商用コミュニケーション技術の宇宙空間での有効性を確認します。

音声アシスタントにビデオ通話といえば、映画『インターステラー』でマシュー・マコノヒー演じるクーパーが、宇宙船に届いた家族からのビデオメッセージを見るシーンが思い出されます。あの場面ではクーパーが「数十年分のビデオメッセージがたまっている」と言うコンピューターに対して「最初から再生しろ」と音声で指示を出し、それを視聴します。

実験ではそれと同じようなことを、AmazonやCiscoの商用技術で実現できないか探ってみようというわけです。

最初の試験飛行は、無人のOrion宇宙船が月を周回したのちに地球に戻るアルテミス1号ミッションで実施されます。無人で行われるため、ヒューストンの宇宙センターにいるオペレーターが、仮想の乗組員として宇宙船に音声コマンドを送信、それが船内のスピーカーで再生され、Alexaがそれに対して期待するように動作するか、Webexを使用できるかなどを確かめるとのこと。Alexaは宇宙船のテレメトリーを監視できるように組み込まれ、飛行士は宇宙船の移動速度や月まで残りの距離をたずねたりすることができるようになるでしょう。

また、ホワイトボードの機能は機内の複数のカメラを使用してテストされ、地上管制からの書き込みが機内できちんと表示されるかを確認します。地上と宇宙で落書きを送りあうのにかかる時間は、管制センターが通信の遅れに対処するための方法を検討することにも役立ちます。

深宇宙ではインターネット接続など利用できるべくもありませんが、AlexaやWebexが機能するには代替の通信ネットワークが必要になります。そのため、惑星間ミッション中の通信に使用されるNASAのDeep Space Network(DSN)が使用されます。

Amazonは、Artemis I の実験で得た知見を元に、将来のミッションのため、また地上のインターネット接続環境がほとんど利用できない人々のためにAlexaに改良を加えるとしています。また仮想乗組員として音声コマンドの送信などを体験する機会を、将来の宇宙飛行士である学生らへのSTEM教育の一環として提供することも考えています。

ゆくゆくは、宇宙船に統合された音声AIアシスタントが、長い深宇宙の旅で暇を持て余した飛行士の会話相手になることも想像できます。しかし飛行士には「何か面白いチャレンジを教えて、とだけは聞くな」とアドバイスしておくべきかもしれません。

(Source:AmazonEngadget日本版より転載)

安価なApple Music VoiceプランはSiriの改良を進める作戦である可能性が高い

Apple(アップル)は、先に開催したイベントで数多くの興味深い発表を行った。その中で私が特に注目した、かつあまり注目されていないように思えたのが、Apple Musicの新しい料金プランだった。新しい「Voice」プランでは、Apple Musicの全ライブラリを月額5ドル(日本では税込月額480円)という低価格で利用できる。ただし、Siriを使ってアクセスしなければならず、Apple Musicの標準的なビジュアルと入力しやすいアプリ内のユーザーインターフェイスは使用できない。

関連記事
アップル発表イベント「Unleashed(パワー全開)」に登場した新製品まとめ
アップルがSiriでのみ利用できる安価なApple Music Voiceプランを発表、月額480円

Appleは、このプランを開始する理由を明らかにしていないが、iPhoneメーカーとしては、音声アシスタントの学習と改良のために音声データをより多く収集したいため、価格の障壁を低くして、より多くの人にSiriを使ってもらおうとしているのではないかと推測するのが妥当だと思う。

AppleのCEOであるTim Cook(ティム・クック)氏は、このイベントで「より多くの人が、声だけでApple Musicを楽しめるようになることをうれしく思います」と述べていた。

このApple Music Voiceプランが存在する理由として、他に説得力のあるものが考えられない。特に、Apple Music上の曲目全体を提供するために、Appleはレーベルとのライセンス契約を変えていないため、標準プランよりもはるかに低いマージンでこの新サービスを提供していると思われる。

繰り返しになるが、これは単なる推測だ。ただ、AppleとSpotify(スポティファイ)間の厳しい競争を考えると、スウェーデンの会社がApple Musicを価格で打ち負かすために自社のストリーミングサービスを月額7~8ドル(月額税込980円)で提供できるのであれば、そうするのではないだろうか。そしてAppleは、どうしても膨大なデータを集めたいがために、新しいサブスクリプションプランであえて多少の損失を出しているのではないだろうか。私がこの説をツイートしたとき、同僚のAlex(アレックス)は、ではなぜAppleはサブスクリプションを無料にしないのかと疑問を抱いていた。2兆5000億ドル(約285兆円)規模の企業であるAppleは、技術的にはバランスシート上でそれだけの打撃を飲み込むことができると思うが、Spotifyのような独立した音楽ストリーミング企業からの批判をこれ以上集めたくはないのだろう。同社はすでに、さまざまな分野で反競争的な行為を行っているという批判を受けている。

テクノロジー企業は、AIモデルに膨大な量のデータを与え、サービスの機能を向上させている。Siriが長年にわたってかなり改良されてきたとしても、テック業界で働く多くの人々や大衆の間では、Amazon(アマゾン)のAlexaやGoogle Assistantの方がはるかに優れているというのが一般的な意見だ。

Appleはすでにこのような音声データを、Apple Musicの既存ユーザーから取得していると思われるが、ある友人が言ったように「要は、この機能はもともとあった。ただ、高い有料の壁を設置していただけだ。今回、彼らはその壁を低くしたということ」。新プランでMusicを音声操作のみにしたことで、参入障壁が下がっただけでなく、ユーザーはSiriを使わなくてはいけなくなった。SiriはApple Musicの標準加入者向けの機能だが、ほとんどのユーザーは基本的に、もしくは意図的にアプリのUIを使ってコンテンツにアクセスする可能性が高いと思われる。

音声アシスタントに「音声優先」や「音声のみ」のサービスを求めるとどうなるかわかる例として、AmazonのAlexaを見てみよう。Alexaは、最初から音声でアクセスしなければならなかった。これにより、AmazonはAlexaのアルゴリズムのために大量の学習データを収集することができただけでなく、Alexaを最大限に活用する方法についてユーザーをトレーニングすることもできた。

私の理論が正しいと思うもう1つの理由は、Appleがこの新しいサブスクリプションを最初に提供する予定の国についてだ。オーストラリア、オーストリア、カナダ、中国、フランス、ドイツ、香港、インド、アイルランド、イタリア、日本、メキシコ、ニュージーランド、スペイン、台湾、英国、米国だ。

インド、スペイン、アイルランド、フランスが第一陣に名を連ねているのは、Appleが世界中のさまざまな言葉を集めようとしていることを意味している。ところで、インドなどの発展途上国や、中国や日本など、テキスト入力が音声に比べて不必要に複雑になることがある市場では、音声検索が非常に人気がある(世界第2位のスマートフォン市場であり、約98%のパイをAndroidが占めているインドで、音声検索が驚くほど大量に採用されたことで、Googleアシスタントの改良や、音声分野での革新に向けたより積極的なアプローチが可能になったと、Googleの幹部が話してくれたことがある)。

Siriは、他の音声アシスタントと比較して、その能力の点でやや遅れをとっていると言われているが、Appleのサービスにおける新しい動きは、顧客に音楽ストリーミングサービスに参加するための割安な方法を提供するためのものでもある一方で、この認識されているギャップを埋めるための試みでもあると捉えられるだろう。

画像クレジット:Heng Qi / Visual China Group / Getty Images

原文へ

(文:Manish Singh、翻訳:Akihito Mizukoshi)

動画に話しかけることでユーザーがストーリー展開を変えるAdventrのボイスコントロール技術

誰にも経験がある。ホラー映画を見ていて、主人公がその不気味な家に入ってはいけないことを、あなたは知っている。画面に向かってどれだけ叫んでも、あなたは彼の運命を変えられない。でも、もしも画面の男に、その家に近づくなと言って、彼がそれを聞き入れたらどうなるだろう?

エンターテインメント系の起業家であるDev Harris(デブ・ハリス)氏の最新のベンチャーなら、それが可能かもしれない。彼はグラミー賞を獲得し、Kanye West(カニエ・ウェスト)やJohn Legend(ジョン・レジェンド)のようなアーティストと長年のビジネス仲間だ。

2020年8月にベータでローンチしたAdventrは、ユーザーフレンドリーなインターフェースで、誰もが画面上の要素をドラッグ&ドロップしながらインタラクティブな動画を作ることができる。すでに何千ものユーザーがインタラクティブなエクスペリエンスを作っており、その中には、宇宙をテーマとする子ども向けの教育モジュールや、Marc JacobsやLVMHのようなラグジュアリーファッションのプロモーションビデオもある。

20のスタートアップが競うTechCrunch Disrupt, Startup Battlefieldでは、創業者でCEOのハリス氏は、Adventrのきわめつけの機能を披露した。それは、ユーザーがビデオの進む方向を命令できる音声コントロールの特許機能だ。

具体的には、音声認識を利用して、ビデオの途中でコースを変更する技術に関する特許だ。また、他のデータベースやアプリケーションと連携して、リアルタイムに答えを調べたり、質問に答えたりすることができる。

「これは『音量を上げろ』といった簡単な命令ではなく、『その部屋に入るな』といったものです。テレビと話せるなら、携帯電話と話せるなら、なぜビデオと話せないのでしょうか?私たちの技術により、これらのビデオは視聴者のマイクを使って、その視聴者が望んでいることを理解し、リアルタイムに対応することができます。インターネットの大部分はビデオであるため、私たちはビデオが他のスマートデバイスのように機能することを可能にしています」とハリス氏はいう。

画像クレジット:Adventr

彼のチームは現在わずか5名だが、クリエイティブを重視するだけでなく、eコマースのエキサイティングなアプリケーションもありえると考えている。彼は、2002年の映画「Minority Report(マイノリティ・リポート)」を指して、主役の Tom Cruise(トム・クルーズ)がGAPの店頭でホログラムに遭遇し、パーソナライズされたショッピング体験について質問されるシーンを、例として挙げる。

Adventrのデモビデオでは音声コントロール技術が登場し、買い物客がTargetでパジャマを買う。そのとき視聴者は「グリーンのものを着てみて」とか「Lサイズを見つけなさい」などと声で命令し、買うべき品物を決める。そしてどのパジャマを買うか決めたらTargetのウェブサイトへ移り実際に購入するが、ハリス氏は、いずれその経験過程のすべてがAdventrネイティブで行われると期待している。

現在、Adventrのツールはサブスクリプションで利用できるが、月額29ドル(約3200円)のプロプランや99ドル(約1万900円)のビジネスプランに決める前に、フリープランで試してもいい。Adventrの用途はeコマースや教育やエンターテインメントに限定されているわけではないため、今後企業やアーティストからまざまなアプリケーションが生まれるだろう。

「Adventrは、TwilioとVimeoを組み合わせたような、ビデオベースのAPIだと考えてください。基本的に、ユーザーはフレーズやキーワードを入力することで、特定のビデオクリップを再生することができます」とハリス氏はいう。

Adventrは、100万ドル(約1億1000万円)のシードラウンドでスタートしましたが、さらなる資金調達についてはまだ発表していない。しかし、このスタートアップは、すでに自社製品を加入者に販売しており、早い段階で収入源を確保している。ハリス氏は具体的な財務状況を明らかにしなかったが、顧客獲得に費用をかけずに、Adventrの収益は2021年初頭から現在まで80倍に増加しているという。

画像クレジット:Adventr

原文へ

(文:Amanda Silberling、翻訳:Hiroshi Iwatani)

アマゾンがAlexaで利用できる子供向けの「読書仲間」と音声プロフィールを公開

米国時間6月29日、Amazon(アマゾン)はAlexaを子どもの読書仲間にする新機能と、家中の全Echoデバイスで子どものAlexaエクスペリエンスをパーソナライズする音声プロフィールのサポートを発表した。この2つの機能は連携して動作する。音声プロフィールによってAlexaは話者を特定するので、デバイスは「Alexa、読書をしよう」というようなリクエストに適切に対応できるようになるのだ。Alexaはリクエストを受けて、Amazonが「Reading Sidekick」と呼んでいる読書仲間エクスペリエンスを開始する。

この機能はAmazon Kids+サブスクリプションが必要であるため、Alexaデバイスの全ユーザーが利用できるわけではない、このサブスクリプションサービスは月額2.99ドル(約330円)で、多くの子ども向けの本、テレビ番組、映画、教育アプリ、ゲームの他、広告なしのラジオステーションとプレイリスト、Audibleのブック、限定のAlexaスキルといったEchoデバイス向けプレミアムコンテンツも利用できる(Amazon Kids+は、日本ではプライム会員は月額480円、一般会員は月額980円。ただしFireやKindleのキッズモデルを購入すると1年間無料)。

画像クレジット:Amazon

サブスクリプションを購入したら、子どもはAlexaに一緒に読書をしようと話しかけ、互換性のある紙の書籍または電子書籍を選んで読み始める。Alexaは何の本を読んでいるかを尋ねる。また、たくさん読みたいか、少しだけか、順番に読むかも尋ねる。この機能を使えるのはAmazon Kids+サブスクリプションに含まれる6〜9歳向けの数百冊の書籍で、紙の書籍も電子書籍も対象となっている。子どもが読む番になったらAlexaはそれを聞いて、上手く読めていればほめ、つまづいたら助ける。

子ども向けAlexa音声プロフィールも米国時間6月29日から公開が開始される。この機能をオンにすると、保護者は家族内の子ども、最大4人の音声プロフィールをそれぞれ作成でき、Alexaのエクスペリエンスが各人に応じてパーソナライズされる。つまり、Alexaはあらかじめ構成された適切なペアレンタルコントロールを自動で適用して、不適切な音楽を自動でフィルタリングし、通話やメッセージの送信先を承認された連絡先のみに制限し、保護者が前もって承認したAlexaスキルしか使えないようにする。また、子ども向けのゲーム、スキル、音楽、動画が利用できるようになり、子どもからの問いかけにはそれに応じた対応をする。

このような機能によりAlexaのエクスペリエンスは家族にとってこれまで以上に楽しく便利になるが、その一方で保護者は子どもの声が録音され、分析され、一定の期間保管されることを考慮しなくてはならない。現在、Amazonは子どもの質問やリクエストに対するAlexaの理解を向上させるために、子どもの声の録音を使って音声認識と自然言語理解システムをトレーニングしている。録音を人間が検討することもある。このように使われたくない保護者は、Alexaアプリの設定から子どもの履歴に関連する録音を1つずつ、または全部いっぺんに削除できる。3カ月または18カ月で録音を自動で削除する設定にしたり、音声によるリクエストで録音を削除したりすることもできる。

ただし、保護者が子どもの声の録音を保存しない設定にした場合、ペアレントダッシュボードから子どもがこれまでにリクエストした内容の履歴をたどることはできない。

Reading Sidekickや音声プロフィールなどの機能を有効にする前に、あるいはもっと広く考えるとスマートスピーカーのようなものを家庭に持ち込むかどうかについて、保護者は自分の家庭に適した判断を下す必要がある。

Amazonによれば、子ども向けAlexa音声プロフィールは7月2日(金)までにAmazonの全顧客に提供されるという。Reading Sidekickは米国時間6月29日から提供が開始されている。

関連記事
【レビュー】新「Fire HD 10 Plus」は純正キーボードカバーでPCっぽく使える10.1型フルHDタブレット
【レビュー】アマゾンの新Echo Budsはまずまずのアップグレード、ただし依然として卓越性は感じない
アマゾンがAppleに対抗して無料でロスレス音楽配信サービスにアップグレード、まずは北米などから
アマゾンのEcho Showシリーズがアップデート、Echo Show 8のカメラに自動フレーミング機能搭載
AmazonがFireタブレットの新ラインアップとキッズモデルを発表、ワイヤレス充電対応版も

カテゴリー:ネットサービス
タグ:AmazonAlexa子ども音声認識音声操作読書

原文へ

(文:Sarah Perez、翻訳:Kaori Koyama)

すでに利用可能なモバイルの「Hey Spotify」音声コマンド機能公開についてSpotifyは沈黙

2019年にSpotifyは「Car Thing」の愛称を持つ自動車オーナー向けハードウェアデバイスのテストを始めた。このデバイスではSpotify Premiumユーザーが「Hey Spotify」で始まる音声コマンドで音楽やポッドキャストの再生を開始できる。2020年にはモバイルアプリにも同様に音声を統合する開発を始めた。そしてここにきて「Hey Spotify」の音声機能が広く利用できるようになってきた。

多くの人からSpotifyアプリで音声オプションを使えるというレポートが山ほどあり、この機能を利用できるのかどうかで一部のユーザーが混乱しているにもかかわらず、Spotifyはこれについて正式に発表していない。

関連記事:Spotifyが車載ハードウェア「Car Thing」をテストへ

例えばGSM Arenaは早い段階で、Androidユーザーにこの機能を知らせるプッシュ通知が送信されたとレポートした。通知には「マイクを有効にして『Hey Spotify、私のお気に入りの曲をかけて』というだけです」と書かれていた。通知をタップするとSpotifyの新しい音声インターフェイスが開き、聴きたい音楽を話し言葉でリクエストするために、まずマイクを使う許可をアプリに与えるように求められる。

画像クレジット:GSM Arena

いくつかのメディアはこの機能がAndroidユーザーに対して公開されたとレポートしたが、これは部分的に正しい。

結論をいうと、この機能はiOSデバイスにも展開されている。例えば我々はiOS 14.5が動作しているiPhoneでSpotifyアプリを起動し、同様の機能が有効であることを確認した。検索ボックスの横にあるマイクのボタンをタップすると音声機能を利用できる。いろいろな人に聞いたところ、iOSの異なるバージョンを使っているiPhoneユーザーにもこの機能が提供されていることがわかった。Spotifyの無料ユーザー、Premiumユーザー、Familyプランユーザーのいずれでも利用できた。

表示される画面には大きく太い文字で「Hey Spotify, play…」と話しかけるように書かれている。「play」の後にはアーティスト名がランダムで入る。画面下部には「Hey Spotify」を有効にする大きな緑色のボタンがある。

有効にするとアーティスト、アルバム、曲、プレイリストの名前でリクエストでき、停止、一時停止、この曲をスキップ、戻るなどのコマンドで再生のコントロールもできる。Spotifyは、デフォルトがロボットのような男声であることを認めている(好みに応じて設定で女声に変更できる)。

iOSのSpotifyのスクリーンショット

この画面には、アプリが「Hey Spotify」の音声コマンドを聞きとるとユーザーの声のデータやその他の情報がSpotifyに送信されるという注意事項も書かれている。音声データの取り扱いに関するSpotifyのポリシーへのリンクがあり、ユーザーの発言の録音とそれをテキスト化したものと、ユーザーに返された内容に関する情報を同社が収集することについてリンク先で説明している。同社は、このデータを機能の向上、新しい音声機能の開発、ユーザーに関連する広告のターゲティングに利用することがあるとしている。ユーザーの情報はクラウドストレージプロバイダーなどのサービスプロバイダーと共有されることもある。

このポリシーは2019年に開始した同社の音声対応広告のものと同じで「Hey Spotify」の公開にともなう変更を反映して更新されているわけではないようだ。ただし他社の音声アシスタントと同様に、Spotifyはずっと録音しているわけではなく、ユーザーがウェイクワードを発するまで待機していると記載されている。

「Hey Spotify」の音声コマンドがCar Thingから始まっていることを考えると、モバイルへの展開はSpotifyが自社製ハードウェアを近く発売する準備が整ったサインではないかと推測される。おそらくそれは当たりだと裏づけるような情報もすでにある。MacRumorsが最近、Spotifyアプリのコードの中にCar Thingと各種マウントについての言及と写真を発見したと報じた。これは2021年1月にCar Thingに関するFCCの書類が明らかになったことに続く発見で、FCCの書類はデバイスがまもなく発売されるという噂をあおった。

米国時間4月7日午前にSpotifyにコメントを求めたが、音声コマンド機能の公開に関する返答はなく「残念ながら現時点では共有できるニュースはない」とのことだった。これはもっと大きな何らかのプロジェクトがマイナーな機能の公開と関連している可能性があることを示唆している。

最近のユーザーはテック企業のデータ収集に対して用心深くなっている。ことにテック大手3社が扱いのお粗末さを認めてからというもの、音声データの使用には慎重だ。そうは言っても、特にアクセシビリティの観点やドライバーの安全性の観点から、音声コマンドの使い道はある。

関連記事
GDPR発効後初となる中止命令を受けたグーグルの音声AIレビュー
Siriの録音が定期的に契約企業に送られて分析されていた

携帯電話の音声アシスタントにSpotifyのコンテンツを再生するように指示することはできるが(CarPlayやAndroid Autoで)、Spotifyに直接話しかけることができれば便利だと思う人もいるだろう。AppleがSpotifyをデフォルトの音楽サービスに設定できないようにしている現状では、特にそうだ。あなたのお気に入りのサービスとしてSpotifyを起動するようにSiriを鍛えるしかない。

「Hey Spotify」をいったん有効にしても、後から気が変わったらアプリの設定の「Voice Interactions(音声操作)」からオフにすることができる。

関連記事:アップルがiOS 14.5で「デフォルト」の音楽サービスは設定できないと明言

カテゴリー:ネットサービス
タグ:Spotify音声アシスタント音声操作

画像クレジット:Getty Images

原文へ

(文:Sarah Perez、翻訳:Kaori Koyama)

Twitterが音声によるソーシャルネットワーク機能「Space」のベータテストを開始

2020年11月、Twitter(ツイッター)は、音声専用のチャットルームという新しいソーシャルエクスペリエンスのテストを同プラットフォームで間もなく行うと発表していた(未訳記事)。ときどき論争の的となる(Clubhouseサイト)スタートアップClubhouse(クラブハウス)のサービスに類似したものだ。「Twitter Spaces(ツイッター・スペーセズ)」と名付けられたその機能のプライベートベータテストが、いよいよ始まる。テスト期間中にこの製品を使用できるのは、主に社会的少数派の人たちから選ばれた一部のユーザーだとツイッターは話している。

先月、同社が説明したとおり、こうしたスペースを快適に思う人たちの安全を確保することが、極めて重要になる。それは大変に難しい課題だ。特に言論の自由を過剰に重視するあまり、そうした言動が嫌がらせ、いじめ、キャンセルカルチャーを招く恐れがあるという訴えを抑圧してしまっている場合ですら、検閲を求める叫びを制限してしまっていると一部の人たちが指摘するツイッターのような企業にはなおさらだ。

音声によるソーシャルネットワーキングは、まだ比較的新しいコンセプトではあるものの、現段階でのプライベートなモバイルソーシャル「スペース」では、モデレーションが難しいことがすでにわかっている。

Clubhouseも、いまだ招待者のみを対象としたテスト段階にあるが、モデレーションの失敗にまつわる看過できない事故がいくつか起きている。ニューヨーク・タイムズの記者に対するハラスメント(The Verge記事)や、反ユダヤ主義者を声高に主張する会話(The Verge記事)などだ。このサービスは、まだ一般公開されていない。

ツイッターのテストでは、ユーザーの安全と安心を揺るがす問題の対処法が発見されることが期待されている。

ベータテストではiOS版が使われ、ホストが内容を管理する形の2名から数名の会話に参加する機会がユーザーに与えられる。

画像クレジット:Twitter

Spaces(スペース)を作る方法は2つあるとツイッターは話している。画面右下のツイート作成ボタンを長押しするか、右スワイプしてFleet作成画面にすると開設できる。

スペースのホストはDM、ツイートのリンク、リンクのシェアを通じてメンバーを招待できる。テストが開始されると、招待された人は誰でも参加できるようになるが、誰が発言するかはホストが決めることができる。ホスト用の会話内容の管理オプションは、今後増える予定だ。

このテストでは100点、挙手、拳、ピースサイン、ウェーブなどの新しい絵文字、通報とブロックのためのツール、「非常に初期段階」の自動筆記機能、スペースでツイートをシェアする機能などが追加される。これらの機能の多くは、鷹の目を持つリバースエンジニアであるJane Manchun Wong(ジェーン・マンチャン・ウォン)氏(Twitter投稿)が先月すでに発見していた。しかし本日、ツイッターはベータテスト開始と同時にこれらが使えるようになると認めた。

同社は、スペースに関する話題を専用のTwitterアカウント@TwitterSpacesでツイートしていく予定だ。

ベータテストの対象となるのは200人程度で、数週間以内にiOS版として開始されるとツイッターはいっている。

関連記事:Twitterが音声会話サービスAudio Spacesのテスト開始、文字起こしや話者制限、報告機能あり

カテゴリー:ネットサービス
タグ:Twitter音声操作

画像クレジット:TechCrunch

原文へ

(翻訳:金井哲夫)