Robloxに仮想世界が今本当に必要する「ボイスチャット」機能が登場予定

メタバース構築の先駆者であるRoblox(ロブロックス)は、仮想世界が今本当に必要としているものを見据えている。2021年7月時点で4700万人のデイリーアクティブユーザーを抱えるRoblox。これまでの道のりでも十分な成長を遂げてきた同社だが、より深く、より豊かな仮想体験を提供することで、今後も何年にもわたってユーザーを惹きつけていこうと目論んでいるようだ。

同プラットフォームの中核となるエクスペリエンスにボイスチャットを取り入れるべく、同社は慎重かつ確実なステップを踏もうとしている。それを実現するための最初のステップが信頼できる開発者の招集だ。Vansがスポンサーするスケートパークでキックフリップをメイクするようなクールでヴェイパーウェイブ的な雰囲気のゲームなど、同プラットフォームの中核をなす大人気の体験に近接ベースのオーディオをどのように統合できるかを模索しようとしているのだ。

空間オーディオ機能により、ユーザーは近くにいる人とライブボイスチャットで話すことができるようになる。Robloxはこの新しい音声製品を、現在のテキストチャットの自然な延長線上にあるものとして考えている。周囲の誰にでも見えるアバターの頭上のふきだしの代わりに、プレイヤーは出会った人々に自然に話しかけることができるようになる。

例えばRobloxの仮想スケートパークで空間オーディオをオンにして遊んでいるとする。ハーフパイプで一緒に滑っているスケーターの声は、現実の世界と同じようにはっきりと聞こえるが、通りの向こう側の歩道を歩いている人の声は遠すぎて聞こえない。近くの友人と2人きりで話をしたいときは、その場を離れて近所のお店に向かって歩いて行けば良い。

RobloxのチーフプロダクトオフィサーであるManuel Bronstein(マニュエル・ブロンスタイン)氏は、TechCrunchのインタビューに応じてくれた際に次のように話している。「メタバースにおける将来のコミュニケーションのあり方は、とても自然で我々の普段のコミュニケーションと似たような感覚でなければならないと思っています。さらに、物理的なものや空間が生み出す現実の世界の制限を超えることも可能なのです」。

Robloxのメタバースに対する特有のビジョンを実現するためにGoogle(グーグル)を退職し、3月にRobloxに入社したブロンスタイン氏。Robloxに入社する前はZynga(ジンガ)、Xbox(エックスボックス)、YouTube(ユーチューブ)という3社のまったく異なる企業でプロダクトチームに所属していたが、実際は同氏の現在の仕事とも大きな関連性がある。

「買い物やコンサート、学校に行くことができるようになる次なる形態としてメタバースを考えると、社会のすべての人に関連している必要があり、そうした行動のすべてをサポートするコンテンツやルール、機能を構築する必要があると思います。そしてプラットフォームに音声をもたらす理由の1つには、若くないユーザーが自然にコミュニケーションをとれる方法を確保する必要があるということが挙げられます」とブロンスタイン氏は話している。

Robloxがボイスチャットに注力しているからと言って、一夜にしてそれが叶うわけではない。しかしこの長い開発期間は意図的なものである。同社は13歳以上の開発者5000人を対象に、カスタムメイドのRobloxコミュニティスペースで新しい空間ボイスチャット機能を試してもらう予定なのだ。

「おもしろい機能を多数搭載し、彼らがチャットやハングアウトできる場所を用意しました。彼らは私たちがコミュニティスペースのために書いたコードから学ぶことができ、数週間後あるいは1カ月後にはそれを自分のエクスペリエンスに当てはめて、活用することができるのです」とブロンスタイン氏はいう。

ブロンスタイン氏はRobloxがこのプロセスをゆっくりと進め、新しいモデレーションツールと安全ツールを並行して構築していくことを強調する。選ばれた開発者のグループから始め、モデレーションツールで十分に安全な環境を作れると確信したらそこから徐々に広げていくという形で、ボイス展開がゆっくりと進められる予定だ。

「ゆっくりと進め、やりながら学んでいきたいと思っています。先ほども言った通り、まずは開発者から始めることになるでしょう。その後に13歳以上のユーザーを対象にして、すべてがうまく進んでいるかどうかを正確に理解するまでしばらくそこに留まってから、その後若いユーザーに公開するかどうかを決めることになるでしょう」とブロンスタイン氏は話す。

広大な仮想世界を適切に管理するために、Robloxでは自動スキャンと3000人の人間のレビュアーからなる安全性チームを完備。他のソーシャルネットワークと同様に、プレイヤーは他のプレイヤーを報告したり、ブロックしたり、ミュートしたりして自分の体験をより快適なものにすることが可能だ。また、Robloxのプレイヤーの半数は13歳未満であるため、テキストチャットなど年齢に応じた体験を親がコントロールできるような許可機能を用意している。ボイスチャットが低年齢層にも普及するようになれば、親はボイスチャットを完全に無効化することもできる。

Robloxのユーザーは13歳以下が圧倒的に多いものの、ティーネイジャーやそれ以上の若者も意外なほど多く利用しているようだ。同社によるとユーザーの50%は13歳以上であり、特に17歳から24歳のユーザーが爆発的に増加しているという。新しいユーザーも獲得している同社だが、コアユーザーの成長に伴い、同社もともに成長する必要があると考えている。

若いユーザーにボイスチャットが導入されるかどうかは別として、Robloxはボイスチャット機能のある仮想環境を安全かつ友好的に保つことが大変な課題であることをよく理解しているようだ。同社は音声の導入時にはユーザーからの報告システムに頼る予定であり、これを強化できるその他のツールも検討中だ。例えばユーザーが通報される直前の会話を自動的に録音して、レビュアーに悪質な行為を伝えるツールなどもその1つである。また、一定数の違反があったユーザーを自動的に制限するレピュテーションシステムの拡大にも関心があるようだ。

他のソーシャルプラットフォームと同様に、Robloxはユーザーからの報告に大きく依存することになるだろう。ヘイトやハラスメントを受ける側のユーザーに不均衡な負担を強いることになるが、これはソーシャル企業がどこも適切な人的資源を投じて解決策を導いていないということによる不幸な結果である。

関連記事:RobloxがDiscordと競合するゲーマー向けチャットプラットフォームのGuildedを買収

ボイスチャットの今後の行方

Robloxにとって空間オーディオは、自然なコミュニケーションのビジョンにおける「一要素」に過ぎないとブロンスタイン氏は話している。次のステップは、体験を超えた永続的なボイスチャット体験を統合することであり、お互いを知っているユーザー同士が同じことをしていなくても交流できるようにすることである。RobloxがGuildedという会社を2021年8月に密かに買収したニュースに気づいた読者なら、これは驚くことではないだろう。Robloxの音声に関する取り組みは買収以前からのものではあるが、GuildedはRobloxの将来の音声計画の基礎を築くことになるだろう。

Discord(ディスコード)と競合関係にあるGuilded(ギルデッド)。Discordはゲーム以外の分野に視野を広げているが、Guildedは同様にゲーマー向けのチャットプラットフォームを構築して、対戦型ゲームの分野に力を入れている。Guildedはグループボイスチャットに加えて組み込み式のスケジューリングツールやコミュニティ管理ツールをゲーマーに提供しており、World of Warcraftで20人以上のゲーマーを集めて攻撃を行うというような、複雑なオンラインソーシャルイベントを開催する手間を軽減している。

「Guildedはすばらしいロードマップを持っているので、現時点では大規模な統合をせずに、そのロードマップを継続して成長させていきたいと考えています」とブロンスタイン氏は話している。

メタバースの世界へ

モデレーションの問題はさておき、基本的に今Robloxの道を阻むものは何もない。3月に株式を公開した同社は、現在では490億ドル(約5兆4000億円)の価値があると言われており、ゲーム業界で最も価値のある企業の1つとなっている。投資家、コンテンツ制作会社巨大テック企業がこぞってメタバースに参入しているが、これはかなり安全な賭けと言えるだろう。

関連記事:ザッカーバーグ氏は110兆円規模のフェイスブックを「メタバース」企業にすると投資家に語る

メタバースは今、流行語にもなっているが、これは誇大広告というよりは略語のような存在だ。人々がメタバースについて語るとき、一般的には相互に接続された仮想世界の未来像を思い描いているだろう。つまり、移動したり、交流したり、買い物をしたりできるオンライン空間である(良くも悪くも、最後の部分が鍵と言える)。これがすべてバーチャルリアリティになるのか、そうでないのか、またそれがいつになるのかは議論の余地があるが、実際には「相互接続」という部分が大きな課題となる。アプリの時代、ソフトウェアは設計上サイロ化されていた。しかしメタバースを実現するためには、仮想の自分と仮想のモノが、オンラインの世界を流動的に行き来できるようになる必要がある。

この点については数社の企業が先行しているが、カスタムアバター、ゲーム内経済、シームレスなソーシャルレイヤーを備えた、仮想世界で有名なRoblox とEpic(Fortniteの製作会社)の2社がユーザー作成コンテンツのレベルを引き上げているのは単なる偶然ではない。このような体験や、仮想空間で何かをしているときに友人と簡単に一緒にいられるという能力が、結局はメタバースのすべてなのかもしれない。

ほとんどの大人は、子どもたちが夢中になって遊んでいる奇妙な世界の魅力を理解することができずにいるが、Robloxはオンラインライフがどこに向かっているかという基本的なこと、またはむしろRobloxの世界のような、私たちみんなが行き着く先を理解しているのではないだろうか。

画像クレジット:Roblox

原文へ

(文:Taylor Hatmaker、翻訳:Dragonfly)

15億円超を調達したSpatialは没入的VR/ARでオフィスのバーチャル化を狙う

VR/ARはまだ一般消費者向けプロダクトとしてはメインストリームとなっていないが、MR(混合現実)テクノロジーによってバーチャルオフィスを実現しようとするスタートアップが資金を調達することに成功している。

Spatialが提供するのは「ホログラフィック・オフィス」だ。これは共同作業のプラットフォームで 複数のオフィスワーカーが同一の3D仮想空間を共有し、人々をアバターで表示することにより少ないリソースで相手があたかも同じ部屋にいるような体験を可能にする。会話したり図表をバーチャルな壁に掛けて示すことも可能だ。いわばGoogle Hangoutや Zoomのバーチャル・リアリティー版というところだ。

以下のSpatioalの紹介ビデオは私が今月のCESで撮影したものだ。

このSpatialは米国時間1月30日、シリーズAのラウンドで1400万ドル(約15億2700万円)のベンチャー資金を確保したことを発表した。同社はサービスに新機能を追加すると同時にサポートするハードウェアを拡大する。またSDKなどを通じてサードパーティが容易にサービスを利用できるようにしていくとしている。

今回のラウンドは、WhiteStar Capital、iNovia、Kakao Venturesがリードし、Baiduと個人投資家が加わった。Instagramの共同創業者であるMike Krieger(マイク・クリーガー)氏、ZyngaのMark Pincus(マーク・ピンカス)氏も参加している。Spatialは 2018年8月のシードラウンドで800万ドルを調達しているので合計2200万ドルとなる。「会社評価額は公開していない」と共同創業者でCEOのAnand Agarawala(アナンド・アガラワラ)氏は述べている。最高プロダクト責任者のJinha Lee(リー・ジンハ)氏がもうひとりの共同創業者だ。

投資家には、Expa、Lerer Hippeau、 Leaders Fund、Samsung NEXTなどのほかにMacintoshの開発で知られるAndy Hertzfeld(アンディ・ハーツフェルド)氏も加わっている。

VR、ARマーケットではMagic Leapだけでも30億ドルの資金を集めている。この市場の会社評価額総額は450億ドルにも上り、Facebookに買収されたOculusのように 高額のエグジットも記録されている。 しかしVRデバイスの販売台数はさほど急激に成長しておらず、昨年の販売は600万台にとどまったもようだ。

【略】

アガラワラ氏はBumpTopの創業者でもあり、2010年にGoogleに買収されて以後、Googleの幹部を長く務めてきたSpatialをSDKを通じて普及させ、多くの人々が使うプラットフォームにしようとする同社の考え方はこうした同氏の経歴によるところが大きい。

「Spatialではアバターを利用し、ハンドジェスチャーで直感的に制御できる複数OSをサポーするバーチャル・オフィスという我々のフレームワークを利用したアプリケーションが多数生まれてプラットフォーム化することを目指している。しかしこの目標を実現するには何年もかかるだろうと覚悟していた。つまり現実のニーズがないところでAR/VRプラットフォームのマーケットもまた立ち上がらないからだ。しかし最近はエンタープライズ向けVR/ARに強い関心が寄せられるようになったので、今年にもブレークできるだろうと期待している」と同氏は言う。

Spatialへの投資家の一人のMike Krieger(マイク・クリーガー)氏は、Loom、Figma、Pitchなど他のエンタープライズ向け共同作業プラットフォームにも投資している。同氏によればSpatialは単なるVR/ARテクノロジー企業ではなく、バーチャルオフィスを作って広くエンタープライズに提供するというビジョンを持っている点が重要だという。これは企業向けチャットサービスのSlackが驚くべき急成長を遂げたのと比較できるかもしれない。

「SpatialのMR(混合現実)ソリューションは将来の効率的オフィスのカギとなるはずだ。ZoomやSlackなどに代表される現在のコミュニケーションのレベルを超えて、未来の共同作業のフレームワークを作るものだ。こうした試みを支援することができることに興奮している」とクリーガー氏は声明で述べている。

原文へ

(翻訳:滑川海彦@Facebook

クラウド通信のためのAPIを提供するAgoraがシリーズCで$70Mを調達、Twilioに負けない強みとは?

クラウド通信のためのAPIを作っているAgoraが、Coatue ManagemenがリードするシリーズCのラウンドで7000万ドルを調達し、新しい市場と業種分野の開拓をねらっている。これまでの投資家SIG, Morningside Capital, およびShunwei Capitalもこのラウンドに参加し、Agoraの総調達額は1億2500万ドルになった。

同社のAPIはMeet Group, Xiaomi, Hike Messenger, Momoなどに利用されていて、顧客はそのAPIを使って自分のアプリケーションに音声やビデオ、そしてグループによる通話機能を実装する。Agoraによると、そのSDKのインストール数は最近20億を超え、同社の世界中に分散する200のデータセンターを経由する毎月平均100億分(ふん)のコミュニケーションを支えている。

同社はその成長目標の達成を目指して、比較的速いペースで資金を調達している。この前の資金調達の発表は5か月前で、そのときは同社のシリーズBの3000万ドルの拡張が行われて、ラウンドの合計が5000万ドルになった。

Agoraは2014年にCEOのTony Zhaoが創業した。彼はオンラインコミュニケーションプラットホームWebExの創設技術者だったが、同社は2007年にCiscoに買収された。また彼は、中国のビデオライブストリーミングプラットホームYYのCTOでもあった。Agoraは本社がカリフォルニア州サンタクララにあり、上海にもオフィスがある。同社は、TwilioやTokboxなど既存のコンペティターがいる市場への、比較的新しい参入企業だ。

Agoraのメインのプロダクトは、デベロッパーが自分のアプリケーションに音声、ビデオ、そしてグループによる通話機能や対話的なブロードキャスティング機能を持たせるためのSDKだが、最近ではゲームデベロッパーとFacebookのReact Nativeフレームワーク向けのSDKも提供している。

画像クレジット: Agora

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

コードの各所に関するデベロッパー同士の議論をコメントのように残せるCodeStream、最初はVS Codeをサポート

コードにコメントを入れることは、昔から誰もがやっているが、でも、コードの特定部分に関する同僚などとの会話スレッドを残せるとしたらどうだろう。Y Combinator出身のCodeStreamを使うと、まさにそれができる。

コンテンツに関する議論は、そのコンテンツの直後にある方がよい。Google Docsのアノテーション(注釈)やPowerPointのコメント、Wordのリビジョン(変更履歴)などは、だからとても便利だ。何もかもSlackの上で議論するのは、やめた方がいい。

しかしそれでも、二人のデベロッパーのコラボレーションは、Slackの上のプライベートな会話で始まることが多い。CodeStreamはgit commitやコード中に書くコメントに代わるものではなく、コードの上に便利な会話の層を加える。

誰かと関わりたくなったら、まずテキストをセレクトして議論を開始する。そして、当のコーディングブロックを最初のポストとするスレッドが作られていく。CodeStreamを今使ってるSlackにリンクしたら、Slackのチャネルの中でスレッドが始まる。誰かを@-mentionしたり、数行のコードをコピペしたりもできる。

mentionされたデベロッパーは、そのスレッドをクリックすると、CodeStreamはそのファイルをその行があるところで開く。二人のデベロッパーが同じブランチ上にいなくても、どちらもコードの同じ行を見る。どっちかに新しいコードがあっても。

数か月後にコードベースが進化していても、会話スレッドは残っている。いつでも、過去の会話を見て、なぜそこがそうなったのか、理解できる。

今は、CodeStreamはVS Code(Visual Studio Code)をサポートしている。CodeStreamをインストールしたら、IDEを縦2画面に分割して、左にコード、右にCodeStreamの会話スレッド、という状態にするとよい。

今後は、もっと多くのIDEをサポートしていく予定だ。Visual StudioやJetBrainsエディター、そしてAtomなども。今CodeStreamはベータなので無料だ。

同社は最近、S28 Capitalが率いるラウンドで320万ドルを調達した。それにはPJCが参加した。そのほかに、Y Combinator, Steve Sordello, Mark Stein, David Carlickなども投資に加わった。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

まだまだメールに起業機会あり、June.aiは効率的なメール分類サービスで$1.5Mを調達

メールは今なお、起業家にとって魅力的なターゲットのひとつだ。なんといってもメールは誰もが使っているし、しかも依然としてそれは、快適な使い心地とは言えない。

June.aiも、メールの使い方を変えようとする多くのスタートアップの仲間に加わろうとしているが、でもこの新人のアプローチはほかとちょっと違う。

協同ファウンダーでCEOのAllie Suttonによると、彼のチームは、人びとのメールの使い方そのものに目を向けているわけではない。むしろ彼らが着目しているのは、コミュニケーションと情報の流れの全体的な姿だ。そしてJuneが作ったのは、必ずしもメールをリプレースするのではなく、むしろ、メールサービスという古いシステムとの互換性のある〔==後方互換性のある〕プラットホームだ。

どういうことか、というと:

まず最初にJuneは、メールを他の人との会話であるものと、企業などからのメールに分類する。それらを二つの別々の受信箱へ入れる。そして情報的なメール、“Your Amazon Order has Shipped”(Amazonの注文が発送されました)や“Check In For Your Flight,”(あなたのフライトにチェックイン…搭乗手続き…してください)などのメッセージは、閲覧しやすいフィードに入れる。

一方コミュニケーションのメッセージは、メールというよりもむしろiMessageやIMのようなインタフェイスの受信箱に整理される。会話は相手の人別に分類され、スレッドや主題別にはしない。だから、特定の人との会話履歴の全貌が、スレッドにとらわれずに把握できる。ファイルもやはり、送り手の人別に分類される。

またJuneの‘gatekeeper’(ゲートキーパー、門番)機能を使って、ユーザーにメールを送ってくる企業や人を、簡単に縁断ち(脱会など)、承認、ブロック(受け取らない、無視する)などできる。

150万ドルの資金を獲得したJuneは、短期の売上を気にすることなく、宣伝やプロモーションに注力できる。

Juneは、Gmail, Yahoo!, Outlookなどのメジャーなメールサービスで使える。

Suttonによれば、最大の難題は採用者の拡大だ。

彼曰く、“みんな我流のやり方でメールを処理しているし、そのやり方は何年も何十年も続いている。うちのやり方ならもっと効率的な処理ができるんだけど、それを説明して分かってもらうのが難関だ。こっちの方が効率的だ、と納得してもらわなければならないからね”。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Google Mapsにグループプランニング機能が登場、マップの上でわいわい言いながら行き先を決めよう

今年の5月にGoogleは、新装のGoogle Mapsを発表した。それは、発見を前面に打ち出していた。そのとき発表された発見や探究(探検)の機能やツールは、その後ほどんどすべてローンチしたが、ただ一つ欠けていたのがグループプランニングだ。しかしそのグループコラボレーション機能が、今日(米国時間9/25)ついにローンチした。これからはお出かけを、みんなで一緒に計画できる。

Googleがこの機能で解決しようとした問題は、ディナーなどのお出かけ計画を二人以上の人間でやろうとした人なら、誰もが知っている。どこに行くかを決めるだけでも、大量のテキストメッセージのやり取りを要するだろう。

でも今度からは、Google Mapsの中で場所のリストを作って、それを友だちと共有できる。そして良質な民主主義の慣行として、行きたい場所をみんなで投票できる。しかし誰かが場所を消して自分の好みの場所をリストに加えることもできるから、民主主義の難しさはここにも表れている。

とにかく候補の最終リストができたら、モバイルやWebのGoogle Mapsに友だちを連れて来て、それをシェアし、みんなで楽しくプランニングを開始できる。

[Google I/O:マップ・アプリにニュースフィード…個人別に情報や提案を配信するようになる]

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Skypeにやっと通話記録機能が登場、ビデオ+音声で記録され長期保存も可能

Skypeは、多くの人が日常使っている(ゆえに必要不可欠な)コミュニケーションツールだが、これまでは、その多くの人のほとんどが必要としていたと思われる、基本的な機能が欠けていた。それは、通話記録だ。そして、今やSkypeのオーナー企業であるMicrosoftの耳にやっとわれわれの要求が届き、通話記録機能がSkypeのデスクトップとモバイルアプリの両方に実装された

どのプラットホームのアプリでも、最新バージョンにはその機能があるが、なぜかWindows 10だけはない。どうやら、それは数週間後になるようだ。

画面の右下のプラス記号“+”を押し、“Start recording.”をセレクトすると、記録(録音)が始まる。

相手の画面には小さなバナーが出て、この通話が記録されていることが伝えられる。だから、相手に対して内緒で記録、ということはない。しかし‘双方の合意’に関する法律を気にするMicrosoftは、そのバナーで、あなたがその通話を記録(録音)中であることを相手に伝えるのだ。

通話が終わったら、記録されたビデオとオーディオは30日間、MP4でネット上に保存されるので、必要な人はそれをダウンロードしたり、あるいはリンクを共有できる。

音声だけを記録する方法はないみたいだから、ちょっと困るね。3人の通話を記録したビデオは、相当大きくなるだろう。次のアップデートで、‘音声のみ’というオプションを加えてほしい。

人びとは何年も前から、サードパーティのアプリを使ってSkypeの会話を記録してきた。ぼくはMP3 Skype Recorderを使っているが、とても使いやすいアプリだ。今後このアプリは消え去る運命かもしれないが、とにかくぼくは、バックアップのために持っておきたい。今このアプリの作者に、今後どうするのか問い合わせている。

それはさておき、Windows 10のユーザー以外の方は、ふつうにSkypeを起動して、何でも記録できるようになる。それはクラウド上のMicrosoftのシステムの負荷になるが、それが同社のねらいだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

複数のメッセージング上のコミュニケーションを統一するMessageBirdの仮想APIは企業への顧客の感度を良くする

アメリカのAccelとヨーロッパのAtomicoが投資しているアムステルダムのクラウドコミュニケーションプラットホームMessageBirdが今日(米国時間8/8)、企業が顧客たちと、彼らが選んださまざまなチャネルを横断して容易にコミュニケーションできるための、新しいプロダクトを発表した。

“Programmable Conversations”(プログラマブルな会話)、というすごい名前がつけられたこのプロダクトは、単一のAPIのような形をしているが、実際には複数のチャネルにまたがる顧客の対話を、単一の会話スレッドに統一する。製品の現状では、その‘複数のチャネル’は、WhatsApp, WeChat, Facebook Messenger, Line, Telegram, SMS, そして音声による対話だ。Programmable Conversationsの仮想APIからは、これらを単一の会話チャネルのように扱える。それにより企業は、顧客とのコミュニケーションの履歴を統一された形で見ることができ、カスタマサポートやそのほかの顧客対面部門では、つねに最新最先端の顧客サービス体制を維持できる。それはもちろん、顧客の満足や企業への好感度につながる。

別の言い方をすると、コミュニケーションのチャネルが多いと会話は断片化しがちだ。しかもそこに、複数のサポートスタッフが関与していると、サービスの質は必然的に低下するだろう。Programmable Conversationsは、この問題を解決しようとする。

MessageBirdのファウンダーでCEOのRobert Visによると、ますます多くの企業や、急成長しているスタートアップには、顧客が企業との会話に使用するチャネルを一方的に指定する贅沢が許されない。これまでのカスタマーサービスは専用の電話番号を使うだけだったが、昨今の、オンラインメッセージングやそのほかのコミュニケーションチャネルの相次ぐ出現と氾濫により、顧客がコミュニケーションに使用する方法の選択肢が爆発的に増えている。

しかし、企業が既存のCRMやビジネスプロセスにそれらすべてを統合しようとすると、開発時間が膨大になるだけでなく、複数のチャネルに対応するためにスタッフの増員が必要になる。

このたいへん重い重量挙げを、MessageBirdのProgrammable Conversationsがお手伝いする。複数のチャネルに分散している会話を一本化することは、企業自身の手に負える技術課題ではない。しかしProgrammable Conversationsの仮想APIを使えば、実装の初期費用と時間が節約できるだけでなく、今後のメンテナンスや必要なアップデートも容易になる。

Visによると、Programmable Conversationsはグローバル企業のコミュニケーション管理にも向いている。あるいは、今後グローバル化していく企業の、その過程を支えることができる。多様なメッセージングプラットホームへの対応だけでなく、地球規模での複数キャリアの統合も可能だ。

“その企業とのコミュニケーション体験が良かったら、顧客の満足度とブランドロイヤリティがアップする。しかもこの二つの要素は、今日の企業の生命線だ。今日の顧客は企業と、友だちや家族と同じように会話したいと思っている。自分の好きな時間に、好きなチャネルで、しかも相手がこれまでの会話の文脈を完全に分かっている状態でだ。Programmable Conversationsを使えば企業は、そのような現代的なコミュニケーション体験を容易に構築できるし、しかもデベロッパーたちを過負荷にすることもない”、とVisは言っている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Bluetoothプロトコルの多用途化を目指すTempowが$4Mを調達、すでにLenovoなどが採用

フランスのTempowが、400万ドルの資金を調達した。この投資を仕切ったのはBalderton Capital、これにC4 Venturesが参加した。同社は、Bluetoothのプロトコルを改良して、その用途を広げようとしている。

スマートフォンやスピーカー、それにさまざまなコネクテッドデバイスは、それぞれいろんなやり方でBluetoothを利用している。しかしBluetoothのチップセットを作っているのは、QualcommやBroadcomなど、ほんのひとにぎりのメーカー企業だ。Bluetoothのチップはすばらしく効率的になり、電力消費も前よりずっと少なくなったが、ソフトウェアは進歩が停滞している。

ソフトウェア企業であるTempowは、Bluetoothのソフトウェアスタックを完全に書き換えようとしている。同社はまず、オーディオのプロファイルからスタートした

Tempowの技術を使うと、スマートフォンを複数のBluetoothスピーカーに同時に接続できる。ソフトウェアの改良だけで、それができる。Bluetoothのチップセットやオーディオデバイスは従来のものでよい。

このアイデアを気に入ったLenovoはTempowの技術をライセンスして、Moto X4ハンドセットに使った。その、TempowのBluetoothスタックを使ったデバイスは、500万台以上売れた。

今回得られた資金で同社は、ユースケースを拡大したい、と思っている。そのために必要な低レベル技術が、ペアリングプロセスの最適化、プロトコルのセキュリティの強化、電池寿命のアップなどだ。協同ファウンダーでCEOのVincent Nallatambyは、“そのうち、NFCよりBluetoothを使った方がペイするだろう”、と言っている。

同社は今、複数のメーカー企業に技術を売り込んでいる。今後はもっと多くのデバイスが、TempowのBluetoothソフトウェアを使っているだろう。

同社は今、7つの特許を出願しており、先週最初のひとつが認可された。今後はBluetoothのエキスパートチームを作って、同社のプロトコルをさらに普及させたい、と考えている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

GoogleがAndroidの銃の絵文字を水鉄砲に変えたようだ

2016年にAppleは、銃を表す絵文字を本物のような銃から明るいグリーン色の水鉄砲に変えた。

数日前にはTwitterが、それに倣った

そして、どうやら今度はGoogleだ。Androidの銃の絵文字が近く、明るいオレンジと黄色の、人をびしょ濡れにして楽しむもの(別途水タンクがあって水量が多い水鉄砲)、になるらしい。

最初に気づいたEmojipediaによると、Googleは今日(米国時間4/24)、GitHub上の公開リポジトリNoto Emojiライブラリのグラフィクスを入れ替えた。それらはAndroidがデフォルトで使用する絵文字だから、デバイスに対するアップデートもいずれ始まるのだろう。

今となっては、Googleが絵文字を変えるのは避けられない。Appleがそれをやったときに、すべては始まった。そしてTwitterが続き、SamsungもGalaxy S9のリリースでそれをやる。Googleも、やるに決まっている。

明朗なコミュニケーションのためには、必要なことだ。誰かが(iOSユーザーが)メッセージで水遊びの玩具の漫画を送れるのに、ほかの多くの人たち(Androidユーザー)がそれを本物の拳銃のような絵として受信したら、ちょっと面倒なことになるかもしれない。Appleに、それを元に戻す気はない。そして今や他社も右へ倣えしている。Googleも、変人と思われたくない。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Twilioがコンタクトセンター構築のためのビルディングブロック集Flexを近く立ち上げ

デベロッパーが新しい顧客体験を作るための一連のプロダクトをまとめたTwilioのスイート、Engagement Cloudに、新しい機能が加わる。本誌情報筋によれば、今度ベータでローンチするそれは、3月のEnterprise Connectカンファレンスに集まる企業のための、完全なコンタクトセンターソリューションだ。Twilioに確認を求めたが、ノーコメントだった。

われわれが垣間見たTwilioの社内メールによれば、同社は、一部の顧客がエンタープライズに売っているコンタクトセンターソリューションとの競合を避けようとしている。しかしそんな顧客も、Twilioのサービスにとって重要なユーザーだから、気を使うのも当然だ。

これまでのTwilioの立ち位置は、新しいコンタクトセンターソリューションを開発するためのビルディングブロックとなる、さまざまなAPIの提供だ。今度の新しいコンタクトセンターソリューションは、それらをワンセットでまとめて、デベロッパーにとってずっと使いやすくしたものになるのだろう。

Twilio Flexと名前まで漏れている今度のTwilio自身のコンタクトセンター用プロダクトは、これまでのそのほかの同社製品と同じくデベロッパー体験を重視するだろう。たとえばシステムインテグレーターはFlexを利用して、独自にカスタマイズしたコンタクトセンターソリューションを作ったりできるだろう。

Twilio Flexは、そういう人たちが、強力な通信体験と、シングルサインオン、会社のワークフォース管理との統合、ワークフォース最適化スイート(通常のコンタクトセンターの便利機能…通話記録、エージェント指導、談話分析など)を構築するときの、基本的なビルディングブロックを提供する。そしてまた、彼らのバックオフィス社員のスケジューリングシステムとの統合も、サポートするだろう。

Flex(柔軟)という名前が示すように、このサービスはユーザーによるカスタマイズの最大化をねらっている。しかしもちろん、ユーザー企業独特の統合化ニーズについては、顧客の創意と努力が必要だ。企業の、コンタクトセンターの最適化ニーズとは、そういう柔軟なカスタマイズにある、とTwilioは主張しているようだ。

本誌情報筋によると、公式の発表は3月12日だ。それはオーランドで行われるEnterprise Connectカンファレンスの初日で、このカンファレンス自体、コンタクトセンターやコーリングセンターがフォーカスとなる。

画像提供: Twilio/Flickr

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

SignAllはゆっくりと、しかし着実に手話通訳プラットフォームを構築中

翻訳は難しい作業だ。2つの言語の距離が遠くなるほどそれは難しくなる。フランス語からスペイン語?それほど問題はない。古代ギリシャ語からエスペラント?かなり難しいだろう。しかし、手話は独特だ。そしてその翻訳の難しさも独特である。なぜならそれは話されたり書かれたりしている言語とは、根本的に異なるものだからだ。こうした事情から、SignAllは、アメリカ手話(American Sign Language:ASL)の正確でリアルタイムな機械翻訳を実現するために、何年も努力を重ねてきた。

AIとコンピュータビジョンに現在起きている進歩を考えれば、このような解くのが面白くて有益な問題は、既に一流中の一流どころが一斉に取り組んでいることだろうと想像するかもしれない。シニカルな市場拡大の観点から考えても、手話を理解できるEchoやテレビは何百万人もの新しい(そして感謝を捧げてくれる)顧客を引きつけることだろう。

しかし残念ながら、そうしたことは起こっていないようだ。それがこのブタペストを拠点とする小さな企業であるSignAllのような会社に、不自由な人びとへの利便性を提供するこの難しい仕事が残された理由だ。そして、手話をリアルタイムで翻訳することは、思われていたよりも複雑な作業であることが判明したのである。

CEOのZsolt Robotkaと最高研究開発責任者のMártonKajtárが、今年のCESに出展を行っていた。私はその場で、会社のこと、彼らが挑戦している課題、そしてこの分野がどのように発展していくのかについての話を聞いた(私は彼らが2016年のDisrupt SFにも出展していたことを知って嬉しくなった。残念ながらその時は彼らに会うことはなかったのだが)。

おそらく、このビジネスの中で私にとってもっとも興味深いことは、彼らが解決しようとしている問題がどれほど興味深く、そして複雑なものであるかということだ。

「これはマルチチャネルコミュニケーションなのです。実際に、大切なのは形や手の動きだけではないのです」とRobotkaは説明する。「手話を本当に翻訳したいのならば、上半身の動きと顔の表情をすべて追跡する必要があります。このことはコンピュータービジョンの部分を非常に難しいものにします」。

ちょっと考えただけでも、それは大変な作業である、わずかな動きも追跡することを考えるとそれは膨大な量となるだろう。現在のシステムはKinect 2を中心に置いて、3台のRGBカメラを1〜2フィートの位置に設置している。誰の話し方も少しずつ違っているように、ASLユーザーも少しずつ違った動作を行う。このためシステムは新しいユーザー毎に再調整をする必要がある。

「この複雑な構成設定が必要なのは、こうすることで異なる視点を持つことができ、そのおかげで時間と空間(リフレッシュレートとピクセル数)に対する、解像度の不足を補うことができるからです」とKajtárは語る。「ASLでは非常に複雑な指の動きを行うことができますが、手を骨格として捉える従来の手法は役に立ちません。何故なら指同士が重なるからです。そこで、サイドカメラを使用してこの重なりを解決しています」。

それでは十分でないと言うかのように、顔の表情やジェスチャのわずかな変化も、伝えられていることに加わる。例えば感情の追加や方向の指示などだ。そしてさらに、手話は、英語や他の一般的な話し言葉とは根本的に違っているという事実がある。これは単なる置き換えではなく、完全に翻訳なのだ。

「手話の本質は、連続した身振り(サイン)です。この性質から、いつ1つのサインが終わり、そしていつ次のサインが始まったかを区別することが難しいのです」とRobotkaは語る。「そして、それはまた非常に異質の言語でもあるのです。語彙から拾い上げて、単語単位で翻訳をすることはできません」。

SignAllのシステムは、順番に提示される個々の単語だけではなく、完全な文章を対象に動作を行う。サインを1つずつキャプチャして、翻訳していくシステム(性能が限定的なバージョンは存在している)は、言われていることに対して、間違った解釈や、過度に単純化された表現を生み出しやすい。行く方向を尋ねるような単純なコミュニケーションに対しては十分かもしれないが、本当に意味のあるコミュニケーションは、検知され正確に再現されなければならない、何層にも重なった複雑な階層で構成されているのだ。

これらの2つのコミュニケーションレベルの間のどこかを目指して、SignAllはギャローデット大学で、最初の公開パイロットプロジェクトを行おうとしている。このワシントンDCにある聴覚障害者のための学校は、ビジターセンターのリノベーションを行っている最中だが、SignAllはここに、訪問した健聴者が聴覚障害スタッフと対話できるようにできる翻訳ブースを設置する。

ギャローデット大学のビジターセンターに置かれたAignAll装備デスクの想像図

Robotkaは、これはシステムのテストを行うための良い機会だと語る。通常は情報提供は逆方向で、聴覚障害者の方が健聴者から情報を貰う立場だからだ。手話ができない訪問者は、喋ることもできて、(もしスタッフが読唇術を使えない場合には)その質問はテキストに変換される。そしてスタッフによる手話による応答はテキストに変換され、音声合成が行われる。

これは複雑なやり方に聞こえるし、実際技術的はとても複雑だが、現実的にはどちらの側の人間も普通にやっていること以上のことを行う必要はない。それで相手には理解して貰えるのだ。少し考えてみれば、これがどれほど素晴らしいことかが分かるだろう。

パイロットテストの準備のために、SignAllとギャローデット大学は協力して、現在使われているアプリや、大学固有の状況に関するサインのデータベースを作成している。全ての手話サインを表す包括的な3D表現は存在しない、そのため当面システムは配備された環境に応じて提供される。ドメイン特有のジェスチャーが順次データベースに追加されていくことになる。

ギャローデット大学の学長のRoberta Cordano(中央の灰色のセーターの人物)が、ブダペストのSIgnAllのオフィスを訪問したときの様子。彼女の向かって左後ろに立つのがRobotka、右端に居るのがKajtár。

「これらの3Dデータを収集するのは本当に大変でした。彼らの協力を得て、丁度作業が終わったところです」とRobotkaは語る。「インタビューを行い、そこで発生した会話を集めて、すべての言語要素とサインが集められるようにしました。私たちは、最初の2、3のパイロットプロジェクトで、同じようなカスタマイズ作業を繰り返すことになると考えています」。

この長期間にわたるプロジェクトは、技術の可能性と限界の両方を冷静に思い出させるものだ。もちろん、手話の自動翻訳が、コンピュータビジョン、機械学習、イメージングの進化によって可能になったことは間違いない。しかし、他の多くの翻訳やコンピュータービジョンタスクとは異なり、基本的な正確性を達成するだけでなく、人間中心主義の側面が確実に含まれるようにするために、大量の人間からの入力が必要とされるのだ。

結局のところ、こうした活動は単に私たちが外国のニュース記事を読んだり、海外でコミュニケーションを行う際の利便性に留まる話ではなく、多くの人が対面コミュニケーションとして考えている「会話」という手段から締め出されている人たちの、利便性に関わる話なのだ。彼らの運命を良くして行くことは、待つだけの価値がある。

[原文へ]
(翻訳:sako)

Slackベースの使いやすいタスク管理プラットホームWorkastがシード資金を獲得してSlack以外にも対応へ

Slackを利用するタスク管理ツールとして評判のWorkastが、サポートするメッセージングプラットホームを増やそうとしている。

Asanaなど、そのほかのタスク管理アプリケーションにうんざりしていたユーザーの願いに応えたWokastは、このほどGreycroft Partnersがリードするシードラウンドで185万ドルを調達し、Slack以外のメッセージングプラットホームへの対応を目指している。

WorkastのCEO Guillermo Getteによると、同社の成功の鍵は会話的インタフェイスにフォーカスしたことにあり、その成功の上に機能を拡張してきたからだ。その便利で使いやすいタスク管理の機能が、これからはGoogle HangoutsやMicrosoft Teams, Stripe, それにCiscoのチャットプロダクトでも使えるようになる。

“Slackがベースだから、ユーザーの獲得も早かった”、とGetteは語る。“Slackのユーザーの7社に1社はWokastを使っているね”。

Getteによると、現在の月間アクティブユーザーはおよそ10万で、彼らはWorkastのツールを使ってタスクを割り当て、その完了までの過程をモニタしている。

そんなアイデアは、ExpediaにいたころのGetteにひらめいた。そして2015年には彼一人が夜や週末にタスクの統合の部分をプログラミングしていたが、今ではかなりの成長を目指せるようになった、とGetteは語る。

今年前半にはリポートやアナリティクス、無制限の統合、ゲストアカウント、テンプレート、カスタムフィールドなどの機能を盛り込んだ上級バージョンをリリースするつもりだ。

“ワーク管理ツールは10年一日のごとく変わっていないし、今の製品でもその多くは、仕事の現場における個人やチームのコミュニケーションのやり方に合わせようとしていない”、とGetteは声明の中で言っている。“Workastでは、個人とチームの継続的な対話を効果的かつ効率的に追跡できる。そのカバー範囲はすべてのチャンネル(Slackの)であり、メッセージングもメールも音声もビデオもそこに包含できる。有意義な、そして管理可能な方式で”。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Webが人間性を取り戻すとき、これまでのWebサイトとeコマースはすべて死ぬ

筆者: Rob LoCascioLivePersonのファウンダーでCEO)

あなたは私の会社LivePersonをご存じないかもしれないが、そんなあなたでも私の発明を使ったことはあるはずだ。1995年に私は、Webサイトの画面にポップアップするあのチャットウィンドウを発明した。今では世界中で2万近くの企業が、わが社のソフトウェアを使って彼らの何百万という顧客とコミュニケーションしている。その中にはT-Mobile, American Express, Citibank, Nikeなどの有名大企業もいる。1990年代の半ばにインターネットの誕生を目撃した多くのスタートアップのファウンダーたちと違って、私は今でも自分の会社のCEOだ。

長いことCEOの椅子に座っていると、これまでの20年間に起きた変化に対する、独自の見方を持つようになる。そして今私に見えている現在進行形の変化は、インターネットの姿をラジカルに変えるだろう。

90年代半ばにWebサイトを作ったときは、eコマースへの大きな夢があった。基本的に実店舗は消えてしまうであろうし、何もかもドットコムが支配するだろう。でもeコマースは、惨めにもその夢を打ち砕いた。今日、Webサイトやアプリから生じている商行為は全商業の15%足らずであり、しかも企業として成功しているeコマースはAmazon, eBay, Netflixなど数えるほどしかない。Webサイトをだめにした大きな構造的問題は二つある: それはHTMLとGoogleだ。

Webサイトは、これまで図書館に閉じ込められていた人類の大量のコンテンツの集まりを、デジタルなユーザー体験、すなわちWebサイトによって、多数の大衆的オーディエンスに開放するはずだった。最初のころ私たちは、“閲覧する”(browsing, ブラウジング)とか“索引を作る”(indexing, インデクシング)などのように図書館の用語を使い、そして多くの点でWebサイトの中核的技術であるHTML(Hypertext Markup Language)も、静的コンテンツを図書館の本のように表示するために設計された。

しかし小売店は図書館ではないし、図書館の形式をオンラインストアに適用することもできない。消費者は、買い物をするときのいろんなダイナミックな質問や会話ができる方法を必要とした。しかし今日のモデルでは、一連の静的なページを読んで質問への答を見つけなければならない。でもふつうは、店員や店主と質問と答の一連のやり取りをしてから、そのお店を信ずる気になり、いろんな物を買いたくなる。HTMLのWebサイトには、そんな、人間同士のリアルで動的な対話がない。

Webの第二の問題は、Googleだ。90年代にWebサイトを作り始めたときは、誰もが仮想ストアを自分独自のデザインでやろうとした。それによりストアはおもしろくてユニークになり、しかし一方ではスタンダードがないので見て回ることが難しく、それらを普遍性のあるカードカタログにインデクシングすることは、とてもむずかしかった。

Googleは、1998年ごろにやってきた。Googleは世界の情報を見つけやすくし、またそのPageRankアルゴリズムにより一種のルールを定めた。そのルールのせいで企業は自分のWebサイトを、それがGoogleの検索結果のトップに来るための、何らかの方法でデザインしようとした。でもそのルールの画一的な構造は結局、eコマースにとって有害だった。

今では、ほとんどすべてのWebサイトが同じに見えるし、成績(ビューワー数、集客力、等々)も不振だ。オフラインでは、各ブランドが自分たちのストア体験をユニークなものにして自己を差別化しようとする。オンラインでは、どのWebサイトも、…GucciからGapに至るまで…同じ体験を与える。トップからのナビゲーション、説明的テキスト、少々の画像と、そのほかの互いに似たような要素。Googleのルールは、ユニークなオンライン体験からその生命(いのち)を抜き取った。そしてeコマースが困れば困るほどGoogleはさらに強力になり、ひどいeコマース体験を強制して、ブランドと消費者の仲を冷たくし、無味乾燥にしつつある。

大胆な予想をしてみよう: 2018年には有名ブランドのWebサイトの最初の閉鎖が起きるだろう。

Webサイトの良くないデザインには、隠れた連鎖反応がある。今、企業のカスタマーセンターにかかってくる電話の90%は、そのWebサイトが原因だ。その典型的な旅路は: 消費者が答を求めてWebサイトを訪れる→混乱して電話をする。今やそれはまるで疫病だ。カスタマーセンターは1年に2680億件の電話に対応し、1兆6000億ドルの費用を発生させている。

比較のために全世界の広告費支出を挙げると、それは5000億ドルだ。だからカスタマーセンターは、企業のマーケティング支出の3倍のコストを生じさせている。しかも、混み合っていてお客を待たせるカスタマーセンターが多いから、さらにひどい消費者体験を与えている。Webサイトとアプリは、電話を減らすどころか増やしており、コストも大きくしている。暮らしが楽になるというデジタルの約束は、あっさり破られる。

質問に親切に答えてもらったら、喜んでお金を払う気になる、という私たちの心理は、人間に生まれつきあるものだ。今ボットやAIが話題になっているのも、そのためだ。現実世界で何かが実現し完了するのは、何の力に依(よ)っているのか。会話に依ってだ。ロボットやAIが人間の仕事を壊す、とメディアは力説するが、Webに人間性が大きく欠けている今ではむしろ、その欠陥を補い、本当に暮らしを楽にするインターネットやWebを探究すべきだ。可能なら、AIやロボットもその探究に活用して。

今改めてeコマースの現実を知ってみると、初期に私が抱いた希望や夢も錯誤だった、という気がしてくる。しかし今の私は、私が“会話的コマース”(conversational commerce)と呼んでいるものに大きな希望を抱(いだ)いている。メッセージングや、Alexaのような音声、それにロボットを、生きた、人間的な会話に活用できれば、われわれがかつて夢に見たような普遍的で大きな規模で、強力なデジタルコマースの約束を、ついに実現できるだろう。

これまで、およそ18000社の顧客企業の仕事をし、最近、会話的コマースの探究を開始した私が大胆な予想をするなら、2018年には有名ブランドのWebサイトの最初の閉鎖が起きるだろう。ブランドは、これまでのように単に顧客とコネクトすることから、会話することへと力点を移す。それはボットと人間の共同作業になり、SMSやFacebookなどのメッセージングがフロントエンドになる。私たちはすでに数社の著名ブランドと、その実現努力を開始している。

(上記予言の)最初のWebサイトが終わると、ドミノ現象が始まる。しかしそれは多くの企業にポジティブな効果を与え、eコマースと顧客ケアのやり方を抜本的に変える契機になる。でもそれは、Googleに壊滅的な打撃を与えるだろう。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa

Dellの新型PCでは画面上でスマートフォンの通知と対話できる

正直に言って、今年のCESを取材するにあたって、Dellのことはほとんど考えたことがなかった。でも、今だにPC一筋の同社は、この大会で、おもしろいものをいくつか紹介していた。まずソフトウェア方面では、モバイルとの接続がこれからのDellのコンピューターには無料でバンドルされる。

そのアプリケーションは、モバイルの通知をBluetoothでデスクトップに届ける。機能としてはWindowsのCortanaやmacOSのNotification Centerに似ているが、デスクトップ上で個々のアカウントにサインインしていなくてもよい。また、アプリはDellの承認を必要としない。要するに自分のスマートフォンに来る通知を、PCの画面でも見られるのだ。

要件は、PCがDellの新しいコンピューターであることと、Bluetoothが届く距離にスマートフォンがあることだ。本誌TechCrunchのブースでデモを見せてもらったが、たしかに、画面の右上隅に小さな通知ボックスが表示される。ただしCESの会場は電波状態がおそろしく悪いので、Bluetoothが使えず、ケーブルを使った。

通知に応えてスマートフォンと対話するには、画面のダイアログボックスやスマートフォンの画面のイメージをクリックする。ささやかな機能だが、なかなか楽しい。PCにタッチスクリーンがあれば、その大きな画面上でモバイルのゲームを遊べる。

Dellの社員は、かかってきた電話を受ける、Instagramの通知に対応する、Uberを呼ぶ、などいろんな使い方を見せてくれた。とくに印象的なのは、スマートフォンがAndroidでもiOSでもどっちでもよいことだ(両方のモバイルアプリが提供されている)。

この機能が使えるようになるのは、1月27日からだ。

参考記事



[原文へ]
(翻訳:iwatani(a.k.a. hiwa

デベロッパーでなくても誰でも通信機能のあるアプリケーションを容易に作れるTwilio Studio

Twilioはデベロッパーが自分のアプリケーションに通信機能(オーディオ、ビデオ、テキストなど)を容易に組み込めるためのAPIサービスとして長年有名だが、しかし今日(米国時間9/19)同社が非公開プレビューで立ち上げたTwilio Studioは、デベロッパーでない人びとを対象にしている。

あくまでも通信APIのプロバイダーという同社の本来の土俵にしっかりと立ってはいるのだが、しかし今回のプロダクトは、デベロッパーではなく“だれもが”、音声応答システムやメッセージングボット、通知ワークショップなど顧客のエンゲージメントのあるアプリケーションを、Web上のドラッグ&ドロップ方式で作れる。今のところ、ビデオはまだ使えない。なお、Twilioのマーケティング戦略としては、通信〜コミュニケーションを中心とするユースケースにフォーカスしているけれども、作れるアプリケーションの種類はそれだけではない(もっといろんなアプリケーションを作れる)。

Twilio Studioは特定の種類のアプリケーションを作るための、コーディング不要のサービスだが、実はプロのデベロッパーも対象にしている。Twilioのプロダクト担当VP Pat Malatackはこう語る: “これによって、こういうユーザー体験〔==アプリケーション〕を作れる人の数が大幅に増えるけれども、しかしこんなワークフローを今実際に作っている多くの企業の既存の技術者にとっても、すごく便利なんだ”。

というかTwilio Studioには、同社のサーバーレスプラットホームTwilio Functionsが組み込まれている。StudioでTwilioの既存のAPIのほとんどにGUIでアクセスできるけれども、ドラッグ&ドロップのインタフェイスでは、コードを直接書くことに比べると柔軟性が失われがちだ。しかし機能の呼び出し形式が単純なサーバーレス方式のおかげで、デベロッパーが仕事をした後でも、誰もが容易にアプリケーションに変更を加えることができる*。〔*: サーバーレスでは、アプリケーション側が‘呼び出す’というより、むしろアプリケーションはAPI側がイベント(ここでは主に通信イベント)発生時に呼び出すべき機能を‘指定して’おくだけ。なので、ノンデベロッパープログラミングでも柔軟性が維持される。〕

Twilio Studioの料金は、アプリケーションの利用量がベースだ。やや制限のある無料プランでも、作れるフローの数に制限はないが、プロダクション向けに機能の完備した“Plus”では、月額99ドル+顧客のエンゲージメント一回につき0.5セントだ。今後登場するエンタープライズプランでは、もっと大規模な実装が可能になる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

複数のブロックチェーン間の通信を支えるNucoのAionネットワーク、最終的スタンダードになるか?

ブロックチェーンの普及と並行して、複数のブロックチェーンが互いに通信できる仕組みの必要性が顕在化している。トロントのNucoは、今日(米国時間8/30)リリースしたブロックチェーンネットワークAionで、そんな通信のために必要なネットワーキングインフラストラクチャを提供しようとしている。

NucoのCEO Matthew Spokeによると、個々のブロックチェーンの中での、それにふさわしいレベルの信頼性を築くのは各ネットワークの究極の責任だが、いったん、プライベートなブロックチェーンの外の領域に出るようになると、全体的な信頼性を確保するためのシステムが必要になる。銀行でも、政府機関でも、ヘルスケアのプロバイダーでも、必然的にそういう、外にも行く性質のデータを扱っている。NucoがAionを作ったのは、そのための仕組みを提供するためだ。

彼によると、Aionの中核的機能は、データをあちこち移送するための配管系になることだ。Aionが提供するミドルウェアにより、ブロックチェーンは互いに通信し、メッセージを渡しあうことができる。

Spokeと彼の協同ファウンダーたちはDeloitteのブロックチェーンチームにいたが、昨年Nucoを創ってエンタープライズのためのブロックチェーンインフラストラクチャを作り始めた。が、しかし、彼らは気が付き始めた: 多くの大企業がプライベートなブロックチェーンを構築しているが、それとともに、パブリックなメカニズムのニーズも拡大している。ブロックチェーンというコンセプトがスケールし始め、経済システムの不可欠な部分になっていくに伴い、情報を移送するためのジェネリックな〔nonプロプライエタリな〕方法が必要になる。

このようなシステムの構築と利用に対しては、大きなハードルが二つある。ひとつは、情報を複数のブロックチェーン間でパブリックに移送することを、企業が承知することだ。第二は、情報の移送にはネットワーキングプロトコルのような単一の方法が必要なこと。前者に合意が得られたら、その次は後者が、避けて通れない要件になる。

Aionのトークンを一種のデジタル通貨と見なして課金し、ある種のデータをチェーン間ブリッジにまたがって移送するようにすれば、企業のNucoのネットワークへの参加を収益源にすることもできる〔Aionの利用を課金する〕。それにより、Aionのネットワークをサポートする企業も増えるだろう、とSpokeは説明する。

とは言え、彼によるとAionのようなものは、市場がどうしても必要とするインフラの一部だから、直接的に商用化を目指すべきではない。将来、ブロックチェーンがメインストリームになれば、成熟したインフラストラクチャが必要になり、同社や他社はそれを成功の源泉にすればよい。Spokeによると、同社の現状は、市場の成長を助けるためのコントリビューションが主体だ、という。

この問題に取り組んでいるのはNucoだけではないが、Spokeはこのようなプロセスが必要であることを確信しており、他の技術の場合と同様に、スタンダードになる勝者を決めるのは市場だ、と考えている。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

GoogleのNearby Connections APIを使えば近くのAndroid機同士でオフラインのネットワーキングができる

Googleが今日(米国時間7/31)、互いに近くにいるAndroid機/Androidアプリ同士がオフラインでもコミュニケーションできる、というAPIを一般公開した。Googleが挙げているいろんなユースケースの中には、(1)ホテルの部屋が来客を感知してその人に合った室温や音楽を提供する、(2)近くにいるデバイス同士でアドレス帳を合体する、などがある。

この技術はNearby Connections API(近傍接続API, NCA)と呼ばれ、最初のうちはメディアのオフライン共有や、ネット接続の不安定な地域における災害警報などの用途に使われるようだ。

このNearby Connections APIをGoogleはかなり前から作っていて、APIは2015年に初めて発表された。そのときは、テレビを使ってやってるゲームのセカンドスクリーン(第二画面)としてモバイルデバイスを利用する、というユースケースが紹介された。

そして今年のGoogleのデベロッパーカンファレンスI/Oでは、このAPIのアップデートが紹介された。

(Nearby Connections APIの説明は24:15あたり)

近くのデバイスとの近傍接続には、Wi-FiやBluetooth LE、Classic Bluetoothなどが利用される。そのとき使える電波はアプリ自身が選び、また、新たな電波が使えるようになったら、その検出もできる。デベロッパーがそのためのコードを書く必要はない。

このAPIで構成されるネットワークには、二つのタイプがある。

ひとつは、中央集権型。たとえばゲームのサーバーや先生が生徒と対話するサーバーがこのNCAを使ってクライアント(ゲーマーや児童生徒)と対話する。もうひとつは、メッシュネットワークを構成してオフラインでチャットやそのほかのグループ活動をする使い方だ。

Googleは今日、このAPIを使ったアプリもいくつか発表した。

その中のThe Weather Channelは、キャリアのデータ通信が十分に使えない状況でメッシュネットワークにより台風などの緊急気象情報を伝え合う。Hotstarは、同様の状況(飛行機、地下鉄など)でメディアを共有する。そしてGameInsightは、近くに仲間のプレーヤーを見つけて完全にオフラインでゲームを進める。

このほか、このAPIを使ったAndroid TVのリモコンで、初期のセットアップが楽になる。また、Androidデバイスをそのセカンドスクリーンとしても使える。

これまで一部のパートナーだけに提供されていたこのAPIは、今日から一般公開される。AndroidのバージョンはJelly Bean以上、インストールされているGoogle Playは11.0以上が必要だ。

そのほかのパイロットアプリも近く公開されるが、それらに関してはまだ具体的な情報がない。またGoogle Playの11.0以上という要件は、現状ではかなり客層を狭めるので、このAPIの採用に乗り気でないデベロッパーもいるそうだ。せっかく、近傍接続を生かしたアプリを作っても、まだユーザー数が少ない、と見込んでいるからだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

GIF30年の歴史を振り返る――圧縮フォーマットからコミュニケーションツールへの変遷

【編集部注】執筆者のDavid McIntoshはTenorの共同ファウンダーでCEO.

大きな変化を遂げずに5年以上――ましてや30年も――生き残れるテクノロジーはそう存在しない。過去10年間を振り返ってみても、携帯電話の情報処理能力は20倍近く向上し、マルチタスキングや視覚的なメッセージといった機能が追加された。HTMLの規格は5代目に突入し、ウェブ上の動画ストリーミングに使われるフォーマットはFLVからMP4へと移り変わった。IntelのファウンダーのひとりであるAndy Groveがかつて言ったように、「極度な心配性の人だけが生き残れる」のだ。そして進化しないテクノロジーは、いずれ時代遅れになっていく。

今年の夏で30周年を迎えたGIFは、変化の激しいテクノロジー界で長年生き残る、数少ないファイル形式のひとつだ。誕生時から技術的な変化はないGIFだが、これまでに3つの”人生”を経験し、今では過去にないほどの人気を誇っている。

第一の人生:画像ホスティングテクノロジー

GIFは、BMPをはじめとするファイル形式よりもサイズが小さい可逆圧縮フォーマットとして1987年に誕生し、それからすぐにウェブブラウザーを中心にサポートされていった。1989年にはGIFアニメも誕生したが、当時は単に効率的なファイルフォーマットして、静止画を中心に利用されていた。

 

第二の人生:ライトなエンタメ動画

初期のGIFアニメの多くは、Microsoftのクリップアートのような見た目で、ウェブサイトのナビゲーション要素として使われることもあった。ジオシティーズの登場で何百万人という人が自分のウェブサイトを作れるようになると、彼らは訪問者を楽しませようと、回転するメニューや燃えるビュレット、3DアニメーションなどのGIFアニメを使ってウェブサイトを自分流にアレンジしていった。この傾向はMyspace人気が高まるにつれてさらに加速していく。

Myspaceユーザーが自分のページを飾る”アクセサリー”を見つけるためのウェブサイトも、この頃大量に生まれた。しかし、YouTubeをはじめとする動画サイトの台頭とともにMyspace人気に陰りが見え始めると、GIF人気も落ち込み、そのうちGIFはニッチなネット掲示板でだけ使われるようになっていった。しかし、2009年頃からTumblrのユーザー数が増えるにつれて、GIFは復活を果たす。

Myspace同様、Tumblr上でGIFを使って自己表現を試みる人たちも出始めたが、彼らは点滅する文字の代わりに、お気に入りの映画やテレビ番組、オンライン動画のワンシーンを切り取ったものを共有した。これがBuzzFeedやImgur、GiphyといったGIFホスティングサービスへと繋がっていく。

第三の人生:コミュニケーションツール・ビジュアルランゲージ

モバイルメッセージが急速に普及する中、消費者のアテンションスパンとともに彼らが交わす言葉自体も短くなり、「lol(laughing out loud=爆笑)」や「jk(just kidding=冗談だよ)」といった略語が使われるようになる。こうして、かつては3〜5分かかっていたことも、3〜5秒間で行われることに。

今やGIFは文化的な文脈を使い、たった数秒間で感情をフルに表現できる、視覚的な略語のような存在になった。従来の略語よりも表現力が豊かで、広がりのある言葉だ。

例えば昨年だけでも、40億種類以上もの思いや感情、感覚がTenor(GIFホスティングサイト)の検索欄に入力され、検索ワード数は新たなニュースや文化、ミームの誕生に応じて日を追うごとに増えている。

モバイル界におけるGIFの転換期は、iOS8でカスタムキーボードがサポートされるようになった2014年秋までさかのぼることができる。コミュニケーションツールとしてのGIF第三の人生は、モバイルという史上最大のデジタルプラットフォーム、そしてその活動の中心がコミュニケーションであることを背景に、これまでの人生を大きく上回った。

誕生から30年が経ち、今やGIFはコミュニケーションとは切っても切れない関係性を構築し、モバイル界のビジュアルメッセージの新たなプロトコルへと進化したのだ。これ自体も素晴らしいことだが、GIFの人生はまだこれからだ。将来的には30億人ものモバイルユーザーが、1日に感じる何十種類という感情をGIFを使って表現するようになるだろう。

最後に先月の記念日を祝って、30年間の歴史の中でGIFの方向性を大きく変えた出来事を以下にリストアップした。

1987年:当時CompuServeのソフトウェアエンジニアだったSteve Wilhiteがグラフィックス・インターチェンジ・フォーマット(GIF)を開発
1989年:CompuServeがアニメーションをサポートしたGIFの改良版を発表
1993年:Mosaicブラウザのリリースにより、World Wide Webが一般公開される
1995年:NetscapeがNavigator 2.0にGIFアニメのループ機能を導入
2003年:Myspaceがローンチし、GIFを使ったウェブサイトの装飾が人気に
2007年6月:iPhone第一世代がリリースされ、iMessageをはじめとするメッセージングアプリが黎明期を迎える
2010年8月:新オックスフォード米語辞典第三版に「ギフ」と「ジフ」両方の発音が登録される
2014年10月:iPhone初となるGIFキーボードがローンチ
2015年6月:Facebook MessengerへのGIFボタン導入でトレンドに火がつき、その他の何百種類にもおよぶサービス(Twitter、Kik、WhatsApp、Discord等)にもGIFメッセージ機能が搭載される
2017年6月:世界中のモバイルユーザーがGIFの30周年を祝福

原文へ

(翻訳:Atsushi Yukutake

人の動きを撮るだけでなく動きの意味(ボディーランゲージ)を理解するCMUの巨大ドーム型スキャナー

Panoptic Studioは、カーネギーメロン大学(CMU)の研究者たちが作ったボディースキャナーで、現実の状況の中でボディーランゲージを理解するために利用する。このスキャナーは、映画「バック・トゥ・ザ・フューチャー」の中でブラウン博士がマーティに、仲間殺しを防ぐために取り付ける物に似ていて、大きなドームの中で対話したり、お話したり、争ったりしている参加者を撮った何百ものビデオを作る。チームは、体の位置をプログラマーが理解するためのコードまでリリースした

このドームにはVGAカメラが480台、HDカメラが31台、Kinectのセンサーが10ある。それらは、ドームの中の参加者のワイヤフレームモデルを作る。なぜ? 彼らが考えていることを、コンピューターに教えるためだ。

准教授のYaser Sheikhはこう言う: “私たちは、声と同じぐらい、体の動きでコミュニケーションしている。いずれにしても、コンピューターはそのことを知らないけどね”。

下のビデオでは、あるグループが何かについて言い争っているところをスキャンした。コンピューターは手や頭のさまざまな位置と、言葉のコミュニケーションがあればそれも見て、二人が怒っているか、ハッピーであるか、議論しているのか、などを理解し始める。コンピューターに、何かを指さすなどのジェスチャーも理解させると、システムは話の対象…何について話をしているのか…も理解するようになる。

そうやってコンピューターがボディーランゲージを理解するようになると、自閉症や言語障害の人たちのしぐさを、リアルタイムで解読できるようになる。またこのシステムを団体戦のスポーツで使うと、各選手の気持ちや意思などを、彼らがいつどこにいたかも含めて、理解できるようになる。

プレスリリースより:

複数の人間をリアルタイムで追跡することには、とくにお互いがコンタクトしているようなソーシャルな状況では難問がいくつかある。単純に個人の姿勢を追うようなプログラムは、各個人がグループ内にいる状況では使えない。グループが大きいときには、とくにそうだ。Sheikhと彼の同僚たちは、ボトムアップのアプローチを採った。ひとつのシーンの中のすべてのボディーパーツをまずローカライズし(腕、足、顔、などなど)、次にそれらのパーツを特定の個人に結びつけるのだ。

 

このPanopticonはまだ、Super Bowlや、あなたのお近くのDenny’s(デニーズ)で使えるほど完成してはいないが、人びとの四肢やアクションの、さまざまな点雲に基づいて、彼らが今何をしているのかを当てることはできる。今あなたが、だれかをはたいたことも分かるのだ。

“この装置では、1回の撮影で各人の手の500のビューが得られる。また手の位置を自動的に注記する”、と研究者のHanbyul Jooは語る。“手はとても小さなオブジェクトだから注記は難しい。だから今はHDカメラを31しか使ってないが、しかしそれだけでも、大量のデータ集合が作られるのだ”。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))