自動車、通信業界などが大きな関心を寄せるエッジAIの効率を高めるLatent AIの技術

SRI International(SRIインターナショナル)からスピンアウトしたスタートアップのLatent AI(レイテントAI)は、必要に応じてワークロードを動的に管理することで、エッジ(システム末端)でのAIワークロードの実行を容易にする。

Latent AIは、独自の圧縮技術およびコンパイルプロセスを使用して、ライブラリファイルを10分の1に圧縮し、他のシステムに比べて5分の1の待ち時間(レイテンシ)で実行させることが可能だという。同社は米国時間9月15日開催のTechCrunch Disrupt Battlefieldコンテストに出場しお披露目する。

CEOのJags Kandasamy(ジャグス・カンダサミー)氏とCTOのSek Chai(セク・チャイ)氏が設立した同社は、Future VenturesのSteve Jurvetson(スティーブ・ジャーベットソン)氏が率いてAutotech Venturesも参加した以前のシードラウンドで、すでに650万ドル(約6億9000万円)を調達している。

カンダサミー氏は、Latent AIを起業する前に、起業していたスタートアップのOtoSenseをAnalog Devicesに売却している(その前にはHPE Mid-Market Securityビジネスのマネージャーを務めていた)。OtoSenseは、音ならびに振動センサーからのデータを使って、保守ユースケースの予測を行うものだった。売却前には、デルタ航空やエアバスなどと提携していた。

画像クレジット:Latent AI

Latent AIはこの仕事の内容の一部を利用しており、それをSRI Internationalの特許と組み合わせている。

「OtoSenseでも、すでにある程度のエッジワークを行っていました」とカンダサミー氏はいう。「そのときは、音声認識部分をクラウドの外へと移動させていたのです。学習はクラウドで行いましたが、認識はエッジデバイスで行われていたため、学習結果をすばやく変換してダウンロードする必要がありました。最初の数カ月はそのように行っていましたが、データが長すぎるためLTEまたは3Gでストリーミングすることはできませんでした」。

一方、チャイ氏はSRIで飛行物体の電力を最適に管理する方法を研究するプロジェクトに取り組んでいた。そのシステムは1つの電力供給源から、飛行そのものに電力を供給するか、搭載コンピューティングワークロードを実行するかのリソース配分をインテリジェントに割り当てることが可能で、監視を行いながら必要に応じてそれらを切り替える。ほとんどの場合、監視のユースケースでは何も起こらない。そしてそれが事実であるために、観察されるすべてのフレームを計算する必要はない。

「私たちはそうしたやり方を採用し、ツールとプラットフォームとしてまとめて、音声からビジョン、断片的なもの、時系列なものまで、あらゆる種類のユースケースに適用できるようにしました」とカンダサミー氏は説明する。

ここで注目すべき重要なことは、同社がLatent AI Efficient Inference Platform(Latent AI推論プラットフォーム、LEIP)と呼ぶさまざまなコンポーネントを、スタンドアロンモジュールまたは完全に統合されたシステムとして提供していることだ。圧縮機能とコンパイラーはこうしたものの最初の2つであり、同社が今回発表するのはLEIP Adaptと呼ばれる。これは、カンダサミー氏が先に述べたような動的AIワークロードを管理するシステムの一部である。

画像クレジット:Latent AI

LEIP Adaptの実用的なユースケースは、例えばバッテリー式のスマートドアベルが、何かが発生するのを待ちながら、低電力モードで長時間動作できるようにする場合だ。そして、誰かがドアの前にやってくると、カメラが起動して画像認識のためのより大きなモデルを実行する(おそらく電源に接続されているドアベルのベースステーション上でも実行されるだろう)。そして、もし複数の人間が一度に到着した場合には(現在はそうなっていないが、おそらく来年、パンデミックが落ち着いたころには)、システムは必要に応じてワークロードをクラウドに委託することができる。

カンダサミー氏は、このテクノロジーへの関心は「非常に大きい」と語っている。彼の以前の経験とSRI Internationalのネットワークを考えれば、Latent AIが自動車業界の大きな関心を集めているのは当然のことだが、カンダサミー氏はまた、同社がカメラや補聴器メーカーなどの消費者企業と協力していることも指摘した。

さらに同社は、AI協調プラットフォームの一部としてLatent AIを検討している大手通信会社と協業しており、とあるCDNプロバイダーがJavaScriptバックエンド上でAIワークロードを実行することに協力している。

関連記事:The sound of impending failure(未訳記事)

カテゴリー:人工知能・AI

タグ:Latent AI SRI International Disrupt 2020

原文へ

(翻訳:sako)

子どもの言うことを理解できない音声アシスタント、授業での使用は困難

著者紹介:Patricia Scanlon(パトリシア・スキャンロン)博士:SoapBox Labs(ソープボックス・ラボ)の創業者兼CEO。ダブリンに本拠を置く同社で、安全かつセキュアな子ども向けの音声認識テクノロジーを開発している。2018年、 Forbes Top 50 Women(フォーブス・女性トップ50)の1人に挙げられた。

ーーー

パンデミック発生前、新規のインターネットユーザーの40%以上は子どもたちだった。現在推定で子どもたちのスクリーンタイム(画面を見ている時間)は60%以上長くなっており、12歳以下の子どもについては、1日あたりのスクリーンタイムが5時間を超えている。(これにはメリットもあるが同時に危険性も伴う)。

デジタル・ネイティブたちの技術的な能力には本当に驚かされるが、幼い「リモート学習者たち」の多くは、Edtech(エドテック:教育とテクノロジーを融合させた造語)で必要なキーボード、メニュー、インターフェイスなどの操作に苦戦しており、教育者(と親たち)が頭を悩ませている。

そうした中、音声対応のデジタルアシスタントの登場によって、子どもたちとテクノロジーとのよりスムーズな対話の実現に期待が持てるようになったかに思える。確かに子どもたちはAlexa(アレクサ)やSiri(シリ)に、ビートボックスをやらせたり、ジョークを言わせたり、動物の鳴き真似をさせるのは大好きだ。だが、親や教師たちも認識しているとおり、こうしたデジタルアシスタントシステムは予測可能な範囲内でしか要求を理解できず、子どもたちの要求がそれを逸脱すると、お手上げとなってしまう。

このような問題が起こるのは、アレクサやシリ、Google(グーグル)などの人気の音声アシスタントを動かしている音声認識ソフトウェアが、子どもたちの利用を全く想定していないからである。子どもたちの声、言語、そして行動は、大人たちよりもはるかに複雑だ。

子どもの声は甲高いというだけではない。子どもの声道は細くて短く、声帯は小さく、喉頭も十分に発達していない。そのため、中学生以上の子どもや大人とは音声パターンが大きく異なっている。

下のグラフからすぐに分かるように、音声認識のトレーニングに使用する大人の声のピッチを単純に変更しただけでは、子どもの音声を理解するために必要な複雑な情報を再現することはできない。子どもたちの間でも言語構造とパターンには大きなばらつきがある。構文、発音、文法は年齢とともに飛躍的に進歩するため、音声認識システムの自然言語処理コンポーネントはその点を考慮に入れる必要がある。この複雑さに追い打ちをかけるのが、大人の音声では考慮する必要のない、さまざまな発達段階にある子どもたちに見られる話者間のばらつきである。

音声認識のトレーニングに使用する大人の声のピッチを変更しただけでは、子どもの音声を理解するために必要な複雑な情報を再現することはできない。画像クレジット:ソープボックス・ラボ

 

 

 

 

 

 

 

 

 

 

 

 

 

子どもの言語行動は大人より変化しやすいだけではなく、不規則で一貫性がない。単語を過度に明瞭に発音したり、特定の音節を伸ばしたり、独り言を言うときに単語に区切りを入れたり、単語を丸ごと省略したりする。子どもの音声パターンは、大人のユーザー向けに構築されたシステムが理解できる一般的なイントネーションには従わない。大人はこうした音声認識デバイスとの対話のしかた、つまり最善の答えを引き出す方法を経験から知っている。しゃんと背筋を伸ばして、頭の中で考えた要求を学習した行動に基づいて修正し、大きく息を吸い声に出して「アレクサ、何とか何とか」という具合に要求を言う。しかし、子どもは、まるで人間に話しかけるように、単純に思いついたままにアレクサやシリに話しかける。返ってくるのは大抵、間違った答えかお決まりの答えだ。

こうした問題は、教育の場ではさらに深刻になる。音声認識システムは、周辺の雑音や教室内の予測不能の出来事に対応するだけでなく、年間を通して変化する子どもたちの話し方や、一般的な小学校で見られるアクセントや方言の違いも考慮する必要がある。体、言語、そして行動による子どもと大人の違いは、子どもが幼いほど著しく大きくなる。つまり、音声認識から最も大きなメリットを受けるべき幼い学習者に対応するのが、開発者にとって最も難しいということなのだ。

子どもたちのさまざまな特異な言語行動を考慮し理解するには、意図的に子どもたちの話し方から学習するよう構築された音声認識システムが必要だ。子どもたちの話し方を、単純に、音声認識で対応すべきアクセントや方言の1つと見なすことはできない。アクセントや方言とは根本的かつ実質的に異なる問題だ。しかもこの特徴は、子どもたちが肉体的かつ言語能力的に成長するにしたがって変化する。

大半の消費者とは異なり、子どもたちにとって正確さは深い意味を持つ。子どもは、正しいのに間違っているとシステムから告げられると(偽陰性反応)、自信を喪失する。逆に、間違っているのに正しいと告げられると(偽陽性反応)、社会情緒的(かつ心理測定的)に害をもたらす危険性がある。アプリ、ゲーム、ロボット、スマートトイといったエンターテイメントの場では、偽陰性または偽陽性の反応が返ってくるとストレスがたまる。学校では、間違った反応や誤解を招く反応、あるいはお決まりの反応が返ってくると、教育的に、あるいは公平さという点で、極めて重大な影響がある。

例えば、音声認識にバイアス(偏見)が存在するという事実についてはさまざまな人が書いているが、こうしたバイアスは子どもたちに有害な影響を及ぼす可能性がある。人口統計的に特定の層に属する、あるいは特定の社会経済的背景を持つ子どもたちに不利にはたらく(偽陽性反応や偽陰性反応を返すような)正確性の低い製品を使うわけにはいかない。数々の調査により、音声が子どもたちにとって非常に効果的なインターフェイスになり得ることが分かってきているが、その音声によって学校特有の既存の偏見や不平等が増幅される危険を見過ごしたり無視することはできない。

音声認識は、家庭でも教室でも子どもたちの強力なツールになる可能性を秘めている。読み書きの能力や言語学習の段階に応じて子どもたちをサポートする際、重大な隔たりを音声認識ツールによって埋めることで、子どもたちは周囲の世界をより良く理解するようになり、周囲の世界からより良く理解されるようになる。これにより、リモートの設定においても確実に機能する、「目に見えない」観察的評価基準の確立という新しい時代を切り開くことができる。しかし、今日の大半の音声認識ツールはこの目標には適していない。シリ、アレクサ、その他の音声アシスタントで採用されているテクノロジーの任務は、明快かつ予測可能な話し方をする大人を理解することであり、基本的にはその役割をうまく果たしている。しかし、子どもたちの音声にも対応できる音声認識システムを実現するには、子どもたちの特殊な声、言語、そして行動に合わせてモデル化された、彼らに反応できるシステムが必要なのである。

関連記事:マイクロソフトやアマゾンが音声認識チップの新興メーカーSyntiantに出資

カテゴリー:人工知能・AI

タグ:音声認識 スマートスピーカー コラム

[原文へ]

(翻訳:Dragonfly)

時代遅れの採用選考プロセスを嫌うデータサイエンティスト、コロナ禍の影響も?

著者紹介:Tianhui Michael Li(ティエンフイ・マイケル・リー)氏は、学術界から産業界への博士やポスドクの移行を支援する8週間のフェローシップで知られる、The Data Incubator(データ・インキュベーター)の創設者である。それ以前はFoursquare(フォースクエア)でマネタイゼーション・データサイエンスの責任者を務め、Google(グーグル)やAndreessen Horowitz(アンドレセン・ホロウィッツ)、J.P.Morgan(ジェイ・ピー・モルガン)、D.E.Shaw(ディー・イー・ショー)における勤務経験も有する。

ーーー

2020年は世界が大きく変わった年である。その変化は、企業のデータサイエンス職の採用選考方法にも現れている。さまざまなことが変わったが、その中でも目立って大きく変わったことが1つある。筆者が創設したデータ・インキュベーターは、データサイエンスフェローシップを実施しており、毎年数百人のデータサイエンス職採用者を送り出している。我々が調査したところ、こうした採用者は今では珍しくなった時代遅れの採用選考プロセスを嫌い、全体の80%を占める標準的な採用プロセスを実施している企業を選択していることが明らかになった。大企業(つまりは最も変化に慎重な企業)ほど、こうした時代遅れのやり方に固執する傾向がある。現在こうした大企業は、データサイエンティストの獲得競争においてかなり不利な立場に置かれている。

振り返ると、データサイエンス関連職の採用活動はソフトウェアエンジニアリングから発展してきた。ソフトウェアエンジニアリングの面接といえば、かなり手強いパズルのような難問が特徴だ。例えば、「ボーイング747の機体にはゴルフボールが何個入るか?」とか「ホワイトボード上でクイックソートのアルゴリズムを実行せよ」といった類の問題だ。応募者は数週間、数か月をかけてこうした問題を解く勉強をする。求人関連ウェブサイトのGlassdoorは、そうした問題の対策用に1つのセクションをまるごと割いている。データサイエンス職の採用選考では、従来のコーディングの難問を補足する形で、例えば、「2個のサイコロを振ったときに出た目の合計が3で割り切れる確率は?」といった統計問題も出題されてきた。しかし企業は長い年月をかけて、こうした難問はあまり効果的でないと認識するようになり、出題を控えるようになっている。

その代わりに、プロジェクトベースのデータ評価を採用選考に取り入れる方法に注目している。これは、データサイエンス職の応募者に、企業が提供した実世界のデータを分析させるものだ。こうしたプロジェクトベースの評価は、1つの正解が存在するわけではなく、たいてい自由形式で回答し、説明することが求められる。面接を受ける人は通常、コードと評価結果を提出する。このやり方には形式と内容の両面において、多くの利点がある。

第1に、データ評価の対象となる環境の方がはるかに現実的だ。パズル形式の難問では、応募者が無意味に問題に苦しんだり、ホワイトボード上でぎこちなくコードを書いたりすることになる。また、こうしたパズル形式の問題はグーグル検索ですぐに正解がわかるため、インターネットの使用は禁止される。実際の仕事で、ホワイトボード上にコードを書いたり、誰かが肩越しに覗いている状態で暗算を実行したりするといったことはあり得ない。業務中にインターネットアクセスを禁止されるなど理解しがたい。データ評価では、応募者が使い慣れたIDEまたはコーディング環境を使って、より現実的なペースで評価作業を実行できる。

「自宅で行う課題なら、実際の仕事における応募者のパフォーマンスをパズル形式の面接問題よりも現実的にシミュレートできる」と、エンジニアリングマネージャーで「How Smart Machines Think(スマートマシンはこうして思考する)」の著者でもあるSean Gerrish(ショーン・ジェリッシュ)氏はいう。

第2に、データ評価は内容もより現実的だ。パズル形式の難問は一筋縄では解けないように、あるいはよく知られたアルゴリズムの知識をテストするために意図的に考えられたものだ。実世界では、こうしたアルゴリズムを手で書くことは絶対にないし(通常はインターネット上で入手可能な無償のソリューションを使う)、仕事で遭遇する問題にパズルのようなトリッキーなものは滅多にない。データプロジェクトでは、応募者に実際に扱う可能性のあるデータを与え、評価結果の社内における共有方法と同様に成果物を構造化するため、実際のジョブスキルに近い能力をテストできる。

業界経験が長く「Data Teams(データチーム)」の著者でもあるJesse Anderson(ジェシー・アンダーソン)氏は、データ評価による選考を強く推奨している。同氏は次のように指摘する。「これは、応募者と企業の双方に有益な方法だ。面接を受ける側は、実際の仕事に近い作業を体験できる。マネージャーは、志願者の作業と能力を、実際の仕事に即して詳しく判定できる」。プロジェクトベースの評価には、書面によるコミュニケーション力を評価できるという利点もある。これは新型コロナウイルスでリモートワークが増えた今、ますます重要なスキルとなっている。

最後に、書面による技術プロジェクトワークは、従来の雇用プロセスに存在する先入観の多い側面を和らげることで、偏見を排除するのに役立つ。同じ履歴書を提出しても、ヒスパニック系やアフリカ系の米国人は白人に比べて面接の連絡をもらえることが少ない。これに対応するため、人種的マイノリティーの応募者は自身の履歴書を故意に「白人化(履歴書で白人を装うこと)」している。対面式の面接も、こうした問題のある直感に基づいて行われることが多い。仕事のパフォーマンスにより近い評価を重視することで、面接担当者は、偏見のある「直感」に頼るのではなく、実際の資質や能力の判定に集中できる。#BLMや#MeTooに単なるハッシュタグ以上の意味を感じている企業は、自社の採用プロセスをどのように微調整すればより広範な平等を実現できるのかを検討しているようだ。

データ評価の詳細な形式はさまざまだ。データ・インキュベーターで行った調査によると、60%を超える会社が自宅に持ち帰って行うデータ評価を課題として与えていることが判明した。こうしたデータ評価は実際の仕事の環境をシミュレートするには一番の方法だ。応募者は、通常数日間に及ぶリモートワークを体験できるからだ。また、約20%の会社が、応募者が面接プロセスの一部としてデータ分析を行う面接データプロジェクトが必要だと答えている。こうした面接時に行うデータプロジェクトでは、応募者が制限時間というプレッシャーを受けるものの、終わるまでデータ評価作業に延々と取り組むプレッシャーから解放される。「課題を自宅に持ち帰って取り組むには多くの時間が必要だ」と経験豊富なデータサイエンティストで「The Data Science Handbook(データサイエンス・ハンドブック)」の著者でもあるField Cady(フィールド・キャディ)氏は説明する。「これは応募者にとってかなり負担のかかる作業である。また、家庭での責任があるため、夜の時間の多くを課題に費やすことができない応募者には不公平となる可能性がある」。

企業側が自社で作成したデータプロジェクトを課題として出さずに済むように、賢明な応募者は、自身のスキルを見せるために事前にポートフォリオプロジェクトを構築している。企業側も自社のカスタムプロジェクトの代わりに、応募者が事前に用意したプロジェクトを課題として受け入れるところが増えている。

古いパズル形式の難問を面接時に使用する企業はなくなりつつある。こうした古いやり方に固執している20%の企業の大半は、通常変化に適応するのが遅い有名大企業だ。こうした大企業は、時代遅れの採用プロセスは単に古くさいだけでなく、応募者を遠ざけることになることを認識する必要がある。最近のオンライン会議で、出席したパネリストの1人にデータサイエンス関連職として新規採用された人がいたが、彼はその会社の選考過程があまりにお粗末だったため入社を断ったと話してくれた。

採用プロセスが時代遅れになっている組織が果たして強いチームを形成できるのだろうか。データ・インキュベーターのデータサイエンスフェローシップを終えようとしている博士号取得者の多くがこのような気持ちを抱いている。新しい現実を受け入れることができない企業は、最高の人材を獲得するための競争に敗れている。

関連記事:自動化によりデータサイエンスは不要になるだろうか?

カテゴリー:人工知能・AI

タグ:データサイエンス コラム

原文へ

(翻訳:Dragonfly)

AIヘッドハンティング「LAPRAS SCOUT」のLAPRASが3.5億円を調達、ビジネス体制と新規開発リソース強化

AIヘッドハンティング「LAPRAS SCOUT」展開のLAPRASが3.5億円を調達、既存ビジネス体制と新規開発リソース強化

登録不要のエンジニア向けAIヘッドハンティングサービス「LAPRAS SCOUT」を展開するLAPRASは9月14日、第三者割当増資による3.5億円の資金調達を実施したと発表した。引受先はウィルグループ HRTech2号投資事業有限責任組合。

調達資金は、個人向けのスキル可視化・ポートフォリオサービスの「LAPRAS」、企業向けのエンジニア・ヘッドハンティングサービス「LAPRS SCOUT」のプロダクト開発を強化するための人材投資、また順調に成長するプロダクトのプロモーション、転職エージェントが行っていたキャリアマッチングをウェブ上で自動化するシステム「Matching Intelligence」(β版)をはじめ、新規開発リソースに活用する予定。

既存ビジネスの体制強化とともに、新規プロダクトも同時に進めるため、大きなリソース拡充に資金を投下するとしている。

LAPRASは、「あらゆる選択肢から、その人が最も幸せになれる選択肢をマッチングするシステムを創る」というミッションのもと、LAPRAS、LAPRAS SCOUT、フリーランス・副業エンジニア採用サービスの「LAPRAS Freelance」を運営。LAPRASは、2019年4月公開から1年余りで登録者数1万人となり、LAPRAS SCOUTも累計導入社数250社超となっているという。

関連記事
ウェブ上のすべての求人から個々人に合うキャリアを提案、LAPRASが今夏に新サービスローンチへ
「目指すのは人間版のGoogle」AIヘッドハントのscoutyがLAPRASに社名変更、個人ページの本人公開も開始

法務向けAI搭載オンラインエディター「LAWGUE」の日本法務システム研究所が3億円を調達

法務向けAI搭載オンラインエディター「LAWGUE」の日本法務システム研究所が3億円を調達

契約書など法務・コンプライアンス領域向けAI搭載オンラインエディター「LAWGUE」(ローグ)開発・提供の日本法務システム研究所は9月14日、第三者割当増資および融資として、約3億円の資金調達を実施したと発表した。引受先は新日本法規出版、第一法規、鈴与、AI inside、UB Venturesが運用するファンド。融資については、三菱UFJ銀行からのプロパー融資となっている。

調達した資金は、業務提携関係にある各事業会社との取り組みの加速、また製品開発、営業、サポート体制の強化に利用する。

法務向けAI搭載オンラインエディター「LAWGUE」の日本法務システム研究所が3億円を調達

日本法務システム研究所のLAWGUEは、過去文書を資産化し、条項単位で検索・再利用できるAI搭載のオンラインエディター。組織内のナレッジ共有を実現するとともに、契約書や規程類などの構造化文書作成に携わるビジネスパーソンを、ひな形や過去文書の検索、Wordファイルの履歴参照、ファイル添付メールの往復といった非効率業務から解放する。リーガルテックの枠を越え、現在は知財分野やIR分野など、多くの領域で活用が進んでいるという。

関連記事
AIによる契約レビューで取引を加速させるThoughtRiverが10.6億円を調達
リモート口述用のビデオ会議サービスなどで法律事務所の業務をサポートするStenoが3.5億円調達
LegalForceがクラウド契約書管理システム「Marshall」のオープンベータテスト開始

アマゾンがAlexa Printを米国でローンチ、レシピやゲーム、教材を声で印刷できる

Alexaはプリンターも操作できるようになった。Amazon(アマゾン)は米国時間9月10日、Alexa(アレクサ)で印刷できる新しい機能を発表(Printing with Alexaページ)した。Echo(エコー)端末を持っている人なら、AlexaのTo Doリスト、レシピ、週ごとのカレンダー、子ども向け教材、さらには数独やクロスワードパズル、迷路などのゲームも音声コマンドで印刷できるようになる。

この機能は、第2世代以降のEcho端末と、HP、ブラザー、キヤノン、エプソンなどから発売されているIPP対応プリンターで利用できる。手持ちのプリンターが対応しているか不明な場合は「Alexa, discover my printer」(私のプリンターを探して)と口頭で質問すると確認できる。対応プリンターは追々増やしていくと同社では話している。

一部の印刷コンテンツは、Alexa自身からも提供される。例えば、今でも紙のメモの愛用者が多いTo Doリストや買い物リストなどだ。

だが現在、Alexaが印刷できるコンテンツの大半はサードパーティーによるものとなる。同社は、Alexaのスキルメーカー、Allrecipes(オールレシピズ)、Los Angeles Times(ロサンゼルス・タイムズ)、JumpStart Academy(ジャンプスタート・アカデミー)と協力して、学習用プリント、パズル、塗り絵、レシピなどが印刷できるようにしている。

つまり、「Alexa、クロスワードパズルを印刷して」とか「Alexa、1年生の足し算の問題集を印刷して」とか「Alexa、チキンのレシピを印刷して」などと命令できるわけだ。コマンドの全リストはこちら

この音声コマンドには、他のコマンドよりも便利なものがある。「先週の日曜日のクロスワード」を印刷した後に、「先週の日曜日のクロスワードの正解」も印刷させることができるので、新聞の購読を止めてしまったがクロスワードだけは楽しみにしていたという人には嬉しい。ただし、Alexaに「サーモンのレシピを印刷して」などと命令しては、何が現れるかわからない。普通は特定のレシピを知りたいのであって、レシピの提案一覧で紙とインクを無駄にしたいとは思わないだろう。

学校に通う子どもたちにも有り難いコマンドがある。Alexaは、グラフ用紙や罫線入りの用紙を印刷できる。1枚使うためだけに、またはちょっと足りなくなったときなどに、ノートをまるごと1冊買う必要がなくなる。ホームスクールの教師や両親にも、リモート学習の補助教材として算数の問題集を印刷できるなど、役に立つ。

Alexa Print機能は声で有効にできるが、Alexaアプリで「Add Devices」(デバイスを追加)を開き、「Printer」(プリンター)を選択して有効にできる。

プリンターに接続されると、Alexaはプリンターのインクやトナーの量の情報を受信できるようになるため、少なくなったときにメールや声で知らせてくれる。この通知はデフォルトで有効になっているが、Alexaアプリのデバイスの設定ページにある「Status」(ステータス)で変更できる。

また、スマート・リオーダーを設定しておけば、インクやトナーをアマゾンから1割引で自動購入ができる。インクやトナーが少なくなると自動的に商品が送られてくるわけだが、最初にAlexaアプリでそのように設定しておく必要がある。

つまり、Alexa Printは、単にEchoオーナーの印刷を楽にするだけのものではない。新型コロナウイルスの流行が続く中、自宅勤務やリモート学習の広がりを利用した新たなeコマースの売上げを創出する手段ともなっている。

画像クレジット:Amazon

[原文へ]

(翻訳:金井哲夫)

データアクセス権とアルゴリズムによる業務管理を巡り配車サービス運転手がOlaを提訴

2人の配車サービス運転手が、インドに本社を置く配車サービスOla(オラ)による、アルゴリズムを使ったギグワーカーの業務管理を巡り、オランダの裁判所に訴えを起こした。この手の訴訟はこれが2つめとなる。

App Drivers & Couriers Union(アプリ運転手および配送業者組合、ADCU)などが支援する今回のケースは、7月にはやりオランダの法廷で起こされたUber(ウーバー)を相手取った運転手による訴訟とよく似ている。

どちらのケースでも、運転手たちは、集団交渉の材料とするべく自分たちの個人データを組合のデータ信託に送るよう要求している。彼らによると、企業側は要求したデータを部分的にしか提供していないという。たとえばUberは、それ以上の情報を渡したくてもEUのプライバシー法によって制限されているとの根拠を持ち出した。

どちらの側も、ヨーロッパの一般データ保護規則(GDPR)に守られたデータアクセス権を掲げて主張している。そのひとつに、業務が完全に自動化された結果として重大な法的または同等の影響を被った個人の保護がある。

Olaの訴訟では、運転手はGDPRに基づき自身の情報の提示を求めたのに対して、一部しか応じられていないとADCUは主張している。例えば、日付入りのGPSのデータなどは提供されていない。

また別の苦情として、Olaがブロックしていると彼らが主張する走行距離レベルあたりの評価データが提示されていないこともある。

運転手たちは、提示されたデータには「膨大な欠落」があるため、運転手の業績をまともに分析できないと訴えている。

さらに、Olaのデータ保護ポリシーは、厳格な運転手の監視と業績管理を行う一方で、運転手を個人事業主と見なし、基本的な労働者の権利の否定を示唆しているとも申し立てている。

「Olaは、労働者の監視と管理をどの程度行っているかを示す詳細情報を出ししぶっています。たとえば、運転手の不正行為の可能性評価です。業績が配車の判断に影響することを認めてほしいのです」と、ADCUの広報担当者はTechCrunchに話した。

ヨーロッパのギグ・プラットフォームは、同地で拡大していく過程で、労働者の分類に関連する数多くの訴訟に直面してきた。この2の最新のケースでは、労働者の管理の度合いを示す手段として、プラットフォームのアルゴリズムによる管理を原告がどう持ち出してくるかに興味が持たれる。

今回の訴訟に関する広報資料で、ADCUはOlaが今年の初めにロンドンで「守護者」として紹介され、人工知能と機械学習を用いて「数百万のデータポイントをリアルタイムで分析し、不規則な移動行動を検知する」という同社の話を指摘している。Olaは「不正可能性評価を計算していることを公表しているにも関わらず、そうしたリスク・プロファイリングで処理された運転手の個人データに関して、一切の情報を提示していない」と述べている。

原告は、そのようなシステムには透明性が欠かせないと主張する。それが運転手の収入に大きく影響するからだ。事例報告を行った運転手の一人は、Olaのアルゴリスムにより走行距離が「不当」(これは正しくないと本人は言うが)と判断された後に給与が減額になったと話している。

この運転手が抗議すると、Olaは処理は自動的に行われていて人は介在していないと主張し、減額は正当であり取り消すことはできないと彼に伝えた。

しかしGDPR第22条は、EUのデータ主体に、重大な法的または同様の影響を及ぼす自動判断に異議を訴える権利を認めている。これには、判断の人による審査の権利も含まれる。そのためこの訴訟は、規制による法的保護がどこまで及ぶかを見極めるという、もうひとつの興味をもたらした。

この訴訟についてADCU委員長Yaseen Aslam(ヤシーン・アズラム)氏は、声明の中でこう述べている。「Olaは、運転手たちの高給、勤務中の保護と尊厳ある扱いのために、善意でテクノロジーを使うのは構わない。ところがOlaは、そのプラットフォームの力を支配できる優位な地位を利用して労働者を搾取し、彼らを貧困に追い込んでいる。今こそ運転手たちは実権を取り戻し、集団の力を高めるときだ。その第一歩が、自分自身の勤務データへのアクセス要求である」。

私たちは、この訴訟に関してOlaに意見を求めている。

原告は、アムステルダムの地方裁判所からOlaに対して、EUデータ保護規則に即刻準拠するよう命令し、それを行わなかった期間、1日につき2000ユーロ(約25万円)の罰金を課するよう求める予定だと話している。

オランダでこの行動を起こした理由は、プラットフォームと運転手のデータを管理しているのがアムステルダムの企業Ola Netherlands BV(非公開株式会社オラ・ネーデルランド)だからだと彼らは話している。

画像クレジット:Hemant Mishra/Mint / Getty Images (Image has been modified)

[原文へ]

(翻訳:金井哲夫)

ポートランド市の顔認識技術禁止条例は民間企業も対象になる

米国時間9月9日、オレゴン州ポートランドの市議会は顔認識技術に対する禁止法案を可決した。地方自治体の禁止令としては、これまでで最も強力だと広く知られているものだ。

ポートランドは2つの法令により、市の各部局がこの異論の多い技術を使うことを禁じ(ポートランド市リリース)、また民間企業が公共の場でそれを利用することを禁ずる(ポートランド市リリース)。オークランド(Daily Beast記事)と、サンフランシスコ(Vox記事)、ボストン(Boston Globe Media 記事)も、行政府が顔認識技術を利用することを禁じているが、しかしポートランドの、公共の場での企業の利用に対する禁令は新しい視点だ。

民間に対して使用を禁じているその条例案は、顔認識システムに黒人や女性、高齢者などへの偏見が織り込まれているリスクに言及している。これらのシステムにおける偏見のエビデンスは、研究者が広範に観察しており(MITプレスリリース)、連邦政府ですら昨年発表された調査(米国立標準技術研究所資料)で認めている。これらのシステムにある既知の欠陥は、法執行機関による利用などで深刻な結果を招く偽陽性に導くこともありえる。

市議会の委員であるJo Ann Hardesty(ジョ・アン,ハーデスティ)氏は、ハイテクの法執行ツールに対する懸念を、3カ月以上前からポートランドで起きている抗議活動に結びつけている(Facebook投稿)。米国保安局は先月、小型の航空機使ってポートランドのダウンタウンにある抗議活動の中心地である、マルトノマ郡ジャスティスセンターの近くで群衆を監視した(Willamette Week記事)ことを認めた。

ハーデスディ氏によると、地方の法執行機関が顔認識技術を使うことを禁ずる決定は、ポートランドの現状においては「特別に重要」とのこと。

同氏は「自分の顔のようなプライベートなものが、写真に撮られ、保存され、利益のためにサードパーティに売られることは、誰においてもあるべきではありません。また、テクノロジーのアルゴリズムが罪のない人を誤認したために、刑事司法システムの中へ不正に押し込められるようなことは、誰においてもあるべきではありません」と語る。

ACLU(米市民的自由連合)も9月9日の票決を、デジタルプライバシーの歴史的な勝利として祝った。

ACLUのオレゴン州暫定取締役のJann Carson(ジャン・カーソン)氏は「本日の票決で、当市では真の権力を持つ者が私たちであることを、コミュニティが明らかにしました。私たちはポートランドを、警察や企業などが私たちを行く先々で追跡する監視国家には絶対にしません」とコメントした。

顔認識技術の使用を公共と民間の両方に対して禁ずるポートランドの二重の禁令は、同様のデジタルプライバシー行政を模索しているそのほかの都市にとって指標になり、プライバシーの擁護者が望んでいた結果が実現するかもしれない。

Fight for the FutureのLia Holland(リア・ホランド)氏は「今や全国の都市がポートランドに見習って自分たちの禁令を通すべきです。今の私たちには勢いがあり、この危険で差別的な技術を撃退する意志があります」とコメントした。

関連記事:物議を醸したClearview AIが再び米政府機関と顔認識ソフトウェアで契約

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

AT&Tの電話回線利用者はAlexaで通話が可能に

Amazon(アマゾン)は、米国時間9月9日、AT&Tと提携し、AT&Tの電話回線利用者がAmazon EchoスマートスピーカーなどのAlexa(アレクサ)対応デバイスを通じて電話の発信と受信ができるようにする新機能を発表した。これが可能になると、Alexa対応デバイスを持つ利用者は、音声アシスタントのAlexaに電話をかけるよう、またはかかってきた電話に出るよう声で命じることができるようになる。電話機が手の届かないところにあっても、携帯電話のバッテリーが切れていても電話ができる。

「AT&T calling with Alexa」(AlexaでAT&T通話)と呼ばれるこの機能は、まずAlexaのユーザーアカウントでの設定が必要となる。

利用したい人は、Alexaアプリの「Settings」(設定)から「Communication」(コミュニケーション)を開き、「AT&T」を選択してから、画面に表示される指示に従い携帯番号をリンクさせる。

リンクが完了すれば、AT&Tの利用者は例えば「Alexa、ジェシカに電話して」または「Alexa、XXX-XXX-XXXXにかけて」(Xには実際の番号を入れる)のように言うだけで電話がかけられる。

電話がかかってきたときは、Alexaは「ジェームズから電話です」のように知らせてくれる。電話を取りたいときは「Alexa、出て」と言えば、Alexa対応機器で相手と通話ができる。

かかってきた電話に出る方法はいくつかある。

Alexaで受ける電話は朝の9時から夕方5時までの仕事時間内のみというように、定型アクションで設定できる。また、「Alexa、出かけるね」などのフレーズを言うことで、そのデバイスでのAT&Tからの電話にを受けないようにする定型アクションを作ることも可能だ。さらに、Alexaアプリでアウェイモードをオンにすれば、家を離れるときに手動でこの機能を無効にできる。

この新機能は、AT&Tの「NumberSync」(番号同期)サービスを使うことで、スマートウォッチ、タブレット、コンピューター、そして今後はAlexa対応デバイスでも利用できる。これは対象となるAT&Tモバイルプランに含まれているため、別途料金はかからない。

Amazonによれば、「AT&T calling with Alexa」は、iPhoneやSamsung Galaxyをはじめとする、AT&T対応の数々のHD Voice携帯電話でも、AT&Tの料金後払い契約の利用者なら使えるという。

この機能を享受できるのは米国のAT&T利用者のみだが、発信だけなら、米国内に留まらず、メキシコ、カナダ、英国への通話でも利用できる。

ほかのキャリアに同様の機能を広げる可能性について、アマゾンは何も語らなかったが、利用者の意見を受けて、将来的にこの機能を発展させてゆくとのことだ。

Alexaをコミュニケーションツールとして利用する機能は以前にもあった。

同社はすでに、Alexa対応デバイスを、家庭内のインターホンと電話を掛け合わせたような存在にする試みを行っている。Drop-In(ドロップイン)という機能では、家の中の別の場所にいる家族の様子を確かめることができる。また、Announcements(アナウンスメント)を使えば、「ご飯が用意できたよ!」のようなメッセージを配信できる。これらに対して、Alexa-to-Alexa Calling(Alexa対Alexa通話)やAlexa Outbound Calling(Alexa外部通話)などは、他のAlexaユーザーや、米国、英国、カナダ、メキシコのほとんどの固定電話および携帯電話の番号に、Alexa対応デバイスまたはAlexaアプリを使って無料通話ができるというものだ。

しかし、これらのサービスでは、かかってくる電話を受けることができず、911などの緊急通報用電話はかけられないため、既存の電話と完全に置き換えるのは不可能だった。

Alexa対応デバイスに合わせて、これまでの携帯電話の使用習慣を変えるというのは、ちょっと難しいように思える。大抵の人は、家の中でさえ、携帯電話を肌身離さず持ち歩いているからだ。

だが、Alexaを実際の電話番号と結び付ける手段を提供することで、Alexaから電話をかけてみようと思う人は増えるかも知れない。

またこの機能は、すぐに電話に出られない高齢者や、緊急事態、歩いて電話を取り入って出ることが困難な要支援者や障害者には有用に思える。

残念ながら、このサービスの利用には、まだ大きな問題点が残されている。迷惑電話だ。現代は、不快なロボットコールやスパムが
大変に多い。高度な迷惑電話ブロックサービスなどで自衛していない限り、これらにいちいちAlexaで対応する手間は、その利便性を台無しにしてしまう。

Amazonは、この新機能は本日よりアメリカ国内で利用可能になると話している。

画像クレジットAmazon

[原文へ]
(翻訳:金井哲夫)

自動化によりデータサイエンスは不要になるだろうか?

著者紹介:Tianhui Michael Li(ティエンフイ・マイケル・リー)氏は、学術界から産業界への博士やポスドクの移行を支援する8週間のフェローシップで知られる、The Data Incubator の創設者である。それ以前はFoursquareでマネタイゼーション・データサイエンスの責任者を務め、GoogleやAndreessen Horowitz、J.P.Morgan、D.E.Shawにおける勤務経験も有する。

「自動化によりデータサイエンスは不要になるだろうか?」

これは、私が参加するカンファレンスでほぼ毎回尋ねられる質問である。大抵質問を発するのはこの問題に関心を寄せる2つのグループである。まず1つ目のグループは、将来の雇用の見通しについて憂慮している現役の実務家、またはその志望者である。もう一方のグループは、データサイエンスへの取り組み開始したばかりの経営陣やマネージャーで構成されている。

彼らは、Targetは顧客が妊娠しているかどうかを買い物のパターンから判断できる、と聞くと、彼らのデータにも適用できるそうした強力なツールを持てないかと考える。そして、自動化AIベンダーが最新のセールスプレゼンテーションで、データサイエンティストなしにTargetが行ったのと同じこと(あるいはそれ以上)を実現できる、と主張するのを耳にする。彼らの問いに対し、私たちは、自動化や、より進化したデータサイエンスツールは、データサイエンスの需要をなくすことも、減らすこともないと主張している(Targetのストーリーのようなユースケースを含めて)。自動化によってさらに多くのデータサイエンスに対する需要が生み出されるのだ!

その理由は次のとおりだ。

関連記事:What’s different about hiring data scientists in 2020?」(未訳記事)

ビジネス上の問題を理解することが最大の課題

データサイエンスにおける最も重要な問題は、どの機械学習アルゴリズムを選択するかではなく、どのようにデータをクリーンアップするかでさえない。コードを書く前にまず考えるべきことがある。それはどのようなデータを選択し、そのデータに対してどのような質問を設定するか、ということである。

一般的イメージに欠落しているのは(希望的観測の面もあるが)、創意工夫、創造性、そしてこれらのタスクに注がれるビジネスへの理解である。顧客が妊娠しているかどうかを気にするのはなぜか。Targetのデータサイエンティストたちは、積み重ねてきた研究作業に基づいて、これがなぜ小売業者を変える準備をしている高収益の顧客層であるのかを把握した。利用可能なデータセットはどれか?それらのデータセットについて科学的に検証可能な質問をどう提示できるか?

Targetのデータサイエンスチームは、ベビーレジストリ(ベビー用品の買い物リスト作成サービス)データを購入履歴と結びつけ、それを顧客の支出と結びつける方法を見い出した。どのようにして成果を測るか。非技術的な要件を、データで回答できる技術的な質問に定式化することは、データサイエンスにおける最も困難な作業の一つであり、さらに精度を伴うことは非常に難しい。こうした問題を定式化できる経験豊かな人間がいなければ、データサイエンスへの取り組みを始めることさえできないだろう。

前提条件の作成

データサイエンスの質問を定式化した後、データサイエンティストは前提条件の概要をまとめる必要がある。これには、多くの場合、データのマンジング、データのクリーンアップ、フィーチャーエンジニアリングといった作業が伴う。現実世界のデータはまぎれもなく混沌としており、保有するデータと、取り組もうとしているビジネスやポリシーの質問とのギャップを埋めるために、多くの前提条件を作らなければならない。また、これらの前提条件は、実際的な知識とビジネスコンテキストに大きく依存する。

Targetの例では、データサイエンティストは妊娠の代理変数、分析の現実的な時間枠、正確な比較のための適切な対照群について前提条件をまとめる必要があった。彼らは、無関係なデータを捨て、特徴を正しく正規化できるような、現実的な前提条件をほぼ確実に作成しなければならなかった。こうした作業はすべて、人間の判断に大きく依存している。機械学習におけるバイアスに基づく問題が最近相次いでいるとおり、人間をこのループから外すのは危険だ。その問題の多くが、フィーチャーエンジニアリング排除強く主張するディープラーニングアルゴリズム周辺から発生しているのは、偶然ではないだろう。

コアとなる機械学習の一部は自動化されている(私たちもこれらのワークフローを自動化する方法をいくつか教えてさえいる)が、データサイエンスにおける実際の仕事の90%を占める、データのマンジング、データのクリーンアップ、フィーチャーエンジニアリングについては、安全に自動化することはできないのだ。

歴史的な例示

データサイエンスが完全には自動化されないことを示唆する明確な先例がある。ある分野では、高度な訓練を受けた人間が、コンピューターに驚くべき偉業を達成させるコードを生み出している。こうした人材は、この分野において、スキルを持たない人材よりもかなり高い報酬を得ており(驚くにはあたらない)、このスキルの訓練に特化した教育プログラムが存在する。その結果生じる、この分野を自動化しようとする経済的圧力は、データサイエンスへの圧力と同じように激しい。その分野とは、ソフトウェアエンジニアリングである。

実際、ソフトウェアエンジニアリングが容易になるにつれて、プログラマーへの需要は増すばかりである。自動化によって生産性が向上し、価格が下がり、最終的に需要が増大するというこのパラドックスは、新しいものではない。ソフトウェアエンジニアリングから財務分析企業会計に至るまで、さまざまな分野で繰り返し見られている現象だ。データサイエンスも例外ではなく、自動化により、このスキルセットに対する需要が促進されるだろう。

関連記事:データ駆動型組織になるための5つの構成要素

カテゴリー:人工知能・AI

タグ:機械学習 コラム データサイエンス

[原文へ]

(翻訳:Dragonfly)

自動運転におけるAI技術を競う「自動運転AIチャレンジ 決勝」が9月23日から開催

自動運転におけるAI技術を競う「自動運転AIチャレンジ 決勝」が9月23日から開催

公益社団法人自動車技術会は9月7日、「第2回自動運転AIチャレンジ 決勝」を開催すると発表した。開催期日は2020年9月23日~11月6日(予定)。後援は経済産業省(予定)、東京大学生産技術研究所、一般社団法人日本自動車工業会、一般社団法人日本ディープラーニング協会。

競技では、自動運転車で複数課題をクリアしながら注文品を損なうことなく迅速丁寧に届けるというタスクをオンライン上のシミュレーターで競う。競技詳細と参加チームは後日発表予定。

同大会は当初、2020年6月14日に東京大学生産技術研究所附属千葉実験所(柏キャンパス内)で実車を使用し「認識部門」と「制御部門」の競技を行う予定だったもの。新型コロナウィルス感染防止の観点から実車競技を中止し両部門をまとめ、オンラインシミュレーションによる決勝実施を決定。参加者はプログラムを提出しシミュレーションの結果で優劣を競う。

12月中旬に結果を公表し、表彰式(一部オンライン)を開催予定。12月下旬には、各チームが作成したプログラムから走行映像を作成し、仮想的に並走させた動画を解説付きで公開する予定。

Connected(コネクティッド)、Autonomous/Automated(自動化)、Shared(シェアリング)、Electric(電動化)からなる「CASE」と呼ばれる新たな技術領域が自動車業界の競争の中心となる中、AIおよびIT技術者が不足しており、自動車業界全体で急速に必要性が高まっているという。

そこで、今後の自動車業界を牽引する技術者の発掘・育成の為の新たな取り組みとして、自動運転におけるAI技術を競う国際的な大会を開催。産官学が協力して行うこの大会を起点に、自動車産業のさらなる発展に寄与する枠組みの構築を目指すとしている。

なお、「認識部門」は経済産業省主催 第2回AIエッジコンテスト上位チームを招待。当初は、同コンテストで開発した物体認識アルゴリズムをFPGAに実装し、これを自動運転ソフトウェアと連携させる競技を新たに実施するものとしていた。

「制御部門」は本会主催オンラインシミュレーション予選通過チームの参加を予定しており、現在参加意思の確認中という。制御部門ではFPGAを用いず、ノートPCにインストールした既定の物体認識アルゴリズムを自動運転ソフトウェアと連携させて競技を実施予定だった。

また現在「認識部門」から6チーム、「制御部門」から9チームが参加候補としている。

バックオフィスの文書処理をディープラーニングで自動化する欧州拠点のHypatosが12億円超を調達

プロセス自動化スタートアップのHypatos(ハイパトス)は、Blackfin Tech、Grazia Equity、UVC Partners、Plug & Play Venturesなどの投資家からシードラウンドで1000万ユーロ(約12億5700万円)の資金調達を明らかにした。

ドイツとポーランドに拠点を置くこの企業は、2018年末に会計系スタートアップのSmaccからスピンアウトし、ディープラーニング技術を応用して、金融や保険業界などの金融文書処理のニーズが重い業界を中心に、より幅広いバックオフィスの自動化を推進している。

同社は、言語処理AIとコンピュータビジョン技術を応用して、請求書、旅費・経費管理、ローン申請の検証、保険金請求処理などのビジネスユースケースにおける金融文書処理の高速化を目指している。

今回調達した資金は、ヨーロッパ、北米、アジアでの事業展開と、より多くの種類の文書のビジネス処理を自動化を実現するためのAIモデルの研究開発に投下される。現時点での同社の顧客基盤には、フォーチュン500社、大手会計事務所、300社以上のソフトウェア会社が含まれている。

ビジネスプロセスの自動化にはさまざまな手法があるが、Hypatosはディープラーニング技術を活用してドキュメントやコンテンツの内容を解析し、ドキュメントの分類、情報収集、コンテンツ検証、データに付加的な属性を付与するデータエンリッチメントなどのありとあらゆるものの自動化メニューを顧客に提供している。

同社は、自社のアプローチを「認知的プロセス自動化」(CPA)と呼んでいる。ビジネスプロセス自動化といえばソフトウェアロボット(RPA)が知られているが、RPAは処理内容を自動化するだけで理解しているわけでない点で、同社はCPAの優位性を主張している。

Hypatosは文書処理ソリューションだけでなく、ECM、ERP、CRM、RPAなど既存の顧客システムを強化するための機械学習モジュールを開発し、ソフトウェアプロバイダが自社のアプリケーションに同社の機械学習技術を利用できるようにAPIを提供している。

同社はプレスリリースで「すべての製品には、クラウドやオンプレミスでの継続的なモデルトレーニングのための機械学習パイプラインソフトウェアが含まれています」と述べている。


HypatosでCCOを務めるCem Dilmegani氏、CEOのUli Erxleben氏、機械学習担当副社長のHe Zhang氏(写真提供:Hypatos)

Hypatosがビジネスプロセス自動化の分野でどのような役割を果たしているかについて、CCO(チーフコマーシャルオフィサー)のCem Dilmegani(セム・ディルメガニ)氏は「UiPathのようなRPA企業や、Kofax Readsoftのようなエンタープライズコンテンツ管理(ECM)企業、Hyperscienceのような一般的なMLドキュメント自動化企業と比較されることがあります。しかし、私たちはまったく違います」と説明する。

「私たちはエンドツーエンドの自動化に焦点を当てており、企業がデータを取得するだけでなく、我々の深い領域理解を使ってデータを処理するのを支援し、より高い自動化率を実現しています。例えば、請求書の受信処理(A/P自動化)を自動化するために、文書の内容を理解するためのAIを利用して全データを取得。文書を分類し、特定の商品やサービスを特定しつつ、社内外のコンプライアンスを検証し、財務勘定、コストセンター、コストカテゴリなどを割り当てて、すべての処理タスクを自動化しています」と続ける。

「最後に、APIを介して簡単にアクセスできるコンポーネントとしてこの技術を提供しています。これにより、RPAやECMのユーザーはHypatosのテクノロジーを活用し、自動化レベルを高めることができます」と同氏。

Hypatosによると、新型コロナウイルスの大流行の結果、同社サービスの需要が高まっているという。同社はフォーチュン500企業十数社にサービスを提供しているが、新型コロナウイルスによるロックダウンの影響で低賃金地域の労働者の生産性が低下した結果、従来ビジネスのアウトソーシングモデルから脱却する動きが出ていることが要因のようだ。

UVC PartnersのパートナーであるAndreas Unseld(アンドレアス・アンセルド)氏は「大規模な組織で機械学習が採用される決定的な瞬間に到来していることを確信しています。Hypatosのテクノロジーは、多くのコアビジネスプロセスを変革する機会を提供してくれます。同社の機械学習テクノロジーには感銘を受けており、このチームは今後の機械学習革命の主導的役割を担うための完璧なポジションにあると考えています」とコメントした。

画像クレジット:Peshkova/iStock / Getty Images

原文へ

(翻訳:TechCrunch Japan)

AIで選手の動きを解析し指導を行うスポーツコーチアプリのMustardが1.8億円を調達、ノーラン・ライアン氏が協力

スポーツのコーチ業は、何十億ドル(数千億円)という大きな産業だ。一部の上位選手が得ている巨額な収入を見れば、それも不思議ではない。 Mustardは、その高価なコーチ業の一部を、アスリートの技術を分析して修正方法を提供するモバイルアプリで代替もしくは補強しようとしている。

同社の共同創業者であるTom House(トム・ハウス)氏は元リリーフピッチャーで、コーチになってからの彼は「現代投球術の父」と讃えられている。

「力を無駄遣いしている子どもがとても多い。それによって彼らは、スポーツの肉体的および精神的な恩恵を失っている。いくつかの研究によると、70%の子どもが費用のためや、良質なコーチに恵まれないために13歳でスポーツを止めている。Mustardは、すべての子どもに同じコーチングプログラムと、世界のトップアスリートが使っている広範囲な生体力学的分析、および私が殿堂入りした選手たちに行ってきた個人化されたトレーニンプロトコルへのアクセスを与える。私たちは、エリート選手のための個人化されたコーチングをすべての人に提供したい」とハウス氏はニュースリリースで述べている。

Mustardは今週、そのツールを改善するために170万ドル(約1億8000万円)の資金を調達したことを発表した。ラウンドをリードしたのはShasta Venturesで、これにIntersect VCとDavid Novak(デビッド・ノバック)氏、Mike Dixon(マイク・ディクソン)、そして元メジャーリーガーのNolan Ryan(ノーラン・ライアン)と元アメリカンフットボール選手のDrew Brees(ドリュー・ブリーズ)といった多くのエンジェル投資家が参加した。ライアン氏は同社の顔としてホームページを飾っている。ページの色は、ライアンが全盛期を過ごしたヒューストン・アストロズのチームカラーのようだ。

Mustardという名前は「もっとキレのある球を投げろ」という意味の「put some mustard on it(ちょっと辛子をつけろ)」に由来している。

近く始まる招待制の公開ベータ版のアプリは野球に限定される。CEOのRocky Collis(ロッキー・コリス)氏はTechCrunchに対して 「最初は完全に無料にする。そのあと、安い月額料金で有料の機能も加えていく。しかし今後も無料バージョンは継続するので、ユーザーに大きな価値を提供できるだろう」と語る。

このシステムはスマートフォンのカメラと独自のAIアルゴリズムを使って選手の動きをモニターし、人間のコーチを真似る。野球に関しては、Major League Baseball Advanced Media(MLBAM)の技術者たちを起用している。今後徐々に、他のスポーツも加えていくという。

画像クレジット:Mustard

原文へ
(翻訳:iwatani、a.k.a. hiwa

アマゾンが不動産管理者向けのAlexaサービス「Alexa for Residential」を開始

アマゾンは、不動産管理者にAlexaを提供したいと考えている。米国時間9月3日朝、同社は新サービス「Alexa for Residential」の提供を開始した(Amazonブログ記事)。これは、コンドミニアムや集合住宅などの建物で、不動産管理者がAlexaを使ったスマートホーム体験を簡単に設定・維持できるようにすることを目的としている。米国の大手不動産会社である、IOTAS、STRATIS、Sentient Property Servicesの3社は、開始時にAlexa for Residentialサービスを利用する最初のスマートホームインテグレーターとなる。

Alexa for Residentialは、Amazonのアカウントを持っていない人でもAlexaをスマートホーム管理のためのツールにしようというものだ。新しい居住者は、自分のデバイスを購入したり、何かを設定したりする必要はない。代わりに、住居備え付けのEchoデバイスに話しかけて、彼らの住居で利用可能なさまざまなスマートホーム機能を制御し、基本的なAlexaの機能を使用することができる。

物件管理者は、各住居ごとにAlexaのカスタムスキルを作成して、入居者にメンテナンスの依頼を出したり、アメニティの予約をしたり、Alexaを介して家賃の決済ができる。

居住者が自分のAmazonアカウントを持っている場合、住居備え付けのEchoデバイスにリンクすることも可能だ。一度リンクされると住民は、音楽のプレイリストを聴いたり、Alexaデバイスから友人や家族を呼び出す機能などAlexaのすべての機能を使えるようになる。

居住者が自分のアカウントをリンクさせた場合、不動産管理会社は顧客の個人データにアクセスすることはできなくなる。またAlexa for Residentialでは、入居者の録音した音声は毎日削除される。

しかし、入居者の賃貸契約が終了したり、退去したりした場合には、スマートホーム管理のためのデバイスの既存の設定を中断することなく、不動産管理者がリモートでデバイスをデフォルト設定にリセットして、次の入居者に備えられるようにすることができる。

今回の発売によりアマゾンは、消費者へのEchoデバイスの直接販売を増やさなくても、Alexaの普及を拡大できる市場へのさらなる投資を行うことになる。

アマゾンは以前にもこの分野でパートナーシップを組んでおり、2018年11月には現在PayLeaseの子会社となっているZegoと提携(Business Insider記事)し、3万戸のアパートにAlexaスマートホームデバイスを展開していた。同じく2018年には、RedAwningをパートナーにして不動産管理ツールをローンチした(Property PortalWatch記事)。これはもともとはホテル用だったAlexa for Hospitalityサービスによって実現した。休暇用レンタルサービスも同様の統合を目的にAlexaを利用(Vrmintel記事)している。この分野向けに設計された不動産管理やAlexaのスキルを対象とした、独立したスマートホームテクノロジープラットフォームもある。

もっと広く言えば、アマゾンは他のサービスをロールアウトし、2018年のAlexa for Hospitalityの立ち上げや、Lennarのような住宅建設業者との取引のようにB2B取引を通じて住宅でのAlexa使用を拡大する可能性のあるパートナーシップを発表している。こうした取り組みが成功しているかどうかはまだ判断がつかない。共有デバイスがプライバシーの問題を引き起こすと感じている人(Phys.org記事)もいれば、ほかの設備がうまく配備されていないと感じている人(PhocusWire記事)もいるなど、メリットとデメリットがあるからだ。

しかし、アマゾンはこの最新サービスのアイデアを、不動産管理者が収益を増やすための方法として売り込んでいる。同社は、84%の賃借人がスマートホームのアメニティを備えたアパートを希望しており、61%が音声アシスタントの月額料金を支払うと述べた全米アパート協会のデータを引用している。

とはいえ、このデータは新型コロナウイルスの感染が蔓延している現在の経済を反映していないだろう。現在は失業者が増え、経済に大混乱をもたらしている。 Alexaデバイスとその使用のための追加コストはいまでは必需品ではなく、より贅沢なものとして見られるかもしれない。

画像クレジット:Amazon

原文へ

(翻訳:TechCrunch Japan)

メンタルヘルスAIサービス開発のemolと第一生命がアプリ内会話内から保険商品を推薦する実証実験を開始

emolは9月1日、AIがユーザーを理解して第⼀⽣命保険の保険商品をレコメンドするDX(デジタルトランスフォーメーション)の実証実験を、2020年9⽉7⽇より開始することを発表した。

同社は、ユーザーの感情を記録するAIロボ「ロク」を開発する2019年3月設立のスタートアップ。ロクに日々の悩みや愚痴をなどを話かけることで、各ユーザーの気持ちや精神状態を蓄積していくことで、自覚しずらいメンタルヘルス関連の情報を解析してくれる。emolでは、フリーテキストにより考えや悩みを⾃由に⼊⼒する「能動型会話」と、選択肢による具体的な会話を収束する「受動型会話」を⽬的や状況に合わせて変更する「ハイブリッド型会話」により、⾃然なコミュニケーションを実現している。

具体的には、社内のメンタルヘルス課題を解決するコミュニケーションツールとしてemol workというサービスを提供しており、AIとの会話のカウンセリングで悩みを明確する「セルフケア」、複数人が匿名で悩みを共有する「ラインケア」、チーム全体で悩みに向き合いつつ産業医療スタッフによるケアなどを提供する。さらにオプションとして、心理士や栄養士など、専門家がチームのボードに参加してメンバーの悩みに答えるサービスも用意している。

今回の実証実験は、emolのAI機能を利用して第⼀⽣命保険は販売中の各種保険商品とのマッチングに利用する内容で、具体的には以下の保険商品とのマッチングを確かめる。実証実験の期間は、9⽉7⽇~11⽉30日までの約2カ月で、emolアプリ内で試すことができる。

  • ジャスト 就業不能保険(無解約返還⾦)(2019)
  • ジャスト 特定状態定期保険(アシストワイド)
  • ジャスト 認知症保険(無解約返還⾦)(2019)
  • こども学資保険(2018)
  • 個⼈年⾦保険(2018)『しあわせ物語』

新型コロナウイルスの感染拡⼤の影響を受け、店頭などでの営業活動が自粛・制限される中、スマーフォトフォンアプリとAIを活用した商品提案サービスは、今後重要性が増してきそうだ。

イーロン・マスク氏創業のNeuralinkが開発した脳手術ロボットの詳細

Elon Musk(イーロン・マスク)氏によるNeuralinkのプレゼンテーションは、あくまでも科学が主役だが、人間の脳をコンピューターが推理するという彼のこの企業では、同社が披露した外科手術ロボットが単独で脚光を浴びた。ポリカボネート製で丸みを帯びたSF的なデザインの脳手術ロボットは、ビデオゲームの「Portal」に登場しきそうだが、実際にはバンクーバーの工業デザイン会社であるWoke Studioの作品だ。詳しくいうと、Neuralinkのエンジニアや科学者が基礎となる技術を開発しているが、Woke Studioがロボットの外見とユーザー体験をデザインした。プレゼンテーションで披露された耳の後ろにつける通信端末も、Wokeが作ったものだ。

Neuralinkのロボットは清潔さに配慮した純白で(Woke Studioによると無菌性を確保するためにも純白)、弧を描くラインや滑らかな表面をが特徴で、その外見は高度な技術力を示していると同時に、人の気持ちをほっとさせるような、親しみやすい要素もある。

「マシンが動いているとき患者は起きていないと思われるが、しかしそれでも、イーロン・マスク氏のポートフォリオにある象徴的なマシンでありながら、親しみやすいロボットのデザインにすることは重要だった。また衛生やメンテナンスの面での医学的要件も極めて多く、オペレーターに安全でシームレスな使用感を与えることも必要だった」とプレスリリースでは語られている。

Woke Studioによると、Neuralinkの外科手術ロボットは主要なパーツは3つある。ヘッドとボディとベースだ。ロボットのヘッドはヘルメットに似た部分で、それが実際に患者の頭を保持する。中には手術針のガイドや、患者の脳をマップするためのカメラやセンサーが内蔵されている。内側のミント色も含めて、この部品の設計意図はロボットに「擬人化された性格」を与えて、手術過程の侵襲的な性質から気持ちをそらすことだ。ヘルメットの内側には使い捨ての袋があり、滅菌処理用に使われる。

  1. nn1

  2. nn2

  3. nn3

  4. nn4

  5. nn5

  6. nn6

  7. nn7

  8. nn8

Neuralinkのロボットのボディは後部の盛り上がった組み立て部分で、そこにロボットの動作に必要なパーツがすべて収められている。第3の部品であるベースは、全体を傾かないようにするのが仕事だが、この脳ロボット本体のコンピューターの脳もそこにあるようだ。

Neuralinkはイーロン・マスク氏が設立した企業で、彼が人間の生命にとって潜在的で実存的な脅威と見ているものを軽減することを目的としている。その脅威とは、人工知能が人間より優位に立つことだ。近い将来の目標は、脳組織の損傷によって引き起こされる病状への対処を支援することだが、マスク氏は最終的に、Neuralinkが人間が高度なAIに追いつけるように遅延のない、直接指向入力を提供することによって、人間を支援できるようになることを望んでいる。

関連記事:イーロン・マスク氏が脳インターフェイスNeuralinkの技術をライブ披露、脳モニタリング装置を移植した豚を使って

カテゴリー:人工知能・AI

タグ:Neuralink イーロン・マスク / Elon Musk

画像クレジット: Woke Studio

原文へ

(翻訳:iwatani、a.k.a. hiwa

イーロン・マスク氏が脳インターフェイスNeuralinkの技術をライブ披露、脳モニタリング装置を移植した豚を使って

Tesla(テスラ)やSpaceXの創業者としても知られるElon Musk(イーロン・マスク)氏が設立したNeuralink(ニューラルリンク)は、人間の脳とコンピューティングデバイス間のインターフェイスの新しい種類を開発するため、過去数年間開発を研究を進めてきた。米国時間8月28日、同社は技術のデモを提供した。マスクは氏全体のプレゼンテーションの目的はリクルートであることを表明してデモをキックオフした。資金調達やほかの類いのプロモーションではない。

「我々はお金を集めたり、ほかの何かをしようとしているわけではありませんが、主な目的は、Neuralinkで働くために来て、私たちが製品を結実させるのを助けるために偉大な人々を説得することです。それを手ごろな価格で信頼性の高いものにして、我々が開発して居るデバイスを待ち望んでいる人は誰でもその1つを持つことができるようしたい」とマスク氏。

マスク氏はNeuralinkの技術を一般的に利用できるようにしたいと考えている理由として「記憶喪失、不安、脳の損傷、うつ病、その他の病気の長いリストを含む、時間の経過とともに誰もが何らかの神経学的な問題を抱えることになるからだ」と説明した。もちろん、このようなさまざまな問題の1つの解決策として迅速かつ容易に「解決」できるという明確な証拠はないので、これを同社の合理的な最終目標として見るのは少し難しい。

この目標は野心的なものであり、倫理的、医学的な議論の対象になることは間違いないが、今回マスク氏が実際に示した技術はそうでもなかった。同氏は最初に、Neuralinkが昨年の発表以来のデザインを変更を施したことを明らかにした。物理的なデバイスのプロファイルを小さくして頭蓋骨に取り付けても完全に髪の毛の下に隠すことが可能になったのだ。彼はその大きさを示すために物理的なデバイスを手に持っていた。

続いてマスク氏は、随伴していた飼育員と一緒に近くの檻の中にいた3頭の豚に注目。3頭の豚は、1頭目は未処理で、Gertrude(ガートルード)と名付けられた2頭目には「Link」と呼ばれるNeuralinkデバイスがインストールされていた。3匹目は以前にNeuralinkデバイスがインストールされていたが、その後それが取り除かれた個体だ。

マスク氏は最初、Gertrudeに出てきてもらい、(コメディークラブにいるかのようにバーの高さのテーブルに座っていた)社会的に距離を置いた少人数の観客のためにパフォーマンスをするように説得したが苦労していた。そこでマスク氏は、Gertrudeを紹介する前にLinkを取り除いた3頭目の豚が非常に健康で普通に見えることを示した。

そしてGertrudeに戻ると、LinkがGertrudeが食べ物を探して歩き回っているときに鼻で何かに接触したことを検出したことを、マスク氏は音で再生して視覚的な動きを表示するディスプレイを見せた。

「初期のデバイスでは、約1024チャンネルの各チャンネルで読み取り、書き込みが可能で、バッテリーの持続時間は1日中。ひと晩で充電でき、かなり長い連続使用時間を実現しているので、スマートフォンに近い感覚で利用できる」とマスク氏。「これは重要なことだ。なぜならLinkはスマートフォンに接続し、その専用アプリケーションはそのスマートフォンにインストールされており、Linkは基本的にBluetooth Low Energy(低電力無線通信)であなたの頭の中のデバイスと通信するからです」と続けた。

マスク氏は、同社が7月に米国食品医薬品局(FDA)からこのBreakthrough Devices Programという自主的なプログラムへの参加を認められたこと「必要な承認とさらなる安全性試験を待って、まもなく最初のヒトへの移植に向けて準備を進めている」ことに言及し、プレゼンテーションの準備部分を締めくくった。

今回のデモで披露されたのは、豚の脳内の信号からデータを受信する読み取りデバイスに過ぎなかったが、今後は読み取りと書き込みの両方の機能を提供し、前述のような神経学的な問題に対応できるようにすることを目標としている。またマスク氏は、Linkを無事に取り除いた豚を見せたのは、よりよいバージョンが利用可能になれば、時間をかけてハードウェアをアップデートしていく計画であることを強調した。イベント最後の質疑応答で同氏は、Neuralinkはハードウェア自体のコストを最小限に抑え、現在のウェアラブルデバイスのように価格を1000ドル(約1万6000円)程度にしたいと語った。

マスク氏はプレゼンテーションの中で、NeuralinkデバイスのLinkを「小さなワイヤーで頭の中のFitbit」と呼んでいた。同氏がLinkを使って実現したいと考えているのは、Tesla(テスラ)車を呼び出す機能や、ビデオゲームのコントロールインターフェース(Starcraftの完全なコントロールを含む)が含まれる。また同氏は「将来Linkのユーザーは『記憶を保存し再生する』ことができるようになると期待している。『これはますますブラック・ミラー(Netflixなど放映中のサスペンス・ミステリー)のエピソードのように聞こえるかもしれない』」と述べた。私が思うに彼らはかなり予測が得意だと思う。同氏は「ロボットの体にメモリをダウンロードできる可能性がある」とまで言った。

最初の臨床試験では、頸髄損傷による麻痺や四肢麻痺の人を対象する計画だ。この技術の有効性と安全性をテストするために、対象となる人々の「少数」を登録する。

  1. neuralink-1

  2. neuralink-2-1

  3. neuralink-3

  4. neuralink-4 (1)

  5. neuralink-5

  6. neuralink-6

  7. neuralink-7 (1)

  8. neuralink-9

  9. neuralink-8

  10. neuralink-10

  11. neuralink-11

  12. neuralink-12

  13. Screen-Shot-2020-08-28-at-6.53.30-PM (1)

  14. neuralink-12-1 (1)

  15. neuralink-13

  16. neuralink-14

  17. neuralink-15

  18. neuralink-16

  19. neuralink-17

画像クレジット:Neuralink

原文へ

(翻訳:TechCrunch Japan)

12月開催のSight Tech Globalでマイクロソフトの研究者が視覚障がいに対する「パーソナル」なAIのあり方を語る

Microsoft(マイクロソフト)の主任研究員であるCecily Morrison(セシリー・モリソン)博士が視覚障がい者にとってAIがどう役立つかを研究しているのは、強い個人的な思いによるものだ。博士の7歳の息子が視覚障がい者だからというだけではない。人を助けるパワフルなAI関連テクノロジーは、それぞれの人の環境や能力に応じてサポートするパーソナルなものであるべきだとの信念があるからだ。

Microsoft Research Cambridgeでヒューマン・コンピュータ・インタラクションやAIについて研究しているモリソン博士は「ユーザーが自分の体験をパーソナライズできるような新しいAIテクノロジーが登場するだろう」と言う。「一人ひとり、すべての人が異なる。障がいがあるというラベルは、同じラベルを持つ別の人と同じニーズを持つという意味ではない。それぞれに固有のニーズに合わせて体験をパーソナライズするために、新しいテクニックによって障がい者の情報のニーズをごくわずかなサンプルでAIに教えることができる。テクノロジーは障がいというラベルのためのものではなく、パーソナルなニーズのためのものになる」。

画像クレジット:Cecily Morrison

モリソン博士は12月2日と3日に開催されるバーチャルのグローバルイベント、Sight Tech Globalで講演をする。Sight Tech Globalは、AI関連テクノロジーによって視覚障がい者のアクセシビリティの未来がどのように具体化されるかを考えるイベントだ。先日、TechCrunchで開催が発表され、現在は事前登録を受け付けている

モリソン博士は現在、全盲やロービジョンの人々に対するAIの可能性を探るいくつかの研究プロジェクトに関わっている。例えばProject Tokyo(Microsoft発表)では、周囲の状況に関する情報をリアルタイムで提供し、意味づけのスキルと能力を拡張する方法を研究している。

研究チームは全盲やロービジョンの人々と緊密に連携し、その体験とニーズに基づいて研究をしている。「きわめて重要なのは、全盲やロービジョンの人々の能力を高めるためにテクノロジーは何ができるのかを考えることだ。視覚障がい者の多くは高度なストラテジーをもって周囲を認識し意味づけている。AIテクノロジーは、情報のギャップをカバーすることでこうした高い意味づけのスキルをさらに強化するものでなくてはならない。テクノロジーは視覚の代わりではなく、人が生活の中ですでに持っている情報を補強するものと捉えることが大切だ」。

視覚障がいの子を持つ母親としてモリソン博士は「違う視点で世界を見てきたし、他の立場では見ることも参加することもなかったであろうコミュニティに参加してきた」という。このことは間違いなく博士の研究を後押ししてきた。インクルーシブデザインのプロジェクトであるProject Torino(Microsoftブログ)は、視覚障がいを持つ子どもたちがプログラミングを学ぶというニーズから発想を得ている。このプロジェクトから、視覚の程度を問わず7〜11歳の子どもが計算論的思考と基本的なプログラミングを学ぶための物理プログラミング言語が作られた。この取り組みがCode Jumperというプロジェクトにつながり、視覚障がい者の教育や自立支援に取り組むNPOのAmerican Printing House for the Blindから有料で販売されている。

視覚障がいを持つ7〜11歳の子どもたちと緊密に連携して試行錯誤することで、このプロジェクトが成功した。そしてモリソン博士は、対象となる人々と研究者が緊密に連携する重要性について理解を深めた。さらに博士は、視覚に制限のある人々は一般に、テクノロジーに対して際立ったアーリーアダプターであると指摘する。

モリソン博士は次のように語る。「エージェントを利用した空間で、我々は全盲やロービジョンの人々とともに研究をしてきた。なぜなら、我々がエージェントの研究を始めた時点では、一般の人はエージェントのヘビーユーザーではなかったからだ。それどころか、ほとんどの人がエージェントはおもちゃだと考えていた。その一方で視覚障がい者はエージェント技術のアーリーアダプターでありヘビーユーザーだった。彼らはエージェント技術の可能性を広げるための大きな力になった。テクノロジーを日常的に使っていなければ、今後どうなるかを想像することはできない。能力の高い視覚障がい者のグループと協力して、未来のエージェントが私たちすべてにとってどのようなものになるかを考えることができる。これはインクルーシブデザインの好例だ」。

モリソン博士はケンブリッジ大学でコンピュータサイエンスの博士号を取得し、コロンビア大学バーナードカレッジで民族音楽学の学士号を取得した。パートナーと2人の子どもがいて、子どものうち1人は視覚に障がいがある。

現在、Sight Tech Globalでは事前登録を受け付けている。メインプログラムは無料で視聴できる。

Sight Tech Globalはスポンサードを受けて開催するイベントで、これまでにWaymoGoogle、Wells Fargo、TechCrunch、Verizon Mediaがパートナーとなっている。収益はすべてNPOのVista Center for the Blind and Visually Impaireの収入となる。スポンサーシップについての問い合わせはsponsor@sighttechglobal.comまで。

画像クレジット:Sight Tech Global

[原文へ]

(翻訳:Kaori Koyama)

Ciscoがビデオ会議から周辺ノイズをAIで取り去るBabbleLabsを買収、子どもの声や私語、芝刈機の音も消せる

いまでは誰もビデオ会議をやるようになり、今年は特にその機会が多い。しかし、そんなときに隣家が芝生を刈り始めたり、外で子どもたちが遊んでいたりする。どちらも相当大きな音だ。Cisco(シスコ)にもWebExというビデオ会議サービスがあるが、これらの騒音を何とかしようと考えた同社は、米国時間8月25日く、背景音をカットする技術を擁するスタートアップのBabbleLabsの買収を発表(Ciscoプレスリリース)した。

BabbleLabsの技術は独特だ。人工知能を使って発言を強調し、その間に会議の邪魔になる不要な背景音を濾過する。

おもしろいことにCiscoは、これによって背景の会話や私語が削除されることをプライバシー保護の一環と見ている。Ciscoのセキュリティ担当ゼネラルマネージャーを務めるJeetu Patel(ジートゥ・パテル)氏は「BabbleLabsの技術によってCiscoのユーザーの会議体験が大幅に改善される」と説明する。

パテル氏は今回の買収声明では「BabbleLabsの技術はCiscoの顧客にまた1つの重要なイノベーションを提供する。それは不要なノイズを削除して、Webexによる素晴らしい会議体験の継続を可能にすることだ」とも述べている。ちなみに同氏は、Ciscoに来る前はクラウドストレージサービスを提供するBoxで長年働いていた。

BabbleLabsのCEOで共同創業者のChris Rowen(クリス・ローエン)氏は「Ciscoが買収するという話が始まったのはごく最近で、話がまとまるのも早かった」(BabbleLabsブログ)と振り返っている。ローエン氏によると「『BabbleLabsをCisco Collaborationに合併すれば共通のビジョンを大きく加速できる』という共通の見解に短時間で到達した」とのこと。

Crunchbaseによると、BabbleLabsは面白くて高度な技術的アイデアの持ち主であり、3年前に創業されて、これまでに1800万ドル(約19億円)を調達している。同社が持つ技術の中には、商業製品にすることが困難なものもあるが、Ciscoのような企業にとってはとても魅力的な買収のターゲットだ。

CRM業界の専門メディアであるCRM Essentialsの創業者で主席アナリストのBrent Leary(ブレント・リアリー)氏によると「この買収はもっと大きな業界再編成の一環だ」という。「『ウェブ会議の大手が小さなプレーヤーを買収して自分のプラットホームの充実を図る』という再編成が目の前で起きているのだ」と続ける。

さらにリアリー氏は「WebExは今のZoomほど注目されないが、でもエンタープライズ界隈でのプレゼンスは大きい。今回の買収でさらにその改良を続けていけるだろう」と付け加えた。

この買収は、今の四半期内に規制当局の承認を得て完了すると予想されている。その後、BabbleLabsの社員はCiscoのCollaboration Groupに加わる。

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

東大・松尾研発のAIスタートアップACESとメガネブランドZoffが業務提携、行動認識技術を用いたDXに取り組む

東大・松尾研発のAIスタートアップACESとメガネブランドZoffが業務提携、ヒューマンセンシング技術を用いたDXに取り組む

画像認識アルゴリズムを開発・提供する東京大学松尾研発のAIスタートアップ「ACES」(エーシーズ)は8月27日、メガネブランド「Zoff」(ゾフ)運営のインターメスティックと、ACESによるヒトの行動や感情を検知・解析するヒューマンセンシング技術(行動認識技術)を用いたDXの取り組みを開始したと発表した。

Zoffは、創業20周年を迎える2021年に向けたリブランディングの中核として、初となる研究・開発機関「Zoff Eye Performance Studio」(ゾフ アイパフォーマンス スタジオ。ZEPS)を設立。ヒューマンセンシング技術に強みを持つACESは、「メガネや店舗にIT・AI技術を援用することで人間の可能性を拡張し、顧客体験を洗練すること」を目指すZEPSのビジョンに共感し、AI活用の設計から技術開発・運用まで全面的にサポートを行うことで合意、業務提携が実現した。

今回の提携では、Zoffのコアコンピタンスである接客や商品などをAIによってアップデートするという。また、長期的にはIT・AIなどの技術躍進を背景に、メガネを視力矯正器具に留めず、人間の可能性を拡張するツールとしての価値を提示していくことを目指す。

東大・松尾研発のAIスタートアップACESとメガネブランドZoffが業務提携、ヒューマンセンシング技術を用いたDXに取り組む

今後の展望としては、ヒューマンセンシング技術を応用し、目のパフォーマンスおよび人のパフォーマンス向上に関する取り組みを検討。ACESとZEPSは、既存の商品・サービスの枠を超えて、目だけではなく人のパフォーマンスを向上させる「新しい機能」「新しい商品」「新しいサービス」の研究・開発を行い、メガネ業界のニューノーマルを牽引するとしている。

共同研究・開発テーマイメージとしては、以下を挙げている。

  • 日常生活やスポーツシーンにおける、目のパフォーマンスや身体能力向上を目的としたフレーム・レンズの開発
  • 光学・デジタル的なアプローチでの研究開発の推進
  • 機械学習・ディープラーニング・IOTなどを利用した生産・流通・販売基盤の構築

ACESは、東京大学松尾研発のAIスタートアップ。ディープラーニングのAIアルゴリズムを用いることで、ヒトが関わる様々なビジネスシーンをデジタル化し、課題解決と価値創出を行うDX事業を展開。ヒトの認識・解析を行うヒューマンセンシング技術を中心とした画像認識・動画解析アルゴリズムのAPI/SDKの提供や、共同DXプロジェクトなどを推進している。

ZEPSは、既存の商品・サービスの枠を超えて、目だけではなく人間のパフォーマンスを向上させるための「新しい機能」「新しい商品」「新しいサービス」を研究・開発し社会実装することを目的に設立した、Zoff初の研究・開発機関。エンジニアやゲームプレイヤーなど、目を酷使する職業のパフォーマンス向上を目的としたフレーム・レンズの開発や、視力だけでなく目の疲れ度合いなど目のパフォーマンスを数値化するサービスの開発など、新たな取り組みを進めている。

関連記事
日本ディープラーニング協会が高専生対象コンテスト開催、最優秀賞の東京高専チームが企業評価額5億円を獲得
東大・松尾研発AIスタートアップDeepXが総額16億円の資金調達、建機自動化や工場内作業自動化の事業化加速
Tencentと中国の科学者がディープラーニングを使用して新型コロナの重症化確率を予測
Preferred Networksが教育事業に参入、独自のプログラミング教材「Playgram」を開発
東大・松尾研発AIスタートアップACESがAI活用のプレスリリースデジタル管理を開始、テレ東とタッグ
東大・松尾研発AIスタートアップACESが資金調達、画像認識アルゴリズムをパッケージ化して提供へ
Linux Foundationにディープラーニングのオープンソース団体が加わる