Googleアシスタントが日英バイリンガルになった――英独仏西伊日を自由に組み合わせ可能

Googleアシスタントがさらに賢くなってバイリンガルになった。今日公開されたアップデートではGoogle Homeアプリの設定から、たとえば英語とスペイン語、英語と日本語のように2つの言語を選べるようになった。Googleアシスタントはどちらの言語によるコマンドにも反応する。

今日のアップデートはある程度予想されていた。 Googleは今年2月のI/Oカンファレンスでアシスタントのバイリンガル機能を開発中だと明かしていた。次のI/Oまだまだだいぶ間がある今の時期に無事に新機能が公開できたのは何よりだ。

今のところアシスタントはバイリンガル、つまり2言語のみサポートする。英語、ドイツ語、フランス語、スペイン語、イタリア語、日本語の6ヶ国語から自由に2つの言語を選択できる。Googleでは他の言語への拡張にも取り組んでおり、また将来は3言語の利用をサポートする計画だという。

Googleは私の取材に答えて、この機能は一旦設定すればアシスタントがその言語をサポートしていさえすればあらゆるデバイスで有効になると述べた。つまりアシスタントを搭載したほぼすべてのスマートフォン、スマートスピーカーということだ。ただし最近発表されたスマートディスプレイはまだ英語しかサポートしていないので例外となる。

一見したところでは簡単なことに思えるかもしれないが、 Googleはこのようなバイリンガル化は完成までに何年もかかる複雑な作業だったと述べた。このようなシステムでは複数の言語をサポートをしているだけでなく、ユーザーが話す言葉がどの言語であるかを識別し、理解し、適切な言語で反応する必要がある。しかもこれを数秒以内に行わなければならない。

Googleのバイスプレイジデント、Johan Schalkwykとスピーチ認識のエンジニア、Lopez Morenoは今日の発表でこう書いている。

われわれの言語認識モデル(LangID)は2000種類の言語ペアを識別できる。次に、サポートされている言語による音声コマンドを適切に実行するシステムを開発した。ユーザーの発話が停止すると同時にシステムはそれが何語であるか決定するだけでなく、何が言われたのかを理解しなければならない。こうしたプロセスはそれ自体極めて高度なアーキテクチャーとなるが、不必要なレイテンシーを排除するためにさらに余分のコンピューティング資源を要した。

ドイツ、フランス、イギリスのユーザーはこれらの地域で今日から発売される大型の Google Home Maxでもバイリンガル機能を利用できる。

また今日の発表によれば、 Googleは近くバイリンガルのサポートをtado°のスマート・サーモスタットのようなデバイスにも広げるという(ただし、当然だが、AmazonのRing Alarmのような独自製品は対象とならない)。

〔日本版〕バイリンガル機能は日本でもすでに有効。新言語の追加はHomeアプリなどから「設定→カスタマイズ設定→アシスタントの言語」オプションを開く。タップすると追加できる言語のリストが表示されるが、地方別に言語の種類を指定する必要がある。英語の場合、アメリカ、イギリス、カナダ、オーストラリア、インド、シンガポールが用意されている。下のビデオでは日仏バイリンガルの例が登場する。

原文へ

滑川海彦@Facebook Google+

Microsoftの音声認識システムが人間と肩を並べ始めた

米国時間8月20日、MIcrosoftはその会話型音声認識システムが、これまでで最も低い5.1%のエラーレートに達したことを発表した。この記録は、Microsoft Artificial Intelligence and Researchの研究者グループが昨年達成した5.9%のエラー率を下回るもので、テキストを数回聞き返すことができるプロのトランスクライバーたちと同等の正確さだ。

両研究は、Switchboardコーパスの録音を認識することで行われた。これは1990年代初頭から、音声認識システムをテストするために研究者たちが使用してきた、約2400件の通話のコレクションだ。今回の新しい研究は、Microsoft AI and Researchの研究者グループによって、人間のトランスクライバーのグループと同程度の正確性を達成することを目標として行われた。人間のグループは自身が聞いているものを複数回聞き直すことができ、会話の文脈を知った上で、他のトランスクライバーたちと協力することも可能だった。

全体として、今回の研究では昨年のものに比べて、ニューラルネットベースの音響モデルと言語モデルを改善することにより、エラーレートを約12%下げることに成功した。特に、その音声認識ソフトに会話全体を利用させ、そのことによってトランスクリプションを文脈に適合させ、次にどのような言葉やフレーズが来るかを、人間がするように予測させるようにした。

Microsoftの音声認識システムは、Cortana、Presentation Translator、そしてMicrosoft Cognitive Servicesなどのサービスで使用されている。

[ 原文へ ]
(翻訳:Sako)

FEATURED IMAGE: BLOOMBERG/CONTRIBUTOR/GETTY IMAGES

あなたの英文の文法チェックをしてくれるGrammarlyが初めての投資ラウンドで$110Mの巨額を調達

文法が苦手な人は少なくない。ちなみに、“a lot”は二語だし、 “Your”と“you’re”は同じ語ではない。

知る人ぞ知るGrammarlyは、ソーシャルメディアやメールで好印象を与えたいと願っている学生やライターや一般人のための、フリーミアムの文法チェッカーだ。同社は今、General CatalystやIVP, そしてSpark Capitalから1億1000万ドルを調達して、事業の底入れ強化を目指している。

8歳の同社にとって、これが初めての資金調達だ。Grammarlyはすでに利益を上げているから、投資家たちも気前が良い。

IVPのゼネラルパートナーJules Maltzは語る、“サンフランシスコの平均的なスタートアップよりも成長がはやい。同社は今後ますます、重要な企業になるだろう”。

Grammarlyのアクティブユーザー数は一日あたり690万だ。その多くが、無料で利用している。同社の収益源は、センテンスの構造や語彙までチェックしてくれる月額11ドル99セントの有料会員の会費だ。

ネット上の文法チェッカーはいろいろあるが、検索で簡単に見つかるそれらに比べればGrammarlyはずっと優秀だ、と同社は自負している。ネットにつながった状態で文書の校正をリアルタイムでやってくれる、Chromeエクステンションもある。

CEOのBrad Hooverは曰く、“うちは人工知能を使ってユーザーの文章の文意や文型をチェックしている”。今度の資金は、社員の増員とアルゴリズムの改良に充てる予定だ。

HooverはGeneral Catalystにいた人物だが、Grammarlyを知って以来、このウクライナ発のスタートアップの将来性に着目していた。

Spark CapitalのゼネラルパートナーJeremy Philipsは、投資の動機を、“良いプロダクトだし、人びとのコミュニケーションを良くするというミッションも気に入った”、と語る。

(私はこの記事を公開する前にGrammarlyでチェックしてみた。誤字を一つ見つけてくれた。)

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))

ビジネスマン向け言語学習サービスLingo Liveが520万ドルを調達

languages

CD-ROMの教材やRosetta Stoneが最新技術と考えられていた90年代からこれまでに、数々のスタートアップが人間の教師無しでの言語学習を実現すべく努力を重ねてきた。ソーシャルメディアとスマートフォンが普及すると、DuolingoOKPandaLingua.lyといった新たな言語学習アプリが次々に登場した。しかしLingo Live CEOのTyler Museは、人間の教師や課題ベースの授業無くして仕事で使えるレベルの言語を習得することは不可能だと主張する。

学習プラットフォームも含め、ほとんどの言語学習アプリは、非母国語の学習において基礎的なレベルの言語習得しかサポートできないとMuseは言うのだ。一方Lingo Liveはビジネスマンを対象に、リーダシップを発揮する場で必要な言語能力およびコミュニケーションスキルを習得するサポートを行っている。この度同社はシリーズAで520万ドルを調達し、高い潜在能力をもったプロフェッショナルのための言語教師のマーケットプレイスを拡大しようとしている。

ニューヨークに拠点を置くLingo Liveは、現在EventbriteからTwitterやHoliday Innまでさまざまな顧客にサービスを提供している。Museは同社のサービス内容について次のように説明する。「Lingo Liveは、単なる言語学習を超えて生徒とコーチのマッチングを行っています。私たちのサービスでは、生徒の学習スタイルや目標、さらには特にどんなスキルを向上させたいかや、生徒が希望するタイミングに応じて授業が提供されています。また簡潔なメールを書くためのスキルや素晴らしいスピーチをするためのスキルなど、生徒は自分が伸ばしたいスキルを選ぶことができます」

Lingo Liveのプラットフォームはパソコンからでもモバイル端末からでもアクセスでき、生徒は好きな時間にオンラインのライブセッションでコーチの指導を受けることができる。Museによれば、顧客企業は従業員の人数に応じた料金を支払うようになっており、通常6〜12ヶ月のコースを選択することが多いが、1ヶ月という短期間でのブラッシュアップコースも用意されている。

Lingo Live CEO Tyler Muse

Lingo Live CEO Tyler Muse

Owl Venturesがリードインベスターを務めた今回のラウンドには、既存の投資家であるEntrepreneurs Expansion FundAlpine Meridian VenturesFresco Capitalも参加していた。投資家の傾向として、エドテックやエンタープライズ向けソフトウェアの分野を中心に投資活動を行っている企業が目立つ。シリーズAの前に行われたシードラウンドで100万ドルを調達したLingo Liveは、現在本社を置くニューヨークでEntrepreneurs Roundtableのアクセラレータープログラムに参加していた。

Owl VenturesパートナーのAmit Patelは、Lingo Liveの素晴らしい経営指標を見て投資を決めたと話す。Lingo Liveの売上は2014年のローンチから継続的に毎月20%伸びているほか、これまでに180人のコーチのトレーニングを行い、彼らはLingo Liveが開発した課題ベースのカリキュラムに沿って授業を行っている。また生徒の満足度は全体で98%を記録しており、ほとんどの生徒は英語のネイティブスピーカーではないが、フランス語、日本語、中国語(普通語)、ポルトガル語、スペイン語でもコースが行われている。

「グローバル経済では、発達・学習の分野で”言語の負債”として呼ばれるものを企業が回避できるようにサポートすることが重要になってきています」とPatelは語る。

今回調達した資金は、人員増強やコーチのトレーニング、生徒とコーチのマッチングを行うアルゴリズムの改善、マーケティングなどに使われる予定だとMuseは話す。また長期的には、世界中にオフィスを設立し、プラットフォームに新たな言語を追加するほか、現在用意されているコースを応用し、英語のネイティブスピーカー向けにコミュニケーションスキル向上を目的としたコースを提供していきたいと考えている。

Lingo Liveの競合は必ずしも言語学習アプリではなく、むしろBerlitzやEducation Firstといったエンタープライズ向けの言語教育ビジネスだと言える。

原文へ

(翻訳:Atsushi Yukutake/ Twitter