AIで発音や表現のレベルを診断、新英会話アプリ「TerraTalk」のジョイズが1.5億円を調達

元ソニーのエンジニアだった柿原祥之氏が2014年末に創業したジョイズは今日、AI英会話アプリをうたう「TerraTalk」のAndroid版をローンチした(iOS版は4月予定)。同時に、シードラウンドとして独立系VCのインキュベイトファンドから1.5億円の資金調達したことも発表している。

TerraTalkは音声認識や自然言語解析技術をベースに、利用者のスピーキングのレベルを「発音」「流暢さ」「表現」の3つに分類してフィードバックしてくれる。フィードバックというのは具体的には100点満点の点数付け。この評価をするのは人間ではなく、クラウド側のコンピューターだ。柿原CEOによればTerraTalkの技術的な差別化要因は、既存の言語解析エンジンを使うのではなく、先行研究を参照しつつ「音波→音素→単語→センテンス」といった音声認識のエンジンをエンド・トゥー・エンドで自社開発しているところだそう。なぜなら、既存の音声認識技術というのは実用でも研究でもネイティブが話していることを前提にしている。その前提で設計して研究データも集めているため、ノン・ネイティブ、しかも学習用途にチューニングしていくのは全然別の話なのだという。

  1. 01_home

  2. 02_speaking

  3. 03_feedback

  4. 04_score

  5. 05_progress

  6. 06_role_change

スピーキングのレベルを点数で評価

発音の良さの判定は音声認識エンジンによって、どれだけ曖昧さがなく聞き取れるかを基準の1つにしているという。また「表現」というのは、どういう構文を使っているのか、文法に間違いがないかなどを見ているそうだ。ローンチ時点でどの程度の精度でスピーキングレベルの判定ができるのか、ぼくはまだ見ていないので良く分からないが、自分のスピーキングに点数が付くことでゲーム感覚で繰り返し上達を目指すという動機付けの仕組みは分かりやすい。

柿原CEOは「ゆくゆくは採点だけではなく、指導がやりたい」と話す。特定の間違いのパターンについて、なぜ間違いなのか、どう直すべきなのかを指摘するような方向性だ。時制や冠詞、前置詞の誤りを指摘するなどは比較的やりやすそうだし、もし別の言い方を提示するパラフレーズのようなことまでが技術的に数年程度で実現可能なのだとしたら、これはとても面白いチャレンジになりそうだ。生身の人間の英語の先生がベストだとしても、AIで代替できる部分は大きそう。

いろんな役になりきって会話

どういう会話を吹き込むのかというと、「恋人との会話」「ウェイター」「ハリウッドスター」「ソフトウェアエンジニア」「婚活女子」「大学の新入生」「ホテル客室係」「空港のバゲージクレーム」などといったシチュエーションにに沿ったもの。それぞれのシチュエーションで「ロール」(役割)が設定されていて、TerraTalkを使った学習者は、役(ロール)になりきって会話の穴の部分を音声で埋めていく。対話は時間にして約2分。ユーザー側は7〜10発言程度で完結し、これを1レッスンとする。すでに書いたようにレッスン後には「発音・流暢さ・表現」が100点満点で表示される。

ローンチ時点では12のロールが用意されていて、それぞれに10〜15レッスンが含まれる。実は同じレッスン項目であっても会話の流れは枝分かれ状に分岐が起こる。事前に設定されたシナリオがあって、結末は結構違ってくるそうだ。例えば、恋人を怒らせてしまうこともあるんだとか。仕事関連だとミッションが完成するものが多いそうなので、ビジネスパーソンの営業トークの練習なんかには向いているのかもしれない。

ターゲットはグローバル、中級以上の英語学習者

ローンチ直前のデモ画面を見せてもらった感じだと、英語初学者には難しそうに見えた。初学者だと、そもそも何をどう言っていいのか分からずに画面の前で固まってしまうのではないかと思う。例えば、こんな感じだ。「空港で荷物がなくなりました、バゲージクレームで苦情を言います」というような前提が英語で表示される。続いて、いきなり空港スタッフに英語で話しかけられて、さあどうぞ何とか言って目的を達成してくださいという風に進む。模範解答や文例集はない。

ターゲットは「英語はいろいろやったけど1度挫折したくらいの人」や「グループ英会話をやっている人で会話量が足りていないと感じている人」などで、一定レベル以上の英語学習者。初学者向けには他に良いアプリもあるので、そこを超えた層に訴求していくという。

柿原CEOによれば、すでに会話練習など英語学習に取り組む人は国内に200万人いるそう。ただ、TerraTalkのシナリオ自体は英語ベースで対話が進むものなので、学習者の第一言語への依存度は低い。だからTerraTalkのターゲット市場はグローバルだ。まずは日本でローンチするものの英語で英語を学ぶ層に対してもリーチしていく。矢野経済研究所の調査(PDF)によれば国内大人向け語学教室は2100億円程度だが、ワールドワイドの英語学習市場は4.3兆円にもなるという。ソニー在籍時代に柿原CEOが個人で作っていた英語関連サービスはインドやパキスタンで人気となるなど、もともと日本国内だけを市場として見ているわけではないという。

ニッチなシチュエーションでもスケール可能という利点

TerraTalkが面白いのは、生身の英語の先生の劣化版というより、むしろ人間よりも有利なことがあるという点だ。

例えば、特定シチュエーションに対応できる人を探さなくて良いというマッチングの効率の良さがある。ローンチ時のロール数は12だが、年内には100程度に増やす。どんなニッチな話題であってもシナリオさえ作れば、労働集約型の英語学校と違って、いくらでもスケールできる。柿原CEOは「特定の職業に紐づくようなものは掘り下げたいです」と話していて、「例えば民泊のホストをやるために必要な英語ってありますよね。クレーム対応とか」と例を挙げる。人間の先生と違って同じロールプレイングを何回、何十回やっても退屈そうな顔をされずに済むということもあるかもしれない。

IMG_0715

ジョイズ創業者で代表の柿原祥之氏

柿原CEOの狙いは明確だ。「言葉はあくまでもツールなので、必要なシチュエーションだけでも使えるようになることが重要です。その上で何をするのかは人それぞれ。そこまでは誰でもできるようにしたい」という。例えば、これまでSkype英会話などでは、既存の教材やネット上の記事をシェアして先生とそれについて話すということになりがち。これだとトピックが一般的すぎて学習者のニーズを満たすとは限らず、なかなか日々の実用英語の場面で実力の伸びが感じづらいのが問題ではないか、ということだ。

TerraTalkは当初無償提供として、3カ月をめどにフリーミアムへ移行するそう。レッスン数が10以下なら無料で、それ以上は月額980円とする。年内50万DL達成を目標としている。

4年半のソニー在籍時代には後付型カーナビのソフトウェア開発に携わっていたという柿原CEOは、2014年末の起業時は27歳。16歳で日本の進学校を辞めて単身渡英。イギリスの高校、大学を卒業してソニーに新卒入社している。自身が英語を身に付けられたのは、そうした留学を許してくれた親や環境に恵まれたことがあるとして、「語学の習得は大博打になりがち」という現状を問題とみているという。留学のように思い切った時間的投資を必要とするからだ。そうではなく、英語学習を誰でもやろうと思えばできるという本当の意味での選択肢にしたいという。「どんな人でもできることが重要だと思っています。だからレッスンを続けられるといのを価値にして追求したいと思っていて、レッスンの終了回数をKPIにしています」