AIで発音や表現のレベルを診断、新英会話アプリ「TerraTalk」のジョイズが1.5億円を調達

元ソニーのエンジニアだった柿原祥之氏が2014年末に創業したジョイズは今日、AI英会話アプリをうたう「TerraTalk」のAndroid版をローンチした(iOS版は4月予定)。同時に、シードラウンドとして独立系VCのインキュベイトファンドから1.5億円の資金調達したことも発表している。

TerraTalkは音声認識や自然言語解析技術をベースに、利用者のスピーキングのレベルを「発音」「流暢さ」「表現」の3つに分類してフィードバックしてくれる。フィードバックというのは具体的には100点満点の点数付け。この評価をするのは人間ではなく、クラウド側のコンピューターだ。柿原CEOによればTerraTalkの技術的な差別化要因は、既存の言語解析エンジンを使うのではなく、先行研究を参照しつつ「音波→音素→単語→センテンス」といった音声認識のエンジンをエンド・トゥー・エンドで自社開発しているところだそう。なぜなら、既存の音声認識技術というのは実用でも研究でもネイティブが話していることを前提にしている。その前提で設計して研究データも集めているため、ノン・ネイティブ、しかも学習用途にチューニングしていくのは全然別の話なのだという。

  1. 01_home

  2. 02_speaking

  3. 03_feedback

  4. 04_score

  5. 05_progress

  6. 06_role_change

スピーキングのレベルを点数で評価

発音の良さの判定は音声認識エンジンによって、どれだけ曖昧さがなく聞き取れるかを基準の1つにしているという。また「表現」というのは、どういう構文を使っているのか、文法に間違いがないかなどを見ているそうだ。ローンチ時点でどの程度の精度でスピーキングレベルの判定ができるのか、ぼくはまだ見ていないので良く分からないが、自分のスピーキングに点数が付くことでゲーム感覚で繰り返し上達を目指すという動機付けの仕組みは分かりやすい。

柿原CEOは「ゆくゆくは採点だけではなく、指導がやりたい」と話す。特定の間違いのパターンについて、なぜ間違いなのか、どう直すべきなのかを指摘するような方向性だ。時制や冠詞、前置詞の誤りを指摘するなどは比較的やりやすそうだし、もし別の言い方を提示するパラフレーズのようなことまでが技術的に数年程度で実現可能なのだとしたら、これはとても面白いチャレンジになりそうだ。生身の人間の英語の先生がベストだとしても、AIで代替できる部分は大きそう。

いろんな役になりきって会話

どういう会話を吹き込むのかというと、「恋人との会話」「ウェイター」「ハリウッドスター」「ソフトウェアエンジニア」「婚活女子」「大学の新入生」「ホテル客室係」「空港のバゲージクレーム」などといったシチュエーションにに沿ったもの。それぞれのシチュエーションで「ロール」(役割)が設定されていて、TerraTalkを使った学習者は、役(ロール)になりきって会話の穴の部分を音声で埋めていく。対話は時間にして約2分。ユーザー側は7〜10発言程度で完結し、これを1レッスンとする。すでに書いたようにレッスン後には「発音・流暢さ・表現」が100点満点で表示される。

ローンチ時点では12のロールが用意されていて、それぞれに10〜15レッスンが含まれる。実は同じレッスン項目であっても会話の流れは枝分かれ状に分岐が起こる。事前に設定されたシナリオがあって、結末は結構違ってくるそうだ。例えば、恋人を怒らせてしまうこともあるんだとか。仕事関連だとミッションが完成するものが多いそうなので、ビジネスパーソンの営業トークの練習なんかには向いているのかもしれない。

ターゲットはグローバル、中級以上の英語学習者

ローンチ直前のデモ画面を見せてもらった感じだと、英語初学者には難しそうに見えた。初学者だと、そもそも何をどう言っていいのか分からずに画面の前で固まってしまうのではないかと思う。例えば、こんな感じだ。「空港で荷物がなくなりました、バゲージクレームで苦情を言います」というような前提が英語で表示される。続いて、いきなり空港スタッフに英語で話しかけられて、さあどうぞ何とか言って目的を達成してくださいという風に進む。模範解答や文例集はない。

ターゲットは「英語はいろいろやったけど1度挫折したくらいの人」や「グループ英会話をやっている人で会話量が足りていないと感じている人」などで、一定レベル以上の英語学習者。初学者向けには他に良いアプリもあるので、そこを超えた層に訴求していくという。

柿原CEOによれば、すでに会話練習など英語学習に取り組む人は国内に200万人いるそう。ただ、TerraTalkのシナリオ自体は英語ベースで対話が進むものなので、学習者の第一言語への依存度は低い。だからTerraTalkのターゲット市場はグローバルだ。まずは日本でローンチするものの英語で英語を学ぶ層に対してもリーチしていく。矢野経済研究所の調査(PDF)によれば国内大人向け語学教室は2100億円程度だが、ワールドワイドの英語学習市場は4.3兆円にもなるという。ソニー在籍時代に柿原CEOが個人で作っていた英語関連サービスはインドやパキスタンで人気となるなど、もともと日本国内だけを市場として見ているわけではないという。

ニッチなシチュエーションでもスケール可能という利点

TerraTalkが面白いのは、生身の英語の先生の劣化版というより、むしろ人間よりも有利なことがあるという点だ。

例えば、特定シチュエーションに対応できる人を探さなくて良いというマッチングの効率の良さがある。ローンチ時のロール数は12だが、年内には100程度に増やす。どんなニッチな話題であってもシナリオさえ作れば、労働集約型の英語学校と違って、いくらでもスケールできる。柿原CEOは「特定の職業に紐づくようなものは掘り下げたいです」と話していて、「例えば民泊のホストをやるために必要な英語ってありますよね。クレーム対応とか」と例を挙げる。人間の先生と違って同じロールプレイングを何回、何十回やっても退屈そうな顔をされずに済むということもあるかもしれない。

IMG_0715

ジョイズ創業者で代表の柿原祥之氏

柿原CEOの狙いは明確だ。「言葉はあくまでもツールなので、必要なシチュエーションだけでも使えるようになることが重要です。その上で何をするのかは人それぞれ。そこまでは誰でもできるようにしたい」という。例えば、これまでSkype英会話などでは、既存の教材やネット上の記事をシェアして先生とそれについて話すということになりがち。これだとトピックが一般的すぎて学習者のニーズを満たすとは限らず、なかなか日々の実用英語の場面で実力の伸びが感じづらいのが問題ではないか、ということだ。

TerraTalkは当初無償提供として、3カ月をめどにフリーミアムへ移行するそう。レッスン数が10以下なら無料で、それ以上は月額980円とする。年内50万DL達成を目標としている。

4年半のソニー在籍時代には後付型カーナビのソフトウェア開発に携わっていたという柿原CEOは、2014年末の起業時は27歳。16歳で日本の進学校を辞めて単身渡英。イギリスの高校、大学を卒業してソニーに新卒入社している。自身が英語を身に付けられたのは、そうした留学を許してくれた親や環境に恵まれたことがあるとして、「語学の習得は大博打になりがち」という現状を問題とみているという。留学のように思い切った時間的投資を必要とするからだ。そうではなく、英語学習を誰でもやろうと思えばできるという本当の意味での選択肢にしたいという。「どんな人でもできることが重要だと思っています。だからレッスンを続けられるといのを価値にして追求したいと思っていて、レッスンの終了回数をKPIにしています」

左右スワイプで高速暗記、1日1000語覚える英単語アプリ「mikan」が、いよいよリリース

「圧倒的にいちばん速く覚えられる英単語アプリ」を目指すという、今までありそうでなかった打ち出しアングルで英語産業にチャレンジしようするスタートアップ企業、mikan(ミカン)が、社名と同名のアプリ「mikan」のiOS版を今日リリースした。AppStoreから無料でダウンロードできる。Android版は2015年春リリース予定。

 

TechCrunch Japanでは、7月29日にmikanのことを詳しく報じているけれど、このときの反響はすごかった。TechCrunch Japanの7年にわたる歴史の中で3位となるはてブ数1500、Twitterで1400ツイート、Facebookで2300いいねが付くなど注目度はきわめて高い。「これならオレ(ワタシ)でも!」という万年挫折組の期待感と、「でも、ホントに効果なんてあんの?」、「ていうか、これ、結局なにが新しいの?」という英語学習中上級者の懐疑の目とが一気に集まったような感じだろうか。

改めて簡単にmikanの紹介をすると、これはスマフォネイティブの英単語帳だ。あらかじめ用意されている「TOEFL3000」「TOEIC2500」「センター試験・大学受験2500」「GRE1500」という4つの試験の学習者向けのカテゴリを選択して、合計9500語の学習ができる。次々に表示されるカード上の単語について、「意味が分かる」(右)、「分からない」(左)と指でスワイプしていくのだが、テンポよく高速にカードがめくれるのが特徴だ。左にスワイプした覚えていない単語のみ、何度も繰り返し復習できるのがポイント。ネイティブスピーカーの発音も収録されているので、「英単語=訳語=音」というセットを高速にグルグルとカードを眺めて学習できる。学習後に出てくる4択テストで、定着度を測ることができる。

以下はプロトタイプの動画でリリース版はもっと洗練されているが、mikanがどういうものかは分かると思うので再掲載しておこう。

で、mikanの何が新しいのか? ということだけど、英単語学習アプリを自作して3年間も使い続けてるほどの学習アプリオタクのぼくに言わせると、mikanがうたう個々の機能は世界初とかそういうものじゃないと思う。覚えていない単語だけを復習するアプローチは長らく存在している手法だし、定着度に応じて復習間隔を徐々に広げていくSRS学習法と呼ばれるようなアプリのモバイル版もたくさんある。

ただ、「スワイプUIで徹底して英単語の学習時間を短くする」ということを目標に全体を最適化しているアプリは、今のところmikan以外にないように思う。やってみれば分かるけど、単語カードや4択のタイマーのリミットがかなり短時間に設定されている。グングンと残時間表示バーが減っていく。知っている単語でもスピードを要求されるゲームのような感じだ。そして反応時間をベースにした統計情報もグラフで表示されるので、同じ「知っている」でも習熟度が上がっていく様子が分かったりするようになっている。隠れている訳語を表示するインターフェイスも、指を載せてスワイプする動作と一体化している。たとえばi暗記+のモバイル版だと、訳語はカードを裏返すアクションの後に表示されるようになっていて、かすかに時間がかかる。別の比較例としてAnkiAppは復習戦略の最適化のために、習熟度の自己申告を促す仕組みを採用しているというのがある。ユーザーは各アイテムごとに「無理、むずい、分かる、余裕」の4つから選んでボタンを選ぶ。やはり左右スワイプに比べると、1アイテムごとの滞留時間が長い想定だ。ぼくが作ったReijiroという単語帳アプリは「用例と例文を読むこと」を重視しているからアイテムごとの滞留時間は、たぶん1〜3分程度とむちゃくちゃ長い。そもそも日々のオンラインでの辞書引きが起点なので開発の背景や目的が全く違う。

こうした違いはmikanだけが「学習時間を徹底して短く」ということを掲げているから出てくるものだと思うし、この軸のために出てくる小さな違いの積み重ねこそがプロダクトの差別化になり、特定の問題への向き不向きを分けるのだとぼくは思う。今までの暗記系アプリは時間的な焦りを感じている英語学習者にとっては「(化学や歴史、資格試験など)ジャンルで欲張りすぎ」、「記憶効率の話はしても、徹底した高速学習を目指してはいなかった」ということで潜在ユーザー層に響いていなかった可能性があるのではないかと思う。もし単位時間あたりの接触回数が記憶効率にとって決定的要因だった可能性があるとすれば、mikanのアプローチは新しいし、興味深いと思うのだ。

起業してアプリを作ったmikanの宇佐美峻さんによれば、従来2000〜3000単語の学習に1〜3カ月かかっていた時間を、1日1000単語にまで縮めることができるという。実際、2014年7月から9月にかけて宇佐美さんら創業メンバーは、北海道から鹿児島県まで全国22都道府県28都市で、英語合宿を実施して、実地でアプリの有効性を検証。合計200名以上の参加者で、合宿終了時の4択問題による最終定着率の平均が81%となったという。合宿で学習した単語はTOEFL85点以上、TOEIC800点以上を目指す人向けの難易度が高い単語だったというから、学校の英語教育で学習するボキャブラリーに上積みする数千語という中級レベルでの結果で良好な結果が出ていると言えるのかもしれない。もっと多くのユーザーの声が聞こえてこないことにはなんとも言えない部分はあると思うけど、今度こそ英語をやるぞと思った読者は、ダウンロードして試してみてはどうだろうか。