来日中のDuolingo CEO、安価で手軽な語学検定アプリ提供でTOEICもディスラプトする予定と明かす

2週間前に日本語版をローンチして話題の語学学習サービス「Duolingo」(デュオリンゴ)の創業者でCEOのルイス・フォン・アン氏が来日中で、東京・六本木で話を聞く機会があった。ルイスは1979年、ガテマラ生まれの連続起業家。カーネギーメロン大学のコンピューターサイエンス学部の准教授でもあり、人間とコンピューターが協力することで大規模な課題を解くシステムについての実装や論文で、数々の受賞歴がある。

TechCrunch Japan読者なら彼の名前をreCAPTCHAの発案者として覚えているかもしれない。ユーザー登録画面などでランダムに歪曲された文字列が表示されることがあるが、CAPTCHAと呼ばれるこの仕組みを、古文書のデジタル化というOCRだけで処理できない問題に結び付けるというのがreCAPTCHAだ。古文書の3割ぐらいはかすれや日焼けによる変色などで機械的に読み取りができないが、人間ならかなり読み取れる。CAPTCHAによって無駄に浪費される人間の脳時間(コンピュテーション)を有効活用するというのがreCAPTCHAのアイデアだ。ルイスが創業したreCAPTCHAはグーグルに2009年に買収され、今や10億人以上が解読作業に参加したことになるという。

そのルイスが、2011年に新たに起業して取り組んでいるのがDuolingoだ。Duolingoは一見単なる言語学習アプリ(サービス)だが、実際にはreCAPTCHA同様に大規模に分散した人間の労力を集約することで、アルゴリズム的なアプローチがうまくいかない課題を解決するというアイデアがベースにある。外国語学習産業という大きな市場を、翻訳という別の市場と結び付けるのがDuolingoのミソで、学習者は無償で外国語学習ができる一方、Duolingoは学習者の訳文作りという学習を活かして安価な翻訳サービスを提供できる。先日のシリーズCも含めて、すでに3800万ドルほどの資金を調達している注目株だ。

CNNのスペイン語版はDuolingo 100%

もうDuolingoに登録して試した人も多いかもしれないけど、ぼく自身は半年ほど前に英語版サービスでフランス語を学習するというコースを試してみた。ただ、どうして大学でフランス語の成績が「可」だったぼくが一所懸命に翻訳するろくでもない英文の訳文が、対価を生むような翻訳市場と結び付くのか良く分かからなかった。これは「reCAPTCHAと同モデル」と想定したことから来る誤解だったようだ。

ルイスによれば、Duolingoには学習コンテンツと翻訳コンテンツという2種類の明確に別々のコンテンツがあるそうだ。reCAPTCHAの印象から「言語学習の課題を解くと、知らず知らずのうちに翻訳作業に協力していた」というモデルかと想像していたけど、実は参加者は明示的に翻訳作業を参加することになるという意味で、だいぶreCAPTCHAとは違うモデルなのだそうだ。

2013年10月にはCNNやBuzzFeedと提携。CNNが提供しているスペイン語コンテンツは100%、Duolingoによる翻訳だそうだ。BuzzFeedについては、スペイン語、ポルトガル語、フランス語が全部Duolingoによる翻訳で、すでに毎日かなりの量の有償翻訳を行っているという。翻訳すべきコンテンツを持っているパブリッシャーからの収益が得られるので、Duolingoは学習者に対しては無償でサービスを提供でき、2、3年で黒字化できるだろうとルイスは言う。

翻訳すべきドキュメントはWikiのように参加者が書き換えられる。徐々に翻訳していき、一定の人が個別の訳文にOKを出したら、そのセンテンスの翻訳は完了となる。翻訳すべきコンテンツはユーザーの嗜好や実績などを考慮したアルゴリズムによって、各ユーザーにリコメンドされる。CNNのニュースのように速報性が必要なものは優先順位が高いとか、コンテンツ自体の評価が高いものが優先されるという風になっているそうだ。残り1行で翻訳が完了するコンテンツも優先されるなど、リコメンドのアルゴリズムは随時改善しているという。

「良いコンテンツ、短いコンテンツほど早く翻訳されます。CNNの例だと、平均800語のコンテンツは6時間で翻訳されます。翻訳料金はボリューム次第ですが、一般の翻訳料金の相場が1語あたり7〜8セントのところ、Duolingoは2〜4セント程度と半額程度です」

すでに収益を上げるモデルがあるものの、現在のDuolingoのフォーカスはパブリッシャー集めではなく、語学学習サービスとしての、より大きな成功という。

「現在、Duolingoのユーザー数は約2500万人。うち85%がモバイルで、Android、iPhoneが半分ずつ。いずれのプラットホームでも、多くの国で教育分野ナンバーワンアプリとなっています。ユーザーの30%が北米、30%が南米、30%がヨーロッパで、残りがその他の地域という分布です。まだアジアはこれから。中国語で英語を学ぶ、日本語で英語を学ぶという教材が登場したところです。日本語版のローンチは2週間前で、日本では2万7000ユーザーとなっています」

「ちょっとおもしろい数字があります。北米では公立学校で外国語学習している人の数より、すでにDuolingoで学習している人の数のほうがすでに多いんですね。すでに教育アプリでは2位に圧倒的な差を付けていて、オンライン語学学習サービスでは1位に成長しています。ですが、オンラインで語学を学習するといったとき、誰もがDuolingoの名前をすぐに思い浮かべるかと言えば、そんなことはありません。まだ誰もが認知するブランドにはなっていない。そうなるのが今いちばんの目標ですね」

進化する教材とコミュニティ

現在、Duolingoの教材にあるのは18言語。必ずしも2言語について両方向の教材が存在するわけではなく、「日本語→英語」のように一方向しかない言語の組み合わせもある。今のところDuolingo上で英語話者が日本語を学ぶことはできない。

年内には75コース、言語数にして30程度になる見込みという。入力メソッドが必要なアジアの言語を入力方法と合わせて教える教材の開発というのは、まだこれからのチャレンジだとルイスは話してくれた。

ちなみに、いま日本語で英語を学習すると、英文の直訳のような和文が課題に出てきて面食らう。「私の父は私の母を愛しています」というようなものだ。そもそも日本語がヘンだ。文法的にはあり得なくはなくても、こんなこと言うやつはいない。これには次のような事情があるようだ。

Duolingoには、まず全ての教材の元となる英語で書かれた例文集がある。新教材は、まずこれの翻訳をするところから作る。次にユーザーのアクティビティのメトリックスを取って、どこで躓いてるのか、どこで多くの学習者が間違えるのかといったデータやリアクションから、問題の追加、削除、順序の入れ替えなどを随時行っていくのだという。利用者は不自然な訳文について、コメントしたり議論したりといったこともできる。

単に間違った問題を排除するという以上のこともやるという。たとえば複数形よりも先に形容詞を学んだグループのほうが、成績が良いか? といったA/Bテストを1000人規模で行うなど、データドリブンなアプローチを採用しているのだとか。

「どういう方法が成功しているのかを大規模に検証もできますし、すでにDuolingoは学習効率が高いというデータもあります。Duolingoでの34時間の学習が、大学の1学期相当という報告があります」

コース教材はボランティアが作成しているが、バイリンガルのボランティアからの申し出は、これまで4万件に及ぶという。ボランティアは、なぜ自分がその言語教材作成に適格なのかを説明する必要があり、こうした申請の中から、特定言語の組みあせについて4、5人を選出して、彼らに教材のメンテを任せるのだそうだ。

TOEFLなど語学検定ビジネスをディスラプトしたい

翻訳市場でのマネタイズに加えて、もう1つ、収益モデルという意味で興味深いのが、今後1カ月程度で「Duolingo Test」と呼ぶ標準テストをローンチ予定という話だ。

「Duolingoでは毎日感謝のメールをたくさん受け取っています。その中でも多いのが、次のようなメールです。“これまで英語学習は高価だったけど、Duolingoのおかげで英語ができるようになった。とても感謝しています。でも今は別の問題があるんです。英語ができるようになったことを証明したいんですよ”。そこでわれわれは半年ほど前から標準テストについて検討を始めました」

特に需要の高い第二言語としての英語についていえば、TOEFLのように標準化された検定試験というものは存在しているが、ルイスは、この市場はディスラプトされる潮時だという。

「Duolingoとスマートフォンによって言語学習ができるようになった人は途上国にも多い。こうした国だと、TOEFLの200ドルとか300ドルといった検定料は月給に相当する額。原価はそんなにかかるわけがないので非常に高い。しかも、大都市に住んでなければ試験会場に行くのに数時間かかることもあります。いま、Duolingo Testという名前でベータテストをしているアプリがあります。これは受験料が20ドル、時間も20分あればスマートフォンだけで受験できる語学検定です」

現在、一般的な英語の検定が2時間とか4時間と長時間に及ぶのに対して、Duolingo Testが20分と時間が短いのは受験者のレベルに応じてリアルタイムに出題の難易度を変えるアダプティブなテストだからだそうだ。第1問目は中位のレベルの問題を出し、正解を続ける限りレベルを上げていき、逆に受験者のレベルが出題より低いと判定されれば難易度の低い問題群から出題するという方式だ。ちなみに同じくアダプティブテストで受験者の特定ジャンルの知識レベルを計るスタートアップに米東海岸のSmartererというのがあるけれど、彼らは最短10問、120秒程度で人事採用に必要な検定試験が可能だと言ってたりする。

短時間でテスト可能というと、逆に精度が気になるところ。Duolingoが内部的に行ったテストではDuolingo Testの結果とTOEFLのスコアの間には高い相関があることが分かっていて、「普及には数年かかると思うが、これは普及すると思う」とルイスは話している。日本ではTOEFLよりTOEICがメジャーだという話をしたら、モチロンそれは知っているし、TOEFL同様にディスラプト対象だねという答だった。まあ、20世紀前半に生まれたマークシート方式という古い技術を受験生に押し付けてるようじゃディスラプトされて当然だね。

一方、スマフォだとチートが簡単にできそうだが、「チート対策はカメラをオンにして動画と音声を撮ることを考えています」という。

「テスト結果だけではなく、録画データも人間が見るという方式です。実は今のオフラインの検定には受験コストの問題だけではなく、チートの横行という問題もあります。替え玉や賄賂がまかり通ってる国もあるんです。途上国には賄賂が日常の光景というところがあって、すでに検定に300ドルも払ってるのだし、もう100ドル試験官に払っちゃえよ、ということになりがちなんですね。Duolingo Testでは録画した動画をオンラインで発行する検定証につけておくことで、たとえば企業の採用担当者が見られるようにするということも考えています」

Duolingoは1カ月以内にAndroid版を出し、その後にiPhone版もリリース予定という。

スピーキング対応は、非同期型で?

Duolingoの一部の教材にはスピーキングも含まれているが、会話練習のコンテンツへのニーズが強いそうだ。こうした声に応えてDuolingoでは1年ほど前から会話練習モジュールを計画しているという。

「たとえば、学習者同士をペアにマッチングして動画チャットするというのが自明のアイデアです。ただ、この市場を少し調べてみて、すぐに赤信号がともりました。動画チャットによるモデルは全然上手く行っていないんですね、みんなやったほうがいいというんですけど」

「このジャンルだとVerblingが最大規模ですが、トラフィックで言えばわれわれの50分の1程度。結局、話すことがないのが問題なのです。ほとんど話せない外国語で、見ず知らずのヒトと話すというのはハードルが高い。初心者だと、挨拶をして名前を名乗ると終わり。もう話すことがなくなるんです」

「だから単なる動画チャットをやろうと思いません。何か違うことをやろうと思っています。リアルタイム性がダメなんじゃないかと思うんです。タイプするのかしゃべるのかは別にして、リアルタイムに応答しなくてもいいチャットやメッセージングのようなものがいいのでは、と考えています。非同期の会話です。ほかにも、2、3の単語から完成形のセンテンスを作って提案するような機能を付けるといったことを検討しています」

語学である必然性はないので、ほかの教育分野への進出も

Duolingoのように学習者と課題を結び付ける学習プラットホームというのは、なにも外国語学習にだけ適用できる問題でもない。ルイスは「今後、ほかの教育分野に進出するかもしれない」と話す。

「(reCaptchaのときと違って)Duolingoを(Googleなどに)売る気はないですね。理想的には成長を続けて、言語に関わることは全部やりたいのです。翻訳や検定もそうですし、マイナー言語の保存ということもやりたいです。それから、ほかの教育分野に参入するかもしれません」

「もちろん全てではないでしょうけど、今後、スマフォ経由で非常に幅広い教育というのがなされるようになると思います。それはたぶんMOOCsのようなものではありません。1時間の動画を見て学習する、というモデルではなく、Duolingoのようにゲームのようなものでしょう。5分とか10分、列に並んでるときにちょっとやるというようなもの。それがスマフォネイティブなモデルでしょうね。言語以外だとプログラミングはいいですね。Codeacademyなどは、すごくいいサービスで好きですが、アプリじゃないですよね。プログラミングをスマフォネイティブで学習するということは、まだ誰もやっていません」

確かに、MOOCsは結局のところ放っておいても教科書で学習をする高学歴で勉強熱心な先進国の人々がコースを受ける主体で、しかもコースの終了率が極めて低いという話がある。

「語学である必然性はなく、ほかのジャンルにも参入する可能性はありますが、言語学習にもプログラミング学習にも共通する特徴があります。それは、この2つが学校外でも学習するものという点で、これは重要です。教育というのは、もう100年以上も変わってなくて、これからディスラプトが必要な分野でしょう。教師の役割というのは、学生の前であれこれしゃべるということから、質問に答えるというように変わっていくと思います。ただ、われわれは早い時期に学校向けのソリューションはやらないと意識的に決断したのです。なぜなら、学校のことを考慮にいれると、カリキュラムとの齟齬が大きいと使われないし、いろいろ問題が出てきます。その点、外国語もプログラミングも学校でも学校外でも学習するものです。われわれは学校が何をやってるかなんて気にしません。学校よりもはるかに速いペースでイノベーションを起こすためにも、意図的に外国語学習を選んだのです」


投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。