Studio Ousiaが今日、Samsung Venture Investmentから1.5億円の資金を調達したことを発表した。Studio Ousiaは2016年4月にTechCrunch Japanでも取り上げたことがあるが、自然言語処理を得意とするスタートアップ企業だ。テキスト中に「ソフトバンク」という固有名詞があったときにそれが企業名なのか、野球チームのことを指しているかを区別するという「キーワード抽出」(アカデミックな世界ではエンティティ・リンキングと呼ぶそうだ)の技術や、質問応答システムの「QA Engine」などを開発している。
Studio OusiaのQA Engineは、従来からあるBM25やTF-IDFといった情報検索手法に加えて、最近ディープラーニングの文脈で注目されているCNN(Convolutional Neural Networks)を使っている。与えられた自然言語による質問文に対して、正解となる回答を予測できる。
2016年6月に開催されたNAACL(North American Chapter of the Association for Computational Linguistics)主催の歴史、文学、科学、芸術などの知識を問うクイズ・コンテストでは85問中64問に正答して優勝。2位の22問正解に対して大きく差を付けたといい、Ousiaによれば、この差は開発済みのキーワード抽出技術を使った成果でもあるという。
以下のNAACLのコンテストの様子を伝える動画で、Ousiaの技術概要の説明と、3人のクイズの得意なアメリカ人学生とOusiaのクイズ対決がみられる。IBMのWatsonが人気クイズ番組の歴代チャンピオンに勝ったときの映像を彷彿とさせる白熱具合だ。ちなみに2011年にIBM Watsonがクイズチャンピオンを負かしたときは2880個のプロセッサと16TBのメモリを搭載したモンスターマシンを使っていたが、Ousiaは学習時にGPUを使った以外は「普通のサーバー」でQA Engine動かしているそうだから、隔世の感がある。
ちなみにこのNAACLの大会で2位になったシステムですら、かつて人間のクイズチャンピオンとしてIBM Watsonに負けたという意味での「歴史的チャンピオン」となったケン・ジェニングスを打ち負かしているそうだから、なんだかもうクイズに関しては全く人間の出る幕は全くない感じだね。
Ousiaでは、このQA Engineは企業のコールセンターの回答支援システムや、人材マッチング、チャットボットに応用できる要素技術として、APIサービスとして提供していく予定という。すでに2017年1月にはチャットサポートの自動応答でクラウド会計のfreeeとの協業を発表している。Studio Ousiaは2007年創業で、これまでエヌアイディ、ニッセイ・キャピタルなどから累計2億円を調達している。