TextioのCEO Kieran Snyderは大学で、定量的言語学研究を専攻した。だから彼女と協同ファウンダのJensen HarrisがMicrosoftを去って新しい会社を始めたとき、それが言語を軸とする企業になったのも、当然の成り行きだった。
かくして、一定の状況における、テキスト中の語句のパフォーマンスを分析するスタートアップTextioが誕生した。同社は今日(米国時間12/16)、Emergence Capitalが率いるラウンドで800万ドルを調達したことを発表した。Cowboy VenturesとBloomberg Beta、およびUpside Partnershipがこのラウンドに参加した。
Snyderは語る: “テキスト中の語句の処理は相当長らくディスラプトされていない、と前から感じていた。コンピュータ処理のユーザインタフェイスはコマンドラインからGUIに変わったけれども、処理の中身が変わっていない。インターネットがやってきて、ソーシャルとか共有の時代になった。そのことをベースに、AIとその関連技術が、テキストに対する次の大きなディスラプターになるだろう。ドキュメントのパフォーマンスが発表前に分かれば、それを直してから発表できるようになる”。
Textioの最初のツールは、人材獲得、たとえばジョブポスティング(job postings, 求人票, 求人広告)のためのドキュメントが対象だ。それらのドキュメントのパフォーマンスとは、良い人材がたくさん集まるかどうかだ。言葉を適切に選び、良いレイアウトをすれば、多くの求職者の関心を集めることができる。そこで同社のサービスは、ドキュメントに対する予測的分析を行う。たとえばそのツールでは、要点が箇条書きになっているジョブポスティングは、文章だけのよりもパフォーマンスが良い、という結果が出ている。
もちろん、テキストのパフォーマンスは、メールや履歴書など、そのほかのドキュメントでも重要だし、Textioのツールが十分に使える分野だ。いろんな文書に対して、テキストの効果を採点する技術を応用できることが、投資家にとって、同社の魅力だ。
そして、もうひとつ、投資家にとって価値があるのは、同社の顧客だ。Textioはすでに、Twitter, Atlassian, Starbucks, Square, それにMicrosoftなどが利用している。自然言語処理(Natural Language Processing, NLP)の技術は…出来の良いものであれば…応用範囲がきわめて広いから、投資家という蜂たちにとっては、蜜の豊富な花なのだ。
Textioの予測的分析技術は、6万あまりの語句(語とフレーズ)を認識する。Snyderによれば、そのデータ集合は継続的な運用を通じてコンスタントに変化している。この技術はたとえば、語の並びを分析する(“このフレーズは動詞が重い(難解である)”とか)。ドキュメントの構文関連の特性も分析する。それらの分析結果を合わせて、現状のドキュメントを採点し、そのドキュメントが目的をどれぐらい達成しそうか、を評価する。
Textioは言語学の専門家が使うわけではないから、使いやすさが重要だ。だからドキュメントの評価を文章ではなく高輝度表示やドロップダウンボックスを利用して行う。ユーザはNLPの専門家でもないから、このツールの舞台裏で統計学が活躍していることも、ユーザはあまり感じていないようだ、とSnyderは言っている。
もちろん、NLPは昔も今もコンペティタが多い分野だ。大物ではIBMのWatsonがテキストの分析もやるし、そのAPIを上手に使えばTextioと同じようなことができるだろう。しかしSnyderがTextioの強みとして挙げるのは、技術の、コンテンツタイプ別のチューンナップだ。たとえば上述の、人材獲得用ドキュメントの場合のように。