言語処理は学歴よりも言葉に対する実践的な能力が鍵と信ずるAylien, テキスト分析サービスをAPIで提供

テキストを扱うことは、プログラマにとって往々にして面倒な仕事だ。コードは曖昧であってはいけないが、テキストは曖昧性のかたまりであることが多い。そこでかねてから、AlchemyThomson Reutersといったあたりが自然言語処理(NLP)と機械学習のアルゴリズムを利用するサービスを提供して、文書からもっと容易に意味を取り出せるように、デベロッパの仕事を助けてきた。今回ご紹介するAylienも、独自のテキスト分析APIでこの競技に参戦してきたが、同社の場合それは、これから提供していく一連のデベロッパサービスの第一弾となるものだ。

サービスのファウンダはダブリン(アイルランド)のParsa Ghaffariで、Chinaccelerator支援している。Ghaffariによると、最初にこのアクセラレータ事業に応募したときには、NLPを使って今書いている文書から有意データを自動的に取り出すプロダクト、というアイデアを抱えていた。ところが、そのために利用できる基本技術がまだ存在しないことが分かった。そこで彼は基本技術の構築から始めることにし、そのための3年の努力の末、Aylienの立ち上げにたどり着いた。

デベロッパはこのAPIを使ってドキュメントから見出しや本文を素早く取り出すことができるが、そのほかに要約機能や、エンティティとコンセプトを取り出す機能、言語や感情の検出機能などがある。私の場合、個人的なプロジェクトにこのAPIを使ってみる機会が二度あったが、一部の例外を除いては、だいたい同社の効能書きどおりの仕事をしてくれた。ただし今のところ得意なのは英語のテキストだけで、たとえば、Googleのストリートビューの最近の拡張について書いたこのドイツ語の記事を、Aylienは100%の確信をもって、スポーツのカーリングに関する記事だ、と主張した*。同社は今、英語以外の言語のサポートに関しては‘鋭意努力中’である。〔*: カーリングではなくGoogle Mapsとホッキョクグマの保護に関する記事。同趣旨の英語の本誌記事に対してAylienは、‘自然科学-地理学’とラベルした…それは‘カーリング’ほど見当外れではない(笑)。たしかにGoogle Mapsは、地理の化け物だ。〕

このサービスを試用してみたい人は、ここへ行って、AylienのAPIデモに、何らかのテキストドキュメントのURLを与えてやるとよい。

データはすべてJSONで返され、同社はMashapeを、APIの有料利用のための窓口としている。ただしAPI呼び出しが1日に1000回未満なら無料だ。それ以上だと、1日6000回までが199ドルなどと課金される。既存の同種APIに比べると、やや安いと言える。

今Aylienは、ファウンダも含めて技術者3人だけの会社だが、PhD(博士号)の保有者は一人もいない。NLPのスタートアップとしては、かなり異例だ。Ghaffariは学術的学問的なNLPの世界と無縁ではないが、彼は、同社のような言葉に対する実践的なアプローチの場合、学歴はあまり役に立たない、と確信している。

同社の次のプロジェクトは、ニュース記事をフィルタするnews APIだ。またデベロッパサービスのために作ってきた技術を、いくつかの消費者向けプロダクトに応用することにも取り組んでいる。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


未来派プロセッサも含め全社をAI色に染め上げたいIntelが今度は自然言語認識のIndisysを買収

【抄訳】

Intelは、最近の同社において著しい、人工知能指向の姿勢を一層強化するために、ひそかに国際的な買収を行った。Intelがこのほど買収したIndisysはスペインのスタートアップで、自然言語の認識を専門とする。買収の条件は公表されていないが、噂では2000万ユーロよりも上、ということらしい。今回の買収のわずか2か月前には、IntelはイスラエルのジェスチャインタフェイスメーカーOmekを買収している(推定額4000万ドル)。

Intelは本誌に対してこの買収を確認し、社員も大半がIntel社員になる、と言った。広報がくれたメールには、こう書かれている:

“Intelはスペインセヴィルの非公開企業Indisysを買収した。Indisysの社員の大半はIntelに入社した。買収の合意は5月31日に成立し、このたび買収事務のすべてが完了した。”

価額など買収の条件については、“この取引の金額的な側面はIntelにとって重要でない”、ということだ。IndisysのCEOだったPilar Manchonは今、サンタクララにあるIntelのR&D部門にいる。

Intelの目当てが、どの技術、あるいはどの製品にあったのかも明らかでないが、“Indisysには計算機言語学、人工知能、認知科学、および機械学習に関する深い経験があるが、IntelがIndisysの技術を今後どのように利用していくかについて、現時点では詳細を明らかにできない”、と広報のメールは言っている。でもこの点に関しては、自明な事案がすでにいくつかある(後述)。

本誌宛のIntelの声明の前に、スペインの新聞には同社の初期の投資家Inveready社のニュースリリースが載り、その中でIntelへの売却が告げられていた。

Invereadyは今回の件についてはノーコメントだったが、これまで、スペインのスタートアップの出口を多く扱っている。たとえば同社が投資したPasswordBankは、Symantecが2500万ドルで買収した。なお、IntelのVC部門Intel Capitalも2012年に500万ドルのシリーズA資金をIndisysに投資している

セヴィルに本社のあるIndisysの対話システムは、小売大手のEl Corte Inglesや保険企業グループMapfre、銀行大手BBVAなどが、Webとモバイルの両方で利用している。

Indisysは自然言語認識技術を開発しているが、Siri的なインテリジェントアシスタント(intelligent assistant, IA)とその対話的インタフェイスも作っている。上の画像の”Maya”も、そんな“アシスタント”の一人だ。航空機メーカーのBoeingは同社のAtlantisと呼ばれるプロジェクトにIndisysのIA技術を採用し、無人機の操縦インタフェイスを作っている。

これまでの顧客は、多くがスペイン企業だが、同社はすでに多言語技術を開発している。Indisysの説明によると、“IAは人間のイメージであり、それが常識を伴って、複数のプラットホーム上および複数の言語で流暢に会話をする”、というものだ。

タッチインタフェイスのOmekを買収したことと合わせて考えると、今回の買収の目的は二つに絞られるだろう。ひとつは、“触(さわ)れる技術”を基盤とし、言語インタフェイスを人工知能が支える3Dによる視覚化。そしてもう一つは、音声(+言語)認識技術を同社の将来のプロセッサ事業に統合することだ。

今週初めにIntelが発表した自然言語ベースのジェスチャーデバイスにも示されているように、IntelはNuanceのようなサードパーティの技術をライセンスするという噂とは逆に、相次ぐ優良物件の買収による、自社技術の未来志向的な進化に、社運を託しているのだ。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))