テキストの要約を自動的に作るTextTeaserがオープンソースになって再出発

テキストの要約を作るためのAPI TextTeaserは、昨年10月に本誌TechCrunchも紹介したが、これからはオープンソースになってGitHubで入手できる。作者のJolo Balbinによると、オープンソースにすることを決めたのは、とくにAPIのスケーラビリティの問題にぶつかったからだ、という。

そこで彼はAPIを取り下げ、TextTeaserを書きなおして、その自動要約プロセスの高速化を図った。そしてデベロッパには二つのプランを提供する。ひとつは、記事1000件の要約につき12ドル。もうひとつは企業向けに、記事を保存する専用のサーバを提供して月額料金250ドルだ。このプランでは記事を要約するたびにTextTeaserがテキスト中のキーワードを学習し、それによってその後の要約結果を改良する。

“この場合はユーザがTextTeaserを教育して、自分好みの要約ツールへと育てる。ユーザはカテゴリや記事のソース(出所)を教えてやることによって、要約のクォリティをアップする。今後は、各キーワードに重要度の重みをつけたい”、とBalbinは説明する。

GistなどのニューズリーダーアプリがTextTeaserを統合している。Balbinは、金融や医療や法務などの専門的なドキュメント向けに最適化していきたい、と言っている。これらの分野のドキュメントは、長くて難解であることで悪名高い。

TextTeaserの仕事ぶりを見てみたい人は、この“The Hunger Games”の要約や、Balbin自身のブログ記事をご覧あれ。

画像: Flickr/Mo Riza; Creative Commons 2.0のライセンスによる

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))