テキストの要約を自動的に作るTextTeaserがオープンソースになって再出発

テキストの要約を作るためのAPI TextTeaserは、昨年10月に本誌TechCrunchも紹介したが、これからはオープンソースになってGitHubで入手できる。作者のJolo Balbinによると、オープンソースにすることを決めたのは、とくにAPIのスケーラビリティの問題にぶつかったからだ、という。

そこで彼はAPIを取り下げ、TextTeaserを書きなおして、その自動要約プロセスの高速化を図った。そしてデベロッパには二つのプランを提供する。ひとつは、記事1000件の要約につき12ドル。もうひとつは企業向けに、記事を保存する専用のサーバを提供して月額料金250ドルだ。このプランでは記事を要約するたびにTextTeaserがテキスト中のキーワードを学習し、それによってその後の要約結果を改良する。

“この場合はユーザがTextTeaserを教育して、自分好みの要約ツールへと育てる。ユーザはカテゴリや記事のソース(出所)を教えてやることによって、要約のクォリティをアップする。今後は、各キーワードに重要度の重みをつけたい”、とBalbinは説明する。

GistなどのニューズリーダーアプリがTextTeaserを統合している。Balbinは、金融や医療や法務などの専門的なドキュメント向けに最適化していきたい、と言っている。これらの分野のドキュメントは、長くて難解であることで悪名高い。

TextTeaserの仕事ぶりを見てみたい人は、この“The Hunger Games”の要約や、Balbin自身のブログ記事をご覧あれ。

画像: Flickr/Mo Riza; Creative Commons 2.0のライセンスによる

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。