GoogleのNgram Viewerが新機能を加えてアップデート, ワイルドカードも使える

Google Books Ngram Viewerに今日(米国時間10/17)一連の新しい機能が加わり、それによってこのツールは、コーパス言語学のさらに高度な研究に役立つようになった。それらは、ワイルドカードの使用、活用形の検索、大文字使用(capitalization)の多様な形式(後述)、などの機能だ。

このツールは2010年に実験的に立ち上げられ、これを使うとGoogleが数年かけてデジタイズした数百万もの書籍を検索できる。また、各ngramの使われ方(出現数)の経年変化を視覚化して見ることもできる(下図)。言葉に関心のある人たちや言語学の研究者たちのあいだで、たちまち人気になり、Googleがこのところ毎年春に行っている大掃除からも免れている。

今回の新しい機能を使うと、たとえば、英語の本の中で”President”という語に続く語の出現頻度を調べられる(最頻は”Kennedy”だった)。ワイルドカードは、名詞と動詞に関してはとくに指定しなくても使える。形容詞と副詞はだめだった。


(物理的同綴りだけでなく)活用形を検索してGoogleのライブラリを分析することも、これからはできる。Googleの説明によると、この機能を使うとたとえば”changed roles“というフレーズのさまざまな変形の使われ方の、経年変化を見ることができる(現代の最頻形は”changing roles”だ)。

さまざまな大文字化のスタイルについても、見ることができる。これまでは、ユーザが+記号を使って、どのスタイルかを指定する必要があった。これからは単純に語を入力して、新たにできた”case-insensitive”(大文字小文字の別を無視)にチェックをを入れると、上のリンク先に見られるような新しい結果が得られる。

画像クレジット: nSeika

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))


投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。