Google Books Ngram Viewerに今日(米国時間10/17)一連の新しい機能が加わり、それによってこのツールは、コーパス言語学のさらに高度な研究に役立つようになった。それらは、ワイルドカードの使用、活用形の検索、大文字使用(capitalization)の多様な形式(後述)、などの機能だ。
このツールは2010年に実験的に立ち上げられ、これを使うとGoogleが数年かけてデジタイズした数百万もの書籍を検索できる。また、各ngramの使われ方(出現数)の経年変化を視覚化して見ることもできる(下図)。言葉に関心のある人たちや言語学の研究者たちのあいだで、たちまち人気になり、Googleがこのところ毎年春に行っている大掃除からも免れている。
今回の新しい機能を使うと、たとえば、英語の本の中で”President”という語に続く語の出現頻度を調べられる(最頻は”Kennedy”だった)。ワイルドカードは、名詞と動詞に関してはとくに指定しなくても使える。形容詞と副詞はだめだった。
(物理的同綴りだけでなく)活用形を検索してGoogleのライブラリを分析することも、これからはできる。Googleの説明によると、この機能を使うとたとえば”changed roles“というフレーズのさまざまな変形の使われ方の、経年変化を見ることができる(現代の最頻形は”changing roles”だ)。
さまざまな大文字化のスタイルについても、見ることができる。これまでは、ユーザが+記号を使って、どのスタイルかを指定する必要があった。これからは単純に語を入力して、新たにできた”case-insensitive”(大文字小文字の別を無視)にチェックをを入れると、上のリンク先に見られるような新しい結果が得られる。
画像クレジット: nSeika
[原文へ]
(翻訳:iwatani(a.k.a. hiwa))