Googlegが水曜日(米国時間9/5)に、“Dataset Search”(データセット検索)のローンチを発表した。それは、科学者やデータを追うジャーナリストを助けて、彼らがデータまみれのWebの中で数字の行間にあるストーリーを素早く見つけられるようにする。
さまざまなデータセットはこれまで一般的に、いろんな研究者や研究機関のWebサイトに分散して存在する。たとえば、ある気候現象に関するデータはNASAとNational Oceanic and Atmospheric Administration(NOAA)の両方に分散していたりする。特殊なデータは、ProPublicaに行かないとないかもしれない。Google検索には前からGoogle Scholarという専門家向けの検索サービスがあるが、Dataset Searchはそれをさらに改良して、一回の検索でこれら主要なデータソースを取り出せるようにする。
Googleはデータセットのプロバイダーへのガイドラインで、彼らのデータをもっと容易に見つかるようにするための、データや情報の提示の仕方を示唆している。そのやり方は、データをめぐるコラボレーションのためのコミュニティSchemaが作った、オープンソースのスタンダードをベースとし、データのプロバイダーに、データセットの作者や、データの収集方法、発表された日付、データの利用にあたっての条件、などの情報を含めるよう、求めている。
この新しい検索機能は、検索によるデータへのアクセスと可視性を増強するイニシアチブの第二部に相当し、これの前には、今年の初めに、ふつうの検索でデータジャーナリストが容易にデータを発見できるようにするための方法が、開発/提示された。