大量の一般公開データセットを検索できるGoogle Dataset Searchがベータから公式リリースへ

Google(グーグル)は米国時間1月23日、Dataset Searchのベータ終了を発表した。この一般に公開されている2500万近いデータの集合を検索できるサービスは、2018年の9月にローンチした

研究者たちが利用できるこれらのデータセットは、オランダに2010年から2018年まで猫が何匹いたかといった小さなものから、自分たちの仮説をチェックしたり機械学習のモデルを訓練およびテストするための、注釈入りのオーディオと画像の大型集合までいろいろだ。このツールは現在、約600万のテーブルを索引データ化している。

今回のリリースからDataset Searchにはモバイルバージョンが加わり、新機能も追加された。まず第一に、テーブル、画像、テキストなどデータのタイプを指定するフィルターだ。もちろんこれで求めるデータが見つけやすくなる。また、データセットに関する情報が増え、その出どころも明記された。

検索インデックスの中のデータの多くは、政府の省庁が出どころだ。現在インデックス中のデータとしては、米国政府のデータセットが約2百万件ある。ただしGoogleのKaggleも頻繁に姿を見せるし、そのほかの公共および民間の団体もデータを提供している。

Googleによれば、面白いデータセットを持ってる人は誰でも、それを提供して索引データ化してもらえる。そのプロセスには、データを詳しく説明できるschema.orgの標準マークアップが使われる。

[原文へ]

(翻訳:iwatani、a.k.a. hiwa

米上院、ロシア製セキュリティーソフト、カスペルスキーの政府内利用禁止を可決

先週、米国国土安全保障省が発行した、Kaspersky Labのセキュリティー・ソフトウェアの行政機関での利用を禁止する命令を受け、上院もこれを支持した。月曜日(米国時間9/18)上院は、ニューハンプシャー州選出民主党議員 Jeanne Shaheenが提出したKaspersky Lab排除の修正法案を通過させた。

修正法案は、木曜日(9/14)の発声投票を経て、国防授権法(NDAA)に付加された。上院軍事委員会のメンバーでもあるShaheenは、今月New York Timesに論説記事を書き、Kasperskyの排除を主張していた。

「わが国の安全に対する深刻な脆弱性を取り除く私の修正法案を、上院が超党派的に支持したことを非常にうれしく思う」と、法案通過を伝えるプレスリリースでShaheenが語った。「連邦政府の全コンピューターからKaspersky Labのソフトウェアを除去するという私の訴えを聞き入れてくれたトランプ政権に拍手を送りたい」

「この禁止令が法律の一部となり、連邦政府全体に拡大することが重要だ。私の修正法案はそのためにある。この法案が、党派を超え二院一体となった支持を得てることから、近く法制化することに私は楽観的だ」。

[原文へ]

(翻訳:Nob Takahashi / facebook