Googleが機械学習のためのデータ可視化ツールEmbedding Projectorをオープンソース化

main-qimg-5f48d8daf87ff55bd5d230b42939cc7c

今朝、GoogleはデータビジュアライゼーションツールEmbedding Projectorをオープンソース化すると発表した。このツールは機械学習の研究者がTensorFlowをインストールして走らせなくとも、データを可視化するためのツールだ。

次元やベクトルといった概念は、誰もが簡単に理解できるものではないだろう。問題は私たちが3次元の世界に生きていることだ。私たちは縦、横、高さがあると知っているため、4次元、5次元、6次元がどのようなものか想像するのが難しい。クリストファー・ノーランのインターステラーに登場した多次元の世界が奇妙に思えるのはそのためだ。

次元を私たちがいる世界のことと考えるのではなく、データだけについて考えてみよう。例えば、2つの家を比べると場合を考えてみてほしい。比較するために、それぞれの家の異なる点のリストを作成するだろう。リストには色、広さ、屋根の種類、庭の形の項目があるとする。このデータは4次元モデルで表すことができる。

データを表にすることができるが、絵で表すこともできる。それにはベクトルが必要だ。2つの家を比較するシンプルな4次元モデルなら、PowerPointのX軸Y軸とバブルの大きさ、色を使って作成することができるだろう。

ただ何千と次元のある複雑なモデルでは、既存のツールで描くのは難しい。そこでGoogleのEmbedding Projectorの出番となる。

embedding-mnist

SpotifyのDiscover Weekly機能を使ったことがあるなら、気づかずにEmbeddingsを体験している。高度な機械学習では、曲の属性をベクトルの地図で表すことができる。すべての楽曲を地図化し、個別リスナーの好みと照らし合わせることで、個人に合わせて正確な楽曲のレコメンドができるのだ。これはさすがにPowerPointではできない。

[原文へ]

(翻訳:Nozomi Okuma /Website

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。