Googleは本日 Cloud Datalabをローンチした。これは開発者向けのツールで、数回のクリックでデータの探索や分析、可視化ができるものだ。Googleは、このサービスは開発者が「生のデータを探索して洞察を得たり、共有したり、レポート作成を速くシンプルに行うことができ、費用対効果も良いツールです」と伝える。
このサービスはJupyter notebooks (以前の名称はIPython)を活用しているため、コードを使ってデータから可視化したドキュメントを作成することができる。Jupyterはデータサイエンスの分野では良く知られていて、Jupyterの周辺にエコシステムが成長するまでになっている。そのため、このGoogleのツールを初めて使う場合でもいくらか分かりやすいだろう。
Cloud Datalabを使用することで開発者はGoogle BigQueryのCompute EngineやCloud Storageにあるデータの探索、加工、可視化、処理を行うことができる。開発者はPython、SQLやJavaScriptを利用できる(BigQueryの「user-defined functions(ユーザーが規定する機能)」)。これを軸に開発者はデータを使って、BigQueryにデプロイするためのデータパイプラインを構築したり、機械学習モデルを構築したりすることができる。
データを可視化するには、Google ChartingかPythonライブラリのmatplotlibが使用可能だ。
Cloud Datalabを使い始めるにはまずCloud DatalabをApp Engineアプリケーションとしてデプロイする。最初の無料ベータ期間を過ぎてサービスを利用する際には、ここから料金が発生する。(Googleはまだ利用料金は開示していない。)それが終わったら、新しいプロジェクトを始め、新規のノートブックを開くことができる。このサービスではユーザーに始め方を分かりやすく示すため、プレインストールされたノートブックが用意してある。
Cloud Datalabは、例えばAmazon QuickSightといった他のビジネス・インテリジェンスツールと重複する部分もある。ただ、今のところGoogleはこのサービスは「ビジネス・インテリジェンス」用でも、技術者でないユーザーをターゲットとしているのでもないようだ。
Datalabの良い点はオープンソースであり、拡張したいと考える開発者はフォークしたり、GitHubにプルリクエストをすることができることだ。
またCloud Datalabと共に、GoogleはGoogle Cloud Shellもローンチしたと発表している。これは開発者が、Google Developers ConsoleからGoogle Cloud Platform上の計算リソースにコマンドラインでアクセスできるようにするものだ。
どの開発者もGoogle Cloud Platformから新しいシェルを利用することができる。このシェルは一時的なCompute Engineの仮想マシンで動き、5GBの固定記録領域とGoogle Cloud SDKや他のツールへのアクセスが可能だ。
[原文へ]