Amazon Web Services(AWS)がそのElastic Map ReduceプラットホームをアップデートしてHadoopの新バージョンを導入するとともに、同社のデータ分析エコシステムのサポートをアップデートした。
Elastic Map Reduceは、大量のデータを処理するためのAWSのプラットホームだが、ほかのベンダと違ってAWS自身がホストするサービスであるため、Hadoopとその周辺のエコシステムを、それらオープンソースのプラットホームの更新とペースを合わせてアップデートすることが重要な課題となる。
今回の最新アップデートではHadoopを2.2にアップデートし、またHive、Pig、HBase、MahoutなどHadoopの同伴技術もバージョンを新たにした。AWSのブログ記事によると、それによりクラスタの始動時間が短縮され、データの拡大能力が強化され、マッパーM7がサポートされるようになった。MapR M7は、Hadoop用のNoSQLデータベースHBaseの有料サービスだ。
Elastic Map Reduceの今回のアップデートには、 Hadoop MapReduceの次世代アーキテクチャYARNのサポートも含まれる。
これはAWSの大型アップデートであり、Hadoopだけでなく、ここ数年で築かれたエコシステム全体をカバーする。Hadoopはファイルベースのシステムであり、データベースとしてはHBaseを必要とする。Pigは分析プラットホームであり、多くの場合ETL(Extract/Transform /Load)処理で使われ、そしてMahoutは機械学習ライブラリだ。
AWSはこのところ、データ分析技術のサポートにますます力を入れている。先週BI(ビジネスインテリジェンス)プロバイダのJaspersoftがElastic Map Reduceをサポートするようになったのも、そのことの成果だ。JasperはAWSとの付き合いが長く、AWS Marketplaceで入手できるそのサービスには、すでに500社の顧客企業がいる。
[原文へ]
(翻訳:iwatani(a.k.a. hiwa))