マイクロソフトがクラウド用データ圧縮アルゴリズムとハードウェアをオープンソース化

現在、大手のクラウドコンピューティングのプロバイダが保管しているデータ量は驚愕すべきレベルに達している。そのため、ほとんどの場合、情報はなんらかの方法によって圧縮された状態で保存されているはずだ。それはフロッピーやCD-ROM、低速通信の時代に、ユーザー自身がファイルをzip圧縮していたのと同じようなもの。通常、そのようなシステムは、厳重に秘密のベールで守られている。しかし米国時間3月14日、Microsoft(マイクロソフト)はAzureクラウドで実際に使われている圧縮アルゴリズム、ハードウェア仕様、そしてその回路図を記述するVerilogのソースコードをオープンソース化した。それらすべてをOpen Compute Project(OCP)に寄託したのだ。

Project ZiplineとMicrosoftが呼ぶこのプロジェクトでは、標準的なZlib-L4 64KBモデルと比較して、2倍もの高圧縮率を達成することができる。それを実現するため、Microsoftが実際にクラウド内で扱っている大きなデータセットの性質に合わせて、アルゴリズムと、そのハードウェア実装を念入りにチューンしてある。この仕組みは、システムレベルで動作するため、実質的なオーバーヘッドはない。Microsoftによれば、現在利用可能な他のアルゴリズムと比べても、実際に高いスループットと低いレイテンシを実現できているという。

Microsoftは、これらすべてを機能させるために必要な、レジスタ転送言語(RTL)用のVerilogソースコードも寄託している点を力説する。「これだけ詳細なレベルでRTLをオープンソースとしてOCPに寄託するのは、業界を先導するものです」と、Azureハードウェアインフラストラクチャのゼネラルマネージャ、Kushagra Vaid氏は述べる。「OCPのエコシステム内の新技術に関するスムーズなコラボレーションを推進し、シリコンレベルのハードウェア革新への扉を開く、新たな先例となるものです」。

Microsoftは現在、このシステムを自らのAzureクラウドで使用しているが、Open Compute Projectに参加する他社との提携も始めている。 そうしたパートナーとしては、Intel、AMD、Ampere、Arm、Marvell、SiFive、Broadcom、Fungible、Mellanox、NGD System、Pure Storage、Synopsys、それにCadenceが挙げられる。

「そのうちに、Project Ziplineの圧縮技術が、さまざまな市場セグメントに浸透するものと期待しています。ネットワークデータ処理、スマートSSD、アーカイブシステム、クラウドアプライアンス、汎用マイクロプロセッサ、IoT、エッジデバイスなど、幅広い用途が考えられます」と、Vaid氏は述べている。

画像クレジット:JLPH/Getty Images

原文へ

(翻訳:Fumihiko Shibata)

投稿者:

TechCrunch Japan

TechCrunchは2005年にシリコンバレーでスタートし、スタートアップ企業の紹介やインターネットの新しいプロダクトのレビュー、そして業界の重要なニュースを扱うテクノロジーメディアとして成長してきました。現在、米国を始め、欧州、アジア地域のテクノロジー業界の話題をカバーしています。そして、米国では2010年9月に世界的なオンラインメディア企業のAOLの傘下となりその運営が続けられています。 日本では2006年6月から翻訳版となるTechCrunch Japanが産声を上げてスタートしています。その後、日本でのオリジナル記事の投稿やイベントなどを開催しています。なお、TechCrunch Japanも2011年4月1日より米国と同様に米AOLの日本法人AOLオンライン・ジャパンにより運営されています。