推論過程をGPUで加速するAmazon Elastic Inferenceはディープラーニングのコストを75%削減する

Amazon Web Servicesが今日、Amazon EC2のどんなインスタンスでもGPUによる推論の加速ができるサービスAmazon Elastic Inferenceを発表した。これにより、ディープラーニングのコストが最大75%削減できるという。

AWSのCEO Andy Jassyは、今朝のAWS re:Inventのステージでこう述べた: “従来のP3インスタンス（GPU常備のインスタンス）では通常、GPUの利用率がせいぜい10%から30%ぐらいで、エラスティックな推論用としては無駄が多い。それだけの費用やGPUを、無駄に使うべきではない。Amazon Elastic Inferenceでは、もっと費用効率の良い方法で推論エンジンを動かせるから、きわめて画期的なサービスだ”。

Amazon Elastic Inferenceは、モデルの作成/学習ツールAmazon SageMakerのノートブックインスタンスとエンドポイント用にも利用でき、“内蔵アルゴリズムとディープラーニングの環境を加速できる”、と同社はブログ記事で言っている。機械学習のフレームワークは、TensorFlow, Apache MXNet, そしてONNXをサポートしている。

[顧客の皆様には、仕事の性質に合った正しいツールを使っていただきたい。このたび発表するAmazon Elastic Inferenceを使うと、エラスティックな（伸縮性のある）GPUサポートを加えて、どんなEC2インスタンスの上でもスケーラブルな推論ができ、大幅な経費節約が可能だ。]

We want our customers to have the right tools for the right job. We are pleased to announce Amazon Elastic Inference to allow customers to add elastic GPU support for scalable inference on any EC2 instance, to get great cost savings. #reInvent pic.twitter.com/7rbaM5O5QF

— AWS re:Invent (@AWSreInvent) November 28, 2018

三つのサイズが提供されている:
（混合精度, mixed-precision, FP16とFP32の併用使い分け）

eia1.medium: 8 TeraFLOPsの混合精度パフォーマンス
eia1.large: 16 TeraFLOPsの混合精度パフォーマンス
eia1.xlarge: 32 TeraFLOPsの混合精度パフォーマンス

この新しいサービスを詳しく知りたい方は、こちらへ。

[原文へ]
（翻訳：iwatani(a.k.a. hiwa）

投稿者:

TechCrunch Japan