AWSのサーバー問題で、Instagram、Vine、Airbnb、IFTTTらがダウン

休日の残った時間、みんなが何をしていたのかをInstagramやVineで見て過ごそうとしてた人たちは、おそらく苦労したことだろう。どちらのサービスも1時間以上停止していた。おそらく、Amazon Web Servicesの問題のために。

はじめにこの問題をTwitterで公式に認めたのはInstagramで、Vineが約30分後に続いた

サービスの不具合に対するツイートの波は、東海岸時刻午後4時頃から始まり、料理の写真や念入りに仕上げたビデオをシェアできなくなったことをユーザーが知るにつれ、苦情は増えるばかりだった。さらにTwitterを探ると、Amazon Web Servicesに依存している他のサービス — NetflixIFTTT Heroku、およびAirbnb等 — も同じ問題を経験しているようだ。現時点で、InstagramとVineは、徐々に復旧しつつあり、Netflixのダウンを嘆くツイートもおさまったきたが、IFTTTのウェブサイトは未だに普通状態だ。

Amazon Web Servicesのダッシュボードをざっと見たところ、同社のノースバージニア・データセンターに何らかの問題があり、それがすべての根源のようだ(Airbnbが、今日午後のツイートで状況を確認した)。Amazonは、EC2、リレーショナルデータベース、およびロードバランサーの問題について過去2時間律儀に報告を続けているが、最新情報によると、彼らは根本的問題を突き止め、現在残る混乱の解決につとめているようだ。Amazonは、EC2で起きたことを最初に解明した認識した。

西海岸時刻午後2:21、われわれは性能問題の根本原因を突き止め、これを修復した。EBS下のインスタンスは現在正常に稼働している。影響のあったボリュームの大部分は通常通り運行しており、現在、未だに性能低下の見られるインスタンスやボリュームの改善につとめている。

次に、ロードバランサーの問題に触れた。

西海岸時刻午後2:45、われわれは1カ所のAvailability Zoneのロードバランサーに影響を与えていた接続性問題の根本原因を突き止め、これを修復した。複数のAvailability Zoneにおけるバックエンドインスタンスのロードバランサーに関する接続性問題が緩和された。引き続き問題のあるロードバランサーの改善につとめている。

ともあれ、最悪の状態は回避されたようだが、今後も本誌は最新状態のチェックを続ける。みなさんにおかれては、これらのサービスに費やせなかった時間を賢く過ごした(=Twitterで不平をこぼすだけでなく)ことと期待している。

原文へ
 (翻訳:Nob Takahashi)