Google Cloudが一時ダウン、多数のサービスに影響

Google Cloud Platformに障害が発生し、Snap、Discordを始めとするクラウド利用者や、Gmail、Nestなど数多くのGoogleサービスに影響を与えた。最初に問題を報告したのは米国東海岸のユーザーだったが、障害監視サイトの DownDetectorによると、ほかにも多くの地域が影響を受けている。

Google Cloud Platformに掲載された記事によると、Google Compute Engineで複数リージョンにかかわる問題が起きているという。

「現在米国東部で重度のネットワーク混雑が発生しており、Google Cloud上の複数のサービス、GSuite、YouTubeなどのサービスが影響を受けている。ユーザーは性能低下や断続的なエラーを経験する可能性がある。当社は混雑の主要因を突き止めたと考えており、短時間のうちに正常状態に戻る予定だ」と同社が声明で語った。

問題の影響範囲はGoogle自身のアプリケーションに限らない。Discord、Snap、VimeoなどGoogleクラウドサービスに依存しているシステムもすべて停止していることが一部のユーザーから報告されている。

【Japan編集部追記】日本語版記事公開時点で問題は解決済み。

[原文へ]

(翻訳:Nob Takahashi / facebook

Gmail、Googleドライブで全世界的な障害が発生中(2019年3月13日午後12時現在)

eng-logo-2015日本時間3月13日お昼前ごろより、メールサービスGmailや、クラウドストレージGoogle DriveといったGoogleのサービスに障害が発生している模様です。主な症状はGmailの「送受信がまったくできない」といったお手上げなものから、「テキストや画像を添付したメールの送受信はできるもののその他の添付ファイルがあると送信できない」、「メールを書いている途中にエラーになる」などさまざまです。

GoogleがG Stuiteサービスのパフォーマンス状況として提供している「G Suite ステータス ダッシュボード」によれば、障害が発生しているのはGmailとGoogle ドライブの2つだけの模様。添付ファイルの取り扱いでエラーが多いのはこのあたりが関係しているのかもしれません。

なお、障害は日本だけでなく、米国の東西海岸部、東南アジア、オーストラリア/ニュージーランドをはじめ世界中で影響が出ている模様です。リアルタイムな状況はダウンディテクターOutege.Reportなどで確認できるものの、障害発生マップはそれぞれのページで異なる傾向を示しているようなのであくまでもご参考程度に。

Engadget 日本版からの転載。

Amazon S3が停止した日―アナリストは冗長性の重要性を指摘

NEW YORK, NY - DECEMBER 14: Jeff Bezos, chief executive officer of Amazon, listens during a meeting of technology executives and President-elect Donald Trump at Trump Tower, December 14, 2016 in New York City. This is the first major meeting between President-elect Trump and technology industry leaders. (Photo by Drew Angerer/Getty Images)

昨日(米国時間2/28)、Amazonのバージニア州北部データセンターに障害が発生し、 AWS S3クラウド・ストレージ・サービスが4時間近くダウンしたというニュースはご存知のことと思う。その結果、有名なウェブサイトやサービスが停止し、大きな混乱が起きた。

念のため断っておけば、今朝、Amazonのダッシュボードはすべて正常に動作中であることを示している。

影響を被ったサイトやサービスにとっては大事件だったものの、Amazon S3は長年にわたって信頼性が高いサービスだったことは指摘しておくべきだろう。またバージニア州北部データセンターがダウンしても他の13のリージョンではS3は正常に作動した。

今回のS3のダウンのようなクラウド・サービスのダウンをモニターしているCloudHarmonyによれば、S3の動作記録はサービスレベル合意書((SLA)が保証する基準を上回っていたということだ。SLAによればS3は99.9%の稼働を約束しており、下回った場合については返金に応じるとしている。CloudHarmonyの調査では、同社が2014年にクラウド・サービスのモニターを開始して以來、AWS S3は年間でほぼ100%の稼働率を達成している。S3の目立った障害は2015年8月のダウンだった。

CloudHarmonyはMicrosoft Azureの仮想マシンとオブジェクト保管も2月19日に5時間にわたってダウンしたが昨日のS3の場合のような注目は集めていないと指摘する。

クラウド・コンピューティングの専門家、ジャーナリストのBen Kepesは「シアトルのAWS本社では夕べは誰も眠れなかっただろう。しかしこの種のダウンはときおりどうしても起きてしまう」と述べた。Kepesによれば、「AWSは他の同種のサービスと比較して隔絶して大きいパブリック・クラウド・サービスだ。そのためダウンすると各方面に非常に大きな影響を与える。昨日のダウンはいかに多くのサードパーティーがAWSのインフラに依存していたかを印象づけた。残念ながら、こうしたサービスはときおりダウンすることがある。ユーザーはこうした場合に対処する方法を準備しておく必要がある」という。

Kepesは「どんな場所であろうとダウンが起きることはITのプロなら誰でも知っている」 と付け加えた。しかしクラウドは通常地味なサービスでありダウンしても関係者以外には注目を引かない。「世間では大騒ぎしているが、事実はどんな公共サービスであろうと落ちるときは落ちる」という。

Forresterのアナリスト、Dave Bartolettiも同意見だ。彼は今回の事件はクラウド・サービスのユーザーに警鐘を鳴らすものだという。「ストレージに冗長性を持たせることが必要だ。ユーザーはクラウドにデータを保管してサイトやサービスを構築する場合、複数のレイヤーを利用する必要がある。ストレージはS3の特定のリージョンのみに依存してはならない」という。

ただしこれらのアナリストも今回のダウンで被害を受けたユーザーを非難しているわけではない。しかし冗長性というのはIT専門家がシステムに組み込むことを必須としてきた要素で、クラウドの場合でもなんら事情は変わらないという指摘だ。

しかしMoor Insight & Strategyのアナリスト、Patrick Moorheadは今回のダウンについてもっと厳しい意見を持っている。今回のダウンタイムはけっきょくのところ数百万ドルの損害をもたらしたはずで、Amazonは顧客の貴重なデータを保管するサービスを提供するからにはもっと高い冗長性をシステムに組み込んでいる必要があったという。

「パブリック・クラウドだからといってこうしたダウンが起きていい理由にはならない。銀行オンラインでダウンがほとんど起きないのは障害耐性が高いアーキテクチャを組み込んだシステムが構築されているからだ」という。

こうした批判の当否はともあれ、インハウスであろうとAWSのようなクラウドであろうとデータセンターの事故はサイトやサービスにとって死活問題だということは明らかになった。どんなアプローチであれ「これで絶対安全」とはならない。だからといってAWSの責任が否定されるわけではないが、少なくとも過去の運用記録からみればS3はきわめて信頼性の高いサービスの一つであったことは間違いない。

t画像: Drew Angerer/Getty Images

[原文へ]

(翻訳:滑川海彦@Facebook Google+

Atlassian、ユーザーにウェブサービスのダウンタイムなどを通知するStatusPageを買収

sp-welcome

Atlassianは本日StatusPage買収を発表した。StatusPageはY-Combinatorのインキュベートから誕生し、オンラインでビジネスを行う企業が自社のオンラインサービスの状況をユーザーに知らせるサービスを提供している。買収額などの詳細は開示されていない。

昨年12月に上場して以降、Atlassianにとって初の買収案件となる。3年前にローンチしたStatusPageのようなサービスを追加することは、 Atlassianにとっては自然な流れだ。 Atlassianはこれまで長い間、全ての企業はソフトウェア企業であると主張してきた。そのため全ての企業は、自社サービスが思うように機能していない時、ユーザーに随時情報を提供するサービスが必要となる。

Atlassianの会長であるJay Simonsは、StatusPageはHipChatを早い段階から活用していた企業の1社だと話す。AtlassianはHipChatを2012年に買収している。そして、AtlassianもStatusPageに自社のステータスページを開設している。StatusPageについてSimonsは「彼らの業界を牽引する立ち位置にとても期待しています」と話す。「彼らはこのようなサービスを提供する企業の筆頭として確立してきました」。

StatusPageは現在New RelicIntuitVenmo、Citrixを含む、何千ものカスタマーを抱えているという。

hero-compressed

Simonsはまた、例えばAtlassianのJIRAプロジェクト・マネジメントサービスとStatusPageが自然な形で連携することができると説明する。

StatusPageの共同ファウンダーであるScott Kleinは、彼の会社の状況は良かったとしている。ただ、今回の買収で、StatusPageはAtlassianの大きなユーザーベースへアクセスすることができ、StatusPageのプロダクト開発サイクルの加速につなげることができるという。本日の正式発表でStatusPageの共同ファウンダーは、チームで買収を検討するにあたり「3つの重要な点で一致していることが分かりました。それは補完し合う組織文化、StatusPageをスタンドアローンのプロダクトとして提供し続ける方向性、そしてソフトウェアの未来について共通のビジョンを持っていることです」。

Simonsはさらに「今回の買収に合意したもう1つの要素は、StatusPageもAtlassianと同じようにFortune500だけでなく、Fortune50万の企業にリーチすることにとても注力しているからです」と続けた。結局のところComcastのような大企業であれば、自社でステータスをアラートするシステムを構築することができる。「しかしFortune 500ではない企業は、StatusPageのようなサービスを求めています」という。

StatusPageは買収後もスタンドアローンのプロダクトとして引き続き展開し、Atlassianはサービスの提供プランの価格(月額29ドルから)を変更するつもりもないとSimonsは話す。今の所、StatusPageのユーザーに影響する変更もないという。

[原文へ]

(翻訳:Nozomi Okuma /Website