AWSは休む暇がない

AWSは休む暇がない
AWS re:Invent 2021
画像クレジット: Noah Berger/Getty Images for Amazon Web Services

AWSは本日、今月3度目となるデータセンターの1つで障害に見舞われました。今朝はUS-EAST-1リージョンで停電が発生し、Slack、Asana、Epic Gamesなどのサービスに影響が出ました。

問題は東部標準時午前7時30分頃に発生し、午後1時現在もサービスに連鎖的な影響が続いています。AWSは、このリージョンの複数のサービス、特にEC2コンピューティングサービスと関連ネットワーク機能に問題が発生していると報告し続けています。最近では、このリージョンのシングルサインオンサービスでもエラー率が上昇し始めています。

「米国東部1リージョンの単一アベイラビリティゾーン(USE1-AZ4)内の単一データセンターで停電が発生していることを確認しました」と、同社は東部標準時午前8時のアップデートで説明しました。「この停電により、該当データセンターに属するEC2インスタンスの可用性と接続性に影響が出ています。また、該当アベイラビリティゾーン内での起動において、RunInstance APIのエラー率が上昇しています。該当アベイラビリティゾーン内の他のデータセンター、または米国東部1リージョン内の他のアベイラビリティゾーンへの接続と電源は影響を受けませんが、可能であれば、該当アベイラビリティゾーン(USE1-AZ4)からフェイルオーバーすることをお勧めします。」

これがここ数週間のAWSの唯一の障害であれば、ほとんど注目されることはなかったでしょう。現代のハイパークラウドの複雑さを考えると、障害は時折発生するものです。しかし、AWSでは今では毎週のように障害が発生しています。12月7日には、同じUS-EAST-1リージョンがネットワークの問題で数時間にわたってダウンしました。さらに12月17日には、西海岸の2つのリージョン間の接続に影響する障害が発生し、Netflix、Slack、AmazonのRingなどのサービスが停止しました。さらに追い打ちをかけるように、これらの障害はすべて、AWSが今月初めに開催したre:Inventカンファレンスで自社クラウドの堅牢性を大々的に宣伝した直後に発生しました。

もちろん、理想的にはこのような障害は発生しないはずです。AWSユーザーは、システムを地理的に離れたリージョンにフェイルオーバーするように設計することで、こうした障害から身を守る方法もいくつかあります。しかし、これには多大なコストがかかる可能性があるため、ダウンタイムとコストのトレードオフは割に合わないと考える人もいます。結局のところ、安定したプラットフォームを提供するのはAWSの責任です。AWSが単に不運な出来事を繰り返しているだけなのか、それともシステム上の問題がこれらの問題を引き起こしているのかは分かりませんが、もし私が今US-EAST-1リージョンでサービスをホストしているとしたら、少なくとも他のリージョンへの移転を検討するでしょう。

Amazon Web Servicesがダウンし、インターネットの大部分が利用できなくなった

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

トピック

Amazon Web Services API Asana AWS AWS 障害クラウド コンピューティングクラウド インフラストラクチャダウンタイム Epic Games Netflix Slack TC テクノロジー米国西海岸

フレデリックは2012年から2025年までTechCrunchに在籍していました。また、SiliconFilterを設立し、ReadWriteWeb(現ReadWrite)にも寄稿しています。フレデリックは、エンタープライズ、クラウド、開発者ツール、Google、Microsoft、ガジェット、交通機関など、興味のあるあらゆる分野をカバーしています。

バイオを見る