AWSの東京リージョンの4つあるAZのうちの1つで23日、大規模障害が発生。
PaypayやZaif、オンラインゲームなど、多数のAWS基盤上で動くサービスに影響が出たようです。
原因は、冷却システムとか。広範囲のサーバーに影響があったところを見ると、データセンターの空調ダウン?
空調は冗長構成にしていないの?意味わからんのだけど。
また、DC業界の皆さんに聞き込みしておかなないとね。
ちなみに、私はオレゴンリージョンを使っていたので、影響なし。
しかし、あれだなぁ。
AWSって、アナウンスもあっさりと英語だけだし(後に取って付けた日本語はあり)、腕に覚えのあるエンジニアがTwitterやSlackを駆使して障害復旧を何とかする、みたいな、不思議な障害復旧シーンでした。
重要なシステムは、複数のAZや別リージョンでバックアップしていないと痛い目見るってことですね。
もしくは重要でないシステムは、素早く他の生きているAZにて復活させられる手順を確立していることが大事ですね。
ちなみに、このブログもAWSで動いてるらしいのよねぇ。。。くわばらくわばら。
posted by jouji117 at 12:50| 香川 ☁|
Comment(0)
|
ITビジネス
|

|