看到有个 AWS 干了十年的老工程师总结了下学到的东西,觉得蛮不错的,推荐一下: 摘要, 原文 1, 原文 2。
我感觉作者估计经历了很多 ONCALL 的事件,这总结出来的一堆,例如 Failure, Measure, Sharding, Plan 等等应该都是事故应急初始后不断攒出来经验。很推荐想往架构设计上转型的同学们阅读学习~