场景描述 用户微服务架构应用基于阿里云 ACK 部署, 通 过 ARMS 监控发现微服务应用的容错能力是否 健壮, 容器编排配置是否合理, 以及节点故障引 发的问题等, 方案通过 AHAS 故障注入模拟生 产环境产生的故障, 通过 ARMS 及时发现问题、 定位问题, 并结合 ARMS 的告警功能快速发现 并解决问题。 发现调用下游一个服务实例出现异常。 发现业务 Pod 故障, 验证业务的稳定性。 发现调用数据库延迟故障, 验证 Pod 的水 平扩容能力。 解决问题 1. 定位并解决微服务应用的容错能力。 2. 定位并解决微服务应用编排合理性。 3. 发现故障并验证系统故障的告警时效性。 产品列表 应用高可用服务 AHAS 性能测试 PTS 应用实时监控服务 ARMS 容器服务 kubernetes 版 负载均衡 SLB 专有网络 VPC 日志服务 SLS
文档版本:20220331 61 微服务应用问题定位及故障演练 问题定位及故障模拟 步骤15 开始注入 Pod网络延时故障(可以看到故障成功注入,即 notification这个 service会 有 2秒的网络延时),再次执行 PTS打入流量。步骤16 确定执行演练。步骤17 执行成功:文档版本:20220331 62 微服务应用问题定位及故障演练 问题定位及故障...