场景描述 用户微服务架构应用基于阿里云 ACK 部署, 通 过 ARMS 监控发现微服务应用的容错能力是否 健壮, 容器编排配置是否合理, 以及节点故障引 发的问题等, 方案通过 AHAS 故障注入模拟生 产环境产生的故障, 通过 ARMS 及时发现问题、 定位问题, 并结合 ARMS 的告警功能快速发现 并解决问题。 发现调用下游一个服务实例出现异常。 发现业务 Pod 故障, 验证业务的稳定性。 发现调用数据库延迟故障, 验证 Pod 的水 平扩容能力。 解决问题 1. 定位并解决微服务应用的容错能力。 2. 定位并解决微服务应用编排合理性。 3. 发现故障并验证系统故障的告警时效性。 产品列表 应用高可用服务 AHAS 性能测试 PTS 应用实时监控服务 ARMS 容器服务 kubernetes 版 负载均衡 SLB 专有网络 VPC 日志服务 SLS
步骤1 结合本方案主题问题排查,我们可以通过 ingress的监控中心查看数据。进入 ingress 日志所在的 project。步骤2 进入 ingress日志的监控中心。文档版本:20220331 70 微服务应用问题定位及故障演练 附录:ingress可视化仪表盘 步骤3 通过仪表盘,我们可以发现 5XX的比例明显升高,也可以结合 ARMS追踪访问链路 查找具体...