微服务应用通过阿里云业务实时监控ARMS监控发现节点及容器故障,在日常中可以通过AHAS演练及时发现问题及针对性防护。本文介绍微服务应用问题定位及故障演练的场景描述、解决的问题、部署架构图、选用的产品及参考链接等。

场景描述

您微服务架构应用基于阿里云容器服务Kubernetes(ACK)部署,通过阿里云业务实时监控ARMS发现微服务应用的容错能力是否健壮、容器编排配置是否合理、节点故障引发的问题等。方案通过AHAS故障注入模拟生产环境产生的故障,通过ARMS及时发现问题、定位问题,并结合ARMS的告警功能快速发现并解决问题。
  • 发现调用下游一个服务实例出现异常。
  • 发现业务Pod故障,验证业务的稳定性。
  • 发现调用数据库延迟故障,验证Pod的水平扩容能力。

解决问题

  • 定位并解决微服务应用的容错能力。
  • 定位并解决微服务应用编排合理性。
  • 发现故障并验证系统故障的告警时效性。

部署架构图

微服务应用问题定位及故障演练

选用的产品

  • 应用高可用服务 AHAS

    应用高可用服务(Application High Availability Service)是一款专注于提高应用高可用能力的云工具产品,提供应用架构自动探测,故障注入式高可用能力评测和一键流控降级等功能,可以快速低成本的提升应用可用性。

    更多关于应用高可用服务的介绍,参见应用高可用服务产品详情页

  • 性能测试 PTS

    PTS(Performance Testing Service)是面向所有技术背景人员的云化测试工具。有别于传统工具的繁复,PTS以互联网化的交互,提供性能测试、API调试和监测等多种能力。自研和适配开源的功能都可以轻松模拟任意体量的用户访问业务的场景,任务随时发起,免去繁琐的搭建和维护成本。更是紧密结合监控、流控等兄弟产品提供一站式高可用能力,高效检验和管理业务性能。

    更多关于性能测试 PTS的介绍,参见性能测试 PTS产品详情页

  • 应用实时监控服务 ARMS

    应用实时监控服务 (Application Real-Time Monitoring Service,简称ARMS)是一款应用性能管理产品,包含前端监控,应用监控和Prometheus监控三大子产品,涵盖了浏览器、小程序、APP、分布式应用和容器环境等性能管理,能帮助您实现全栈式的性能监控和端到端的全链路追踪诊断, 让应用运维从未如此轻松高效。

    更多关于应用实时监控服务 ARMS的介绍,参见应用实时监控服务ARMS产品详情页

  • 容器服务 ACK

    容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。

    更多关于容器服务 ACK的介绍,参见容器服务 ACK产品详情页

  • 负载均衡SLB

    负载均衡(Server Load Balancer)是将访问流量根据转发策略分发到后端多台云服务器(ECS实例)的流量分发控制服务。负载均衡扩展了应用的服务能力,增强了应用的可用性。

    更多关于负载均衡SLB的介绍,参见负载均衡产品详情页

  • 专有网络VPC

    专有网络VPC帮助您基于阿里云构建出一个隔离的网络环境,并可以自定义IP 地址范围、网段、路由表和网关等;此外,也可以通过专线/VPN/GRE等连接方式实现云上VPC与传统IDC的互联,构建混合云业务。

    更多关于专有网络VPC的介绍,参见专有网络VPC产品详情页

  • 日志服务 SLS

    行业领先的日志大数据解决方案,一站式提供数据收集、清洗、分析、可视化和告警功能。全面提升海量日志处理能力,实时挖掘数据价值,智能助力研发/运维/运营/安全等场景。

    更多关于日志服务的介绍,参见日志服务产品详情页

详细信息

点击查看最佳实践详情

更多最佳实践

点击查看更多阿里云最佳实践