故障演练场景是演练任务的核心。AHAS提供基础资源类场景和Kubernetes类场景,帮助分布式系统提升容错性和可恢复性。
每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复正常,通常不需要配置参数。本文不再介绍恢复阶段的演练活动。
基础资源类场景
场景名称 | 特性 |
---|---|
CPU类场景 |
CPU场景包含指定CPU使用率负载和指定核使用率满载,旨在让CPU在特定负载下,验证服务质量、监控告警、流量调度、弹性伸缩等能力。 |
网络类场景 |
网络故障场景包含网络延迟、网络丢包和篡改域名解析。网络故障是系统运行过程中时常遇到的问题,所以需要提升系统在网络异常情况下的容错能力。 |
Java
场景名称 | 特性 |
---|---|
虚拟机场景 |
故障演练支持的虚拟机场景。 |
代码逻辑场景 |
故障演练支持的代码逻辑场景。 |
JVM注入动态脚本 |
向指定的Java方法注入一段动态代码,您可通过代码方式实施任意故障场景,例如篡改方法入参、篡改方法返回值等。 |
K8s类场景
场景名称 | 特性 |
---|---|
Node演练场景 |
Kubernetes集群中Node资源故障场景,目前包含基础资源中的CPU、网络和进程。每个Node场景下都包含通用的Node筛选参数,用于查找目标Node。 |
Pod演练场景 |
Kubernetes集群中Pod资源故障场景,包含删除Pod和Pod网络异常场景。每个Pod场景下都包含通用的Pod筛选参数,用于查找目标Pod。 |
Container演练场景 |
Kubernetes集群中Pod资源下的容器故障场景,目前包含删除容器以及容器内故障场景。每个容器故障场景下都包含通用的容器筛选参数,用于查找目标容器。 |