故障演练场景是演练任务的核心。AHAS 提供基础资源类场景和 Kubernetes 类场景,帮助分布式系统提升容错性和可恢复性。

每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复正常,通常不需要配置参数。本文不再介绍恢复阶段的演练活动。

基础资源类场景

场景名称 特性
CPU 类场景

CPU 场景包含指定 CPU 使用率负载和指定核使用率满载,旨在 CPU 在特定负载下,验证服务质量、监控告警、流量调度、弹性伸缩等能力。

网络类场景

网络故障场景包含网络延迟、网络丢包和篡改域名解析,网络故障是系统运行过程中时常遇到的问题,所以需要提升系统在网络异常的情况下容错能力。

Java

Kubernetes 类场景
场景名称 特性
虚拟机场景

故障演练支持的的虚拟机场景。

代码逻辑场景

故障演练支持的的代码逻辑场景。

JVM 注入动态脚本

向指定的 Java 方法注入一段动态代码,您可通过代码方式实施任意故障场景,例如篡改方法入参、篡改方法返回值等。

K8s 类场景

Kubernetes 类场景
场景名称 特性
Node 演练场景

Kubernetes 集群中 Node 资源故障场景,目前包含基础资源中的 CPU、网络和进程。每个 Node 场景下都包含通用的 Node 筛选参数,用于查找目标 Node。

Pod 演练场景

Kubernetes 集群中 Pod 资源故障场景,包含杀 Pod 和 Pod 网络异常场景,每个 Pod 场景下都包含通用的 Pod 筛选参数,用于查找目标 Pod。

Container 演练场景

Kubernetes 集群中 Pod 资源下的容器故障场景,目前包含杀容器以及容器内故障场景。每个容器故障场景下都包含通用的容器筛选参数,用于查找目标容器。