故障演练场景是演练任务的核心。AHAS提供基础资源类场景和Kubernetes类场景,帮助分布式系统提升容错性和可恢复性。

每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复正常,通常不需要配置参数。本文不再介绍恢复阶段的演练活动。

基础资源类场景

场景名称 特性
CPU类场景

CPU场景包含指定CPU使用率负载和指定核使用率满载,旨在CPU在特定负载下,验证服务质量、监控告警、流量调度、弹性伸缩等能力。

网络类场景

网络故障场景包含网络延迟、网络丢包和篡改域名解析,网络故障是系统运行过程中时常遇到的问题,所以需要提升系统在网络异常的情况下容错能力。

Java

Kubernetes类场景
场景名称 特性
虚拟机场景

故障演练支持的虚拟机场景。

代码逻辑场景

故障演练支持的代码逻辑场景。

JVM注入动态脚本

向指定的Java方法注入一段动态代码,您可通过代码方式实施任意故障场景,例如篡改方法入参、篡改方法返回值等。

K8s类场景

Kubernetes类场景
场景名称 特性
Node演练场景

Kubernetes集群中Node资源故障场景,目前包含基础资源中的CPU、网络和进程。每个Node场景下都包含通用的Node筛选参数,用于查找目标Node。

Pod演练场景

Kubernetes集群中Pod资源故障场景,包含删除Pod和Pod网络异常场景,每个Pod场景下都包含通用的Pod筛选参数,用于查找目标Pod。

Container演练场景

Kubernetes集群中Pod资源下的容器故障场景,目前包含删除容器以及容器内故障场景。每个容器故障场景下都包含通用的容器筛选参数,用于查找目标容器。