基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。
一次完整的故障演练包括以下四个阶段:
安装探针 | > | 创建演练 | > | 执行演练 | > | 停止演练 |
- 安装探针:对指定机器进行演练,需要在机器上面安装故障演练探针,探针的作用是下发故障演练执行命令。
- 创建演练:配置演练基本信息、演练对象和演练全局参数。可同时选择多个故障类型。
- 执行演练:将故障注入机器,可通过演练时需曲线、演练参数、演练日志等检查故障注入的效果是否符合预期。
- 停止阶段:清除故障。当故障演练自动结束、您主动终止或者演练中的任何环节出现异常后,系统都会进入恢复阶段,自动清除相应的故障,使故障演练对象恢复演练前的状态。