基于阿里巴巴多年业务的真实线上故障库的积累,AHAS 故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。目前,仅支持对部署在阿里云 ECS 实例上的应用进行故障演练。

一次完整的故障演练包括以下四个阶段:
安装探针 > 创建演练 > 执行演练 > 停止演练
  • 安装探针:对指定机器进行演练,需要在机器上面安装故障演练探针,探针的作用是下发故障演练执行命令。
  • 创建演练:配置演练基本信息、演练对象和演练全局参数。可同时选择多个故障类型。
  • 执行演练:将故障注入机器,可通过演练时需曲线、演练参数、演练日志等检查故障注入的效果是否符合预期。
  • 停止阶段:清除故障。当故障演练自动结束、您主动终止或者演练中的任何环节出现异常后,系统都会进入恢复阶段,自动清除相应的故障,使故障演练对象恢复演练前的状态。