创建演练包括配置演练基本信息、演练对象和演练全局参数。

背景信息

一次完整的故障演练包括以下四个阶段:

安装探针 > 创建演练 > 执行演练 > 停止演练

操作步骤

  1. 登录 AHAS 控制台,在左侧导航栏中选择故障演练 > 演练列表
  2. 故障演练页面右上角,单击新建演练
  3. 新建演练页面,填写演练名称演练描述演练标签,然后单击确定
    演练基本信息
    配置项 配置说明
    演练名称 填写演练名称。
    演练描述 为该演练添加描述。
    添加标签 自定义演练标签,便于演练的查询和统计。

    添加标签框中,输入标签内容,按回车键完成输入。一个演练场景中,最多可输入五个标签。

    标签将自动保存,下次可通过搜索或直接从下拉列表中选择已有的标签。

  4. 配置演练页面单击立即创建
  5. 配置演练对象。
    演练对象
    1. 演练对象页面设置分组名称、演练机器类型和机器列表。
      说明 机器列表中可以选择一台或多台机器。
    2. 单击 + 添加演练内容,然后选择按需选择演练场景。故障演练支持的场景请参见演练场景说明
    3. 单击保存,然后单击下一步
  6. 配置全局配置。在全局配置页面完成以下配置。
    1. 选择演练流程顺序执行
    2. 全局监控节点区域单击+ 新增节点,在新增节点对话框中选择需查看的指标,然后单击确定
      全局监控节点与演练内容对应,若演练场景为脚本方式制造 CPU 满载,则全局监控节点选择 CPU 指标
    3. 全局监控配置面板中选择指标
    4. 恢复策略区域单击 + 新增策略,在新增节点对话框中选择 CPU 指标,然后单击确定
    5. 策略配置面板中,配置恢复规则和恢复策略。
      例如配置恢复策略为:当满足 70% 的机器满足 system.cpu.util(综合利用率)等于 100% 且持续 30s 时,即可解除 CPU 满载,恢复初始 CPU 使用率。具体配置如下图所示。ex_策略配置
    6. 设置自动恢复时间。
  7. 单击下一步

执行结果

创建成功后,界面将提示如下:创建成功

后续步骤

演练创建成功后,您可以:
  • 执行演练

    在演练列表中的某个演练的操作列,单击开始,执行演练。具体参见执行演练

  • 查看并编辑演练详情

    在演练列表中的某个演练的操作列,单击查看详情,可查看演练内容。单击页面右上角编辑,可修改演练内容。

  • 拷贝演练

    在演练列表中的某个演练的操作列,单击拷贝拷贝一个同名的演练,您可以在此基础上编辑演练内容。

  • 删除演练

    在演练列表中的某个演练的操作列,单击删除