创建演练包括配置演练基本信息、演练对象和演练全局参数。

背景信息

一次完整的故障演练包括以下四个阶段:

安装探针 > 创建演练 > 执行演练 > 停止演练

操作步骤

  1. 登录AHAS控制台,在左侧导航栏中选择故障演练 > 演练列表
  2. 故障演练页面左上角,单击新建演练
  3. 新建演练页面,选择从空白创建或其他演练模板。

    选择其他演练模板会从经验库里直接生成演练的配置基本信息。

  4. 演练配置页面,填写演练名称演练描述演练标签
    配置项 配置说明
    演练名称 填写演练名称。
    演练描述 为该演练添加描述,包括演练原因、演练场景以及演练可能造成的影响等信息。
    添加标签 自定义演练标签,便于演练的查询和统计。
    • 输入标签内容时,系统会显示已有的标签。
    • 一个演练场景中,最多可输入五个标签。
    • 标签将自动保存,下次可通过搜索或直接从下拉列表中选择已有的标签。
  5. 配置演练对象。
    1. 演练对象页面设置分组名称,选择演练对象
      • 演练对象选择应用,则需要选择演练应用应用分组机器列表等。
      • 演练对象选择非应用,则需要选择机器类型机器列表
      说明 机器列表中可以选择一台或多台机器。
    2. 单击 + 添加演练内容,然后按需选择演练场景。故障演练支持的场景请参见演练场景说明
    3. 单击保存,然后单击下一步
  6. 配置全局配置。在全局配置页面完成以下配置。
    全局配置

    以下配置以脚本方式制造CPU满载的演练场景为例。

    1. 选择演练流程顺序执行
    2. 全局监控节点区域单击+ 新增节点,在新增节点对话框中选择需查看的指标,然后单击确定
      全局监控节点与演练内容对应,若演练场景为脚本方式制造CPU满载,则全局监控节点选择CPU指标
    3. 全局监控配置面板中选择指标
    4. 恢复策略区域单击+ 新增策略,在新增节点对话框中选择CPU指标,然后单击确定
    5. 策略配置面板中,配置恢复规则和恢复策略。
      例如配置恢复策略为:当满足70% 的机器满足system.cpu.util(综合利用率)等于100% 且持续30s时,即可解除CPU满载,恢复初始CPU使用率。具体配置如下图所示。
    6. 设置自动恢复时间。
  7. 单击下一步

后续步骤

演练创建成功后,您可以:
  • 执行演练

    在演练列表中的某个演练的操作列,单击演练,执行演练。请参见执行演练

  • 查看并编辑演练详情

    在演练列表,单击某个演练名称,可查看演练内容。单击页面右上角编辑,可修改演练内容。

  • 拷贝演练

    在演练列表中的某个演练的操作列,单击拷贝,拷贝一个同名的演练,您可以在此基础上编辑演练内容。

  • 删除演练

    在演练列表中的某个演练的操作列,单击删除