故障演练时通过接入应用实时监控服务ARMS(Application Real-Time Monitoring Service)可以对演练过程的指标进行监控,包含JVM内存、JVM线程数、JVMGC相关、网络出入口流量、磁盘、CPU等指标。本文介绍如何在故障演练中接入ARMS并监控演练指标的操作步骤。

前提条件

操作步骤

  1. 登录AHAS控制台,在左侧导航栏选择故障演练 > 我的空间
  2. 单击新建演练,选择从空白创建,进入演练配置页面。
  3. 演练配置页面,填写演练名称演练描述演练标签
    配置项 配置说明
    演练名称 填写演练名称。
    演练描述 为该演练添加描述,包括演练原因、演练场景以及演练可能造成的影响等信息。
    添加标签 自定义演练标签,便于演练的查询和统计。
    • 输入标签内容时,系统会显示已有的标签。
    • 一个演练场景中,最多可输入五个标签。
    • 标签将自动保存,下次可通过搜索或直接从下拉列表中选择已有的标签。
  4. 配置页签,设置演练对象的参数。
    演练对象应用.png
    1. 设置分组名称
    2. 选择演练对象应用
    3. 选择演练应用应用分组机器列表等。
      说明 机器列表中可以选择一台或多台机器。
    4. 单击添加演练内容,然后按需选择演练场景。故障演练支持的场景,请参见演练场景说明
    5. 单击保存,可添加多个演练分组。然后单击下一步
  5. 配置全局配置。
    1. 选择演练流程
    2. 单击全局监控节点新增节点,选择需要监控的节点,单击确定。然后选择参数对应的指标。如查询JVM内存信息(ARMS),可选择新生代、老年代等相关指标。
    3. 恢复策略区域单击新增策略,选择指标。
    4. 策略配置面板中,配置恢复规则恢复策略
    5. 设置自动恢复时间定时运行时间。
  6. 单击下一步,演练创建成功。

执行结果

在演练详情页,单击演练,执行演练后,可以观察监控的指标。

演练指标.png