本文以ARMS产品上报告警,并发送告警通知到钉钉群为例,帮助您快速使用告警管理功能,从创建告警、配置联系人到接收到第一张告警卡片。

操作流程

告警操作流程

步骤一:集成监控产品

此处以ARMS产品为例,告警管理默认集成ARMS监控产品。其他监控产品集成到告警管理的操作,请参见集成概述

步骤二:创建联系人

告警管理支持将告警通知通过短信、电话、邮件、Webhook和钉钉等方式发送给联系人。此处以创建钉群为例,展示如何通过告警管理中的钉群功能向您指定的钉钉群发送告警通知。创建其他联系人的操作,请参见联系人概述

  1. 在钉钉群中创建自定义机器人并获取机器人Webhook地址,具体操作,请参见获取钉钉机器人Webhook地址
  2. 登录ARMS控制台
  3. 在左侧导航栏中选择告警管理 > 联系人
  4. 联系人页面单击钉群页签。
  5. 钉群页签上,单击右上角的新建钉群
  6. 新建钉群对话框中输入钉群名称机器人地址,然后单击确认

步骤三:创建通知策略

此处展示如何将所有告警事件中告警等级为P1的告警事件合并为一条告警通知发送至钉钉群中。更多信息,请参见通知策略

  1. 登录ARMS控制台
  2. 在左侧导航栏中选择告警管理 > 通知策略
  3. 通知策略列表区域单击+新增策略
  4. 在右侧区域顶部文本框中输入通知策略名称。
  5. 分派规则区域执行以下操作:
    1. 选择不过滤来源。通知策略会针对所有告警事件进行分派规则过滤并发送通知。
    2. 设置分派条件表达式,您可以自定义标签或选择已有的标签。例如:_aliyun_arms_alert_level等于P1。
  6. 事件处理区域执行以下操作:
    Dispatch-event handling
    1. 选择处理方式生成告警
    2. 单击高级配置,设置事件分组不分组
    3. 等待时长区域设置分组等待时间为5s,分组间隔时间为20 min。
    4. 选中告警自动恢复
  7. 当告警生成时区域执行以下操作:
    通知策略-当告警生成时
    1. 选择通知人为创建的钉群。
    2. 选择通知方式钉钉
    3. 设置通知时段09:00-22:00
    4. 选择升级通知方式为重复通知,并设置通知频率为4 h,即告警会在09:00-22:00时段内以4 h的频率循环发送告警信息直至告警恢复。
  8. 设置完成后,单击右上角的通知策略-保存图标图标。

步骤四:创建告警

不同的监控创建方法不同,ARMS各子产品创建告警的方法,请参见:

步骤五:查看和管理告警卡片

当告警被触发后,您可以在钉钉群查看告警通知卡片。通过绑定手机号,您就可以在钉钉群内认领或关闭告警。

  1. 在钉钉群中单击告警卡片中的查看详情
    钉钉群告警卡片
  2. 在钉钉群中首次查看告警信息时会弹出绑定手机号面板,输入手机号,并单击发送验证码
    说明 如果输入的手机号和已有联系人的手机号相同,那么可以将联系人和钉钉绑定。绑定后系统发送告警到钉钉群时会@该联系人。具体操作,请参见联系人绑定钉钉
    告警运维中心-钉群授权
  3. 收到验证码后输入验证码,然后单击确定
    在告警详情面板可以查看当前告警的详细信息。更多管理告警的操作,请参见在钉钉群中处理告警钉群告警详情