本文介绍如何在可观测可视化 Grafana 版中启用ARMS告警管理(ITSM)。

背景信息

  • ARMS告警管理(ITSM)是一款开箱即用的智能告警服务,接收Prometheus等各类客户端发送的告警信息,通过自动去重、分组、算法降噪处理,按标签内容将告警发送至不同的通知对象,帮助运维团队降低项目风险。
  • ARMS告警管理支持通过电话、短信、邮件、钉钉、企业微信、飞书和Webhook方式向通知对象发送告警通知,轻松应对各种告警处理场景。更多信息,请参见告警管理概述
  • ARMS告警管理计费规则,请参见告警管理计费规则

Grafana版本要求

仅9.0.x版本的Grafana支持使用ARMS告警。升级Grafana版本的操作,请参见查看工作区信息

步骤一:启用ARMS告警

说明 9.0.x版本的Grafana已默认启用ARMS告警。
  1. 登录可观测可视化 Grafana 版控制台,在左侧导航栏单击工作区管理
  2. 工作区管理页面,单击目标工作区ID。
  3. 在左侧导航栏单击告警管理,然后单击开启ARMS告警开关。
  4. 在弹出的提示对话框中单击确认
  5. 告警管理右上角单击管理告警,进入Grafana的ITSM页面。

步骤二:创建告警规则

  1. 在Grafana左侧导航栏选择Dashboards > Browse
  2. Browse页签,单击需要创建告警的监控大盘。
  3. 在大盘页面选择需要创建告警的面板,单击面板名称,然后单击Edit
  4. Edit Panel页面单击Alert页签,然后单击Create alert rule from this panel
    说明 您也可以在Grafana的ITSM > 告警规则页面单击+New alert rule创建告警规则。
  5. Notifications区域输入自定义Labelskeyvalue ,例如grafana_alertname=Pod磁盘使用率_hangzhou
    步骤四:创建通知策略时可以通过此处设置的标签匹配到当前告警规则。Grafana告警添加通知策略
  6. 根据需求设置其他告警参数。具体操作,请参见Grafana官方文档
  7. 告警规则创建完成后,单击右上角的Save
    当Grafana告警被触发时,告警事件会上报至ARMS告警管理的告警事件历史页面,更多信息,请参见查看告警事件历史
    说明告警事件历史页面,您可以通过设置集成ARMS_GRAFANA筛选由Grafana告警规则上报的事件。

步骤三:创建通知对象

在Grafana左侧导航栏选择ITSM > 通知对象,然后根据需求选择创建不同的通知对象。具体操作,请参见通知对象概述

  • 联系人或联系人组:适合邮件、电话、短信通知场景。
  • 钉钉/飞书/企业微信:适用团队协作群处理告警场景。
  • Webhook:适用于将告警推送到Pagerduty、Teams Incoming Webhook、企业内部平台等第三方通知对象。
  • 排班管理:适用于团队轮流处理告警的场景。

步骤四:创建通知策略

  1. 在Grafana左侧导航栏选择ITSM > 通知策略,然后单击新建通知策略
  2. 新建通知策略页面设置通知策略名称。
  3. 匹配规则区域设置告警事件的匹配规则。
    1. 选择数据来源Grafana
    2. 单击+添加条件,输入步骤二设置的Labelskeyvalue ,例如:grafana_alertname等于Pod磁盘使用率_hangzhou
      说明 条件2表示过滤集成为Grafana的告警规则,如果不添加条件3,则当前Grafana工作区的所有告警规则都会通过此通知策略进行分派。
      Grafana告警通知策略
    3. 单击下一步
  4. 根据需求设置其他参数,具体操作,请参见通知策略

步骤五:查看告警通知

当通知策略被触发时,收到的告警通知如下所示:
  • 短信Grafana短信告警
  • 邮件Grafana告警邮件
  • 钉钉/飞书/企业微信:在钉钉/飞书/企业微信群中收到告警通知后,您可以直接在群中处理告警。具体操作,请参见在告警通知群中处理告警