文档

配置Grafana原生告警

更新时间:

在Grafana平台通过设置告警规则,您可以监控服务中的各项指标数据,并在告警事件发生时及时通知运维人员,帮助您及时发现并解决问题,避免服务发生中断。本文介绍如何在Grafana配置原生告警。

8.2.x及以前版本

步骤一:登录Grafana

  1. 登录可观测可视化 Grafana 版控制台,在左侧导航栏单击工作区管理

  2. 工作区管理页面,单击目标工作区右侧的访问地址url链接进入Grafana。

    说明

    如果需要登录Grafana,可以使用Grafana的Admin账号和创建工作区时设置的密码登录Grafana,或单击Sign in with Alibaba Cloud直接使用当前购买工作区的阿里云账号登录Grafana。

步骤二:创建告警通知渠道

在左侧导航栏,单击image图标,选择Notification channels,然后单击Add channel,创建告警通知渠道。image.png

配置项

描述

Name

自定义名称。

Type

通知类型。例如DingDing、Webhook和Email等。

Addresses

通知发送的目标服务地址,本示例中为钉钉机器人Webhook地址。如何获取钉钉机器人Webhook地址,请参见获取钉钉机器人Webhook地址

步骤三:创建告警规则AlertRule

  1. 在左侧导航栏,单击image.png图标,创建大盘面板Dashboard。

  2. 单击Add an empty panel,创建一个Panel。

  3. Panel创建完成后,在Alert页签,单击Create Alert,配置告警规则(Alert Rule)。

    image.png

    配置项

    描述

    Name

    告警规则名称。

    Evaluate Every

    表示多久检查该告警一次。取值1m、2m、5m,表示每分钟、每两分钟、每五分钟检查一次是否已触发告警。

    For

    表示当触发该告警条件后,连续触发多久时间才真正发送告警事件到对应的通知渠道。

    Conditions

    告警的触发条件。上图表示当Query中的A查询的平均值avg()超过600时,触发告警。

    No data and error handling

    表示当无数据或查询超时,是否需要发送告警。

    Notifications

步骤四:查看告警规则AlertRule

在左侧导航栏,单击image图标,在Alert Rules页签查看告警规则列表。

image.png

8.2.x以上版本

步骤一:关闭集成的ARMS告警插件

  1. 登录可观测可视化 Grafana 版控制台,在左侧导航栏单击工作区管理

  2. 工作区管理页面,单击目标工作区ID。

  3. 在左侧导航栏,单击告警管理,关闭集成的ARMS告警插件,启用Grafana原生告警。

  4. 工作区管理页面,单击目标工作区右侧的访问地址url链接进入Grafana。

    说明

    如果需要登录Grafana,可以使用Grafana的Admin账号和创建工作区时设置的密码登录Grafana,或单击Sign in with Alibaba Cloud直接使用当前购买工作区的阿里云账号登录Grafana。

步骤二:创建告警规则

说明

Grafana 9.0.x和Grafana 10.0.x交互略有差异,整体区别不大,本章节以Grafana 9.0.x为例进行讲解。您也可以参见步骤三:创建告警规则AlertRule,在Panel页面创建告警规则。

  1. 在左侧导航栏,单击image.png图标,选择告警规则Alert rules)。

  2. 告警规则Alert rules)页面,单击New alert ruleCreate alert rule

    image

  3. Set a query and alert condition区域,设置查询条件和告警表达式。

    配置项

    描述

    Query patterns

    需要查询的语句。

    Operation

    告警表达式类型。Classic condition为经典表达式,兼容8.2.x以下版本创建的告警规则。

    Conditions

    告警的触发条件。上图表示当Query中的A查询的平均值avg()超过600时,触发告警。

  4. Alert evaluation behavior区域,配置告警执行周期和告警行为。

    配置项

    描述

    Evaluate Every

    表示多久检查该告警一次。取值1m、2m、5m,表示每分钟、每两分钟、每五分钟检查一次是否已触发告警。

    For

    表示当触发该告警条件后,连续触发多久时间才能真正发送告警事件到对应的通知渠道。

    Configure no data and error handling

    表示当无数据或查询超时时,是否需要发送告警。

  5. Add details for your alert区域,设置告警详情。

    配置项

    描述

    Rule Name

    告警规则名称。

    Folder

    告警所属文件夹。

    Group

    告警所属分组。在同一分组内,会以相同的周期处理告警。

    Summary and annotations

    配置告警的内容、关联的大盘和文件夹等信息。

  6. Notifications区域,配置Custom Labels

    配置项

    描述

    Custom Labels

    标签,可自定义,用于关联通知策略。

  7. 在告警列表中查看告警。

步骤三:创建联络点

  1. 在左侧导航栏,选择Alerting > Contact points

  2. Contact points页面,单击New contact PointAdd contact point

  3. New contact point页面,配置以下参数。

    配置项

    描述

    Name

    联络点名称。

    Integration

    通知类型。例如DingDing、Webhook和Email等。

    Addresses

    通知发送的目标服务地址。本示例中为钉钉机器人Webhook地址。如何获取钉钉机器人Webhook地址,请参见获取钉钉机器人Webhook地址

步骤四:创建通知策略

通过通知策略关联告警规则(Alert rule)和联络点(Contact point)。

  1. 在左侧导航栏,选择Alerting > Notification policies

  2. Notification policies页面,单击New nested policyNew specific policy

  3. 在对话框中,完成以下参数配置,您就可以通过Grafana原生告警收到告警信息了。

    image.png

    配置项

    描述

    Matching labels

    表示希望该通知策略通过标签关联哪些告警规则(AlertRule)。

    Contact point

    表示希望该通知策略接收到的告警事件发送到哪个告警联络点中。

    其他参数为高级分组和告警静默的一些配置。

  • 本页导读 (1)
文档反馈