文档

创建报警规则

更新时间:

云原生多模数据库 Lindorm支持为实例的重要监控项创建报警规则。当监控项的值不在设置的阈值范围内时,系统会自动向报警联系组中联系人发出报警通知,从而快速定位问题。本文介绍如何通过云原生多模数据库 Lindorm控制台和云监控控制台创建报警规则。

前提条件

  • 已创建Lindorm实例。具体操作,请参见创建实例

重要

仅支持为Lindorm实例创建报警规则,Lindorm单节点和LTS实例不支持创建报警规则。

  • 如果报警规则需要作用于指定应用分组的实例上,请您确保已创建应用分组,且已将实例添加至该应用分组。具体操作,请参见创建应用分组修改应用分组

通过云原生多模数据库 Lindorm控制台创建

  1. 登录Lindorm管理控制台

  2. 在页面左上角,选择实例所属的地域。

  3. 实例列表页,单击目标实例ID或者目标实例所在行操作列的管理

  4. 在左侧导航栏单击报警配置可以查看实例的告警规则。报警规则

  5. 在页面右上角单击创建Lindorm告警规则

  6. 创建Lindorm告警规则页面配置以下参数。

说明

告警规则的检测类型分为静态阈值和自定义PromQL,不同的检测类型配置的参数不同。

静态阈值

参数

说明

告警名称

告警的名称。

检测类型

选择静态阈值

Lindorm集群

选择需要创建告警的Lindorm实例。

告警分组

选择告警分组。Lindorm实例的告警分组固定写为Lindorm告警指标。

告警指标

通过下拉列表选择想要配置告警的指标。

告警条件

基于告警指标预置内容设置告警事件产生条件。

筛选条件

Lindorm实例不支持设置筛选条件。

数据预览

数据预览区域展示告警条件对应的PromQL语句,并以时序曲线的形式展示当前告警规则配置的监控指标的值。

默认展示一个实例下对应告警指标的实时值,您可以在该区域的筛选框中选择时间区间来查看不同时间区间和不同资源的值。

    说明
    • 告警阈值将会以一条红色直线的形式显示在时序曲线中,满足告警阈值的时序曲线显示为深红色,不满足告警阈值的时序曲线显示为其他颜色。

    • 将鼠标悬浮于时序曲线上,可以查看对应时间点的资源详情。

    • 在时序曲线上选中一段时间,可以查看对应时间段的时序曲线。

持续时间

  • 当告警条件满足时,直接产生告警事件:有任何一个数据点满足阈值,就会产生告警事件。
  • 当告警条件满足持续N分钟时,才产生告警事件:即只有当满足阈值的时间大于等于N分钟时,才产生告警事件。

告警等级

自定义告警等级。告警严重程度从默认、P4、P3、P2、P1逐级上升。

告警内容

设置收到的告警信息。您可以使用Go Template语法在告警内容中自定义告警参数变量。

告警检查周期

告警规则每隔N分钟进行一次检查,判断数据是否满足告警条件。默认1分钟,最少设置1分钟。

快速指定通知策略

选择不指定通知规则或者指定已有通知规则发送报警。您也可以单击新建通知策略创建新的通知策略,具体操作,请参见新建通知策略

重要 快速指定通知策略只能保证当前告警规则产生的告警事件一定能够被所选的通知策略匹配到并且产生对应告警。但是,当前告警规则产生的事件同时也可能被其它设置了模糊匹配的通知策略匹配到并且产生告警。告警规则产生的告警事件和通知策略之间是多对多的匹配关系。

标签

设置告警标签,设置的标签可用作通知策略匹配规则的选项。

注释

设置告警的注释。

自定义PromQL

参数

说明

告警名称

告警的名称。

检测类型

选择自定义PromQL

Lindorm集群

选择需要创建告警的Lindorm实例。

参考指标

Lindorm实例不支持设置参考指标。

自定义PromQL语句

使用PromQL语句设置告警则表达式。

数据预览

数据预览区域展示了满足PromQL告警表达式的实例资源的指标时序曲线。

默认展示满足PromQL告警表达式实例的告警数据,您可以在该区域的筛选框中选择目标资源以及时间区间进行数据展示。

说明
  • 将鼠标悬浮于时序曲线上,可以查看对应时间点的资源详情。
  • 在时序曲线上选中一段时间,可以查看对应时间段的时序曲线。

持续时间

  • 当告警条件满足时,直接产生告警事件:有任何一个数据点满足阈值,就会产生告警事件。
  • 当告警条件满足持续N分钟时,才产生告警事件:即只有当满足阈值的时间大于等于N分钟时,才产生告警事件。

告警等级

自定义告警等级。默认告警等级为默认,告警严重程度从默认、P4、P3、P2、P1逐级上升。

告警内容

用户收到的告警信息。您可以使用Go Template语法在告警内容中自定义告警参数变量。

告警检查周期

告警规则每隔N分钟进行一次检查,判断数据是否满足告警条件。默认1分钟,最少设置1分钟。

快速指定通知策略

选择不指定通知规则或者指定已有通知规则发送报警。您也可以单击新建通知策略创建新的通知策略,具体操作,请参见新建通知策略

重要 快速指定通知策略只能保证当前告警规则产生的告警事件一定能够被所选的通知策略匹配到并且产生对应告警。但是,当前告警规则产生的事件同时也可能被其它设置了模糊匹配的通知策略匹配到并且产生告警。告警规则产生的告警事件和通知策略之间是多对多的匹配关系。

标签

设置告警标签,设置的标签可用作通知策略匹配规则的选项。

注释

设置告警的注释。

通过云监控控制台创建

  1. 登录云监控控制台

  2. 在左侧导航栏单击报警服务 > 报警规则

  3. 报警规则列表页面单击创建报警规则

  4. 创建报警规则面板,设置以下参数。

    参数

    说明

    产品

    填写为云原生多模数据库Lindorm

    资源范围

    报警规则作用的资源范围。取值:

    • 全部资源:表示该规则作用于当前阿里云账号下云原生多模数据库 Lindorm的全部实例上。

    • 应用分组:表示该规则作用于云原生多模数据库 Lindorm的指定应用分组内的全部实例上。

    • 实例:表示该规则作用于某个指定Lindorm实例上。

    规则描述

    报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下:

    1. 单击添加规则

    2. 添加规则描述面板,设置规则名称、指标类型、监控指标、维度、阈值、报警级别和报警方式等。

    3. 单击确定

    关联资源

    选择云原生多模数据库 Lindorm的应用分组名称或者实例ID。

    说明

    当资源范围为应用分组或者实例时配置该参数。

    通道沉默周期

    监控指标出现异常时发送报警通知的间隔时长。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

    某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知。如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    说明

    单击高级设置,可设置该参数。

    生效时间

    报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。

    说明

    单击高级设置,可设置该参数。

    报警联系人组

    发送报警通知的联系人组。

    应用分组的报警通知会发送给该报警联系人组中的报警联系人,报警联系人组中可以包含一个或多个报警联系人。关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系组

    报警回调

    通过HTTP协议或HTTPS协议的POST请求推送报警通知到您指定的URL地址。关于如何设置报警回调,请参见使用阈值报警回调

    弹性伸缩

    开启弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域、弹性伸缩组和弹性伸缩规则。

    日志服务

    开启日志服务开关,当报警发生时,会将报警信息写入日志服务的日志库。您需要设置日志服务的地域、ProjectName和Logstore。关于如何创建Project和Logstore,请参见快速入门

    消息服务MNS-Topic

    开启消息服务MNS-Topic开关,当报警发生时,会将报警信息写入消息服务的主题。您需要设置消息服务的地域和主题。关于如何创建主题,请参见创建主题

    无数据报警处理方法

    无监控数据时报警的处理方式。取值:

    • 不做任何处理(默认值)

    • 发送无数据报警

    • 视为恢复

    标签

    报警规则的标签。您可以设置标签键和标签值。

  5. 设置完成后,单击确定

  • 本页导读 (1)
文档反馈