新建告警规则和管理告警规则

通过创建告警规则,您可以制定特定应用的告警。当告警规则被触发时,系统会生成相应的告警事件,通过指定的通知方式向告警联系人、机器人、自定义Webhook和行动集成预案等方式,发送告警信息,以提醒您采取必要的解决措施。

前提条件

  • 根据不同的监控类型,请确保已创建需要告警的监控对象。

  • 已创建需要告警通知对象

新建告警规则

步骤

屏幕快照

  1. 登录云监控2.0控制台,在左侧导航栏选择告警中心 > 告警管理 > 告警规则

  2. 在告警规则页面,选择新建规则,单击新建告警规则

image

  1. 创建告警规则页面,开始设置如下参数。

    配置告警检测

    告警名称:自定义告警规则名称。

    监控类型:根据需求选择监控类型,不同的监控类型对应于云监控2.0中的不同应用,有不同的关联指标类型、数据源类型及告警条件类型。

    • 观测应用:可观测监控Prometheus版、应用监控、企业云监控。

    • 观测用户体验:用户体验监控。

    • 洞察云产品(关联指标资源参考观测应用):容器洞察、ECS 洞察、RDS 洞察、AI Infra 服务洞察、Redis洞察。

    • 安全&审计:日志审计。

    数据源类型:根据选择的监控类型,选择数据源的类型。

    image

    关联指标资源 - 可观测监控Prometheus

    1. Region:根据需求选择目标区域。

    2. Prometheus实例:选择您的工作区目标Prometheus实例。

    3. 检测类型:根据您的需求选择是静态阈值(预定义指标) 或者自定义PromQL

      静态阈值(预定义指标)

      • 指标分组:根据目标监控类型,预定义指标包含了多个指标分组,根据您的需求选择指标分组。image

      • 告警指标:根据选择的目标指标分组,选择告警指标。

      • 告警条件:自定义设置告警的条件。

      • 筛选条件:根据设置的条件筛选需要告警资源。

      • SQL预览:根据以上自定义告警条件资源,预览promQL语句。

      • 数据预览:根据以上的设置,可以预览数据图形。

      自定义PromQL

      • 自定义PromQL语句:使用PromQL(Prometheus的查询语言)语法简化对时序数据的查询和分析。更多信息请参见Prometheus官方文档

      • 数据预览:根据您自定义的PromQL语句查询,可以预览数据图形。

    4. 告警条件

      • 告警级别:根据需求选择告警的级别。

      • 持续时间:设置当告警条件满足时持续多少时间。

      • 告警检查周期:需要多少时间才能产生报警事件。

      • 是否检查数据完整:选择检查数据的完整性,或者

      • 告警通知内容:自定义告警通知内容。

    关联指标资源 - 应用监控

    1. Region:根据需求选择目标区域。

    2. 应用:选择您的目标应用。

    3. 指标分组:根据目标监控类型,选择需要监控的告警指标。image

    4. 筛选条件:根据选择的目标指标分组,筛选一些需要告警的资源。

    5. 告警条件:根据需求设置级别条件,可以单击添加条目支持多个条件。

    6. 多告警触发规则:根据设置的告警条件,选择触发规则:同时满足上述条件或者任意满足上述条件

    7. 告警检查周期:需要多少时间(分钟或秒)才能产生报警事件。

    8. 告警通知内容:自定义告警通知内容。

    关联指标资源 - 企业云监控

    1. 指标仓库:选择自定义的目标指标仓库。

    2. 自定义PromQL语句:使用PromQL(Prometheus的查询语言)语法简化对时序数据的查询和分析。更多信息请参见Prometheus官方文档

    3. 数据预览:根据您自定义的PromQL语句查询,可以预览数据图形。

    4. 告警条件

      • 告警级别:根据需求选择告警的级别。

      • 持续时间:设置当告警条件满足时持续多少时间。

      • 告警检查周期:需要多少时间(分钟或秒)才能产生报警事件。

      • 告警通知内容:自定义告警通知内容。

    关联指标资源 - 用户体验监控

    1. Region:根据需求选择目标区域。

    2. Prometheus实例:选择您的工作区目标Prometheus实例。

    3. 应用:选择您的目标应用。

    4. 指标分组:根据目标监控类型,选择需要监控的告警指标。

    5. 筛选条件:根据您的需求,选择筛选资源的条件。

    6. 告警条件:根据需求设置级别条件,可以单击添加条目支持多个条件。

    7. 多告警触发规则:根据设置的告警条件,选择触发规则:同时满足上述条件或者任意满足上述条件

    8. 告警检查周期:需要多少时间(分钟或秒)才能产生报警事件。

    9. 是否检查数据完整:选择检查数据的完整性,或者

    10. 告警通知内容:自定义告警通知内容。

    关联指标资源 - 日志审计

    关联资源右侧单击添加资源,可以支持多个资源。

    • 区域:根据需求选择目标日志区域。

    • 项目:选择您的日志项目。

    • 类型:根据需求选择库类型。

    • 日志库:选择您的日志库。

    • 查询:自定义查询日志。

    • 查询区间:选择编辑图标,可以设置时间范围。

    告警条件

    • 触发条件:根据需求选择数据触发级别条件,单击添加触发条件,可以设置多个触发条件。

    • 连续次数:当满足条件连续N次,触发报警。

    • 告警检查周期:需要多少时间(分钟或秒)才能产生报警事件。

    • 告警通知内容:自定义告警通知内容。

    标签:自定义标签内容,以<key>:<value>形式设置,单击添加标签设置多个标签。

    注解:自定义注解内容,以<key>:<value>形式设置,单击添加注解设置多个注解。

    image

    报警通知对象

    • 告警联系人组:根据需求选择告警联系人组。

    • 告警联系人:根据需求选择告警联系人。

    • 钉钉:选择机器人告警通知钉钉。

    • 企业微信:选择机器人告警通知企业微信。

    • 飞书:选择机器人告警通知飞书。

    • Slack:选择机器人告警通知Slack。

    • 自定义WebHook:选择告警通知发送到自定义webhook地址。

    • 行动集成:可以将告警通知推送到行动集成预案(如:日志服务、轻量消息队列、函数计算等)。

    • 静默时间:设置一个周期内的静默时间。

    image

管理告警规则

步骤

屏幕快照

报警规则页面您可以查询、编辑或删除告警规则:

  • 搜索:如图标记的序号1,可以根据以下参数进行筛选告警规则。如图标记的序号2,单击高级筛选,可以根据以下参数进行搜索告警规则。

    • 监控类型

    • 规则ID

    • 规则名称

    • 告警状态

    • 启停状态

    • 通知对象

    • 标签过滤

    • 过滤逻辑

  • 编辑:选择目标告警规则,单击右侧操作列中的编辑,在对话框中修改信息,单击确定

  • 删除:选择目标告警规则,单击右侧操作列中的删除,如果需要批量删除,单击告警规则列表下方按钮删除,单击确定

image