文档

如何配置流转规则

本文档主要介绍如何配置流转规则。

新增流转规则添加

说明

前提条件:需要配置流转规则的监控源已成功接入集成并设置好业务需要的监控项。

  1. 登录运维事件中心控制台

  2. 点击左侧导航栏策略中心>流转规则页面的新增规则按钮进入新增规则页面;

  3. 新增规则页面:

    1. 配置触发条件:设置规则名称规则条件(规则条件需要选择监控源、key)、关联服务;

    2. 配置规则触发报警的收敛规则,触发事件的收敛规则和默认分派策略;

    流转规则列表

配置触发条件

  1. 设置规则名称:自定义流转规则名称简单描述规则的作用,最大输入不超过64个字符,流转规则名称不可重复;

  2. 配置规则条件:一个流转规则可支持创建5个子规则;每个子规则可支持创建5个条件;当所有有条件规则都满足时,才会运行该流转规则。

  • 配置子规则

每个子规则的数据来源来取自同一个监控源,最多可配置5个条件,只生存一条报警记录。

  1. 监控源:只能选择已集的监控源,不同的子规则可以选择同一个监控源;

  2. 报警字段:选择key包含/不包含哪些值;等于/不等于哪些值作为报警条件。

  • 配置时间窗口

配置多子规则时需要配置时间窗口实现报警的降噪,规则条件底部会有“设置时间”窗口,最大时间限制:1440分钟,单位仅支持到分钟。

  • 服务名称

选择当前流转规则关联服务,(添加服务可以参考添加服务步骤)。

image

告警来源:触发事件&报警&故障

重要

以下规则仅适用监控源为:Prometheus/京东云云监控/阿里云云监控等除业务监控外的其他所有监控源。

新增规则页面,选择触发规则的类型;选择仅触发报警需要配置报警触发规则优先级默认通知对象;选择触发事件需配置事件触发规则优先级影响程度默认分派对象;选择触发故障需要配置故障影响服务、故障等级覆盖。配置完成之后点击提交即可

  • 仅触发报警:

    • 确定报警触发规则:设置触发的持续时长和次数对报警进行收敛降噪;如,某个规则在持续5分钟内触发3次才会触发报警,只要将时长和次数分别设置为5分钟和3次即可;

    • 报警优先级:选择报警等级 P1-P4P1最高优,P4最低优;

    • 默认通知对象:流转规则满足触发条件后默认的通知传达对象,支持分派到务组和个人;

    • 默认通知渠道:流转规则满足触发条件默认通知分派对象的通知方式,若选择的默认分配对象是到服务组,通知渠道选择范围:群通知、短信、电话、邮件、移动应用个人通知;可多选;若选择的默认分配对象是到个人,通知渠道选择范围:短信、电话、邮件、移动应用个人通知。

    触发报警
  • 触发事件

    • 确定事件触发规则:设置触发的持续时长和次数对事件进行收敛降噪;如,某个规则在持续5分钟内触发3次才会触发事件,只要将时长和次数分别设置为5分钟和3次即可;

    • 事件优先级:选择事件等级 P1-P4。P1最高优,P4最低优;

    • 影响程度:选择事件影响程度 高或低;

    • 默认分配对象:流转规则满足触发条件后默认的分派对象,支持分派到务组和个人;

    • 配置通知渠道:流转规则满足触发条件默认通知分派对象的通知方式,若选择的默认分配对象是到服务组,通知渠道选择范围:群通知、短信、电话、邮件、移动应用个人通知;可多选;若选择的默认分配对象是到个人,通知渠道选择范围:短信、电话、邮件、移动应用个人通知。

新增流转规则- 触发规则
  • 触发故障

    • 确定故障触发规则:设置触发的持续时长和次数对故障进行收敛降噪;如,某个规则在持续5分钟内触发3次才会触发故障,只要将时长和次数分别设置为5分钟和3次即可;

    • 影响服务:设置故障的影响面;故障触发后,对其同样存在影响的关联服务。

    • 故障等级:选择故障等级P1-P4。P1最高优,P4最低优。

    • 默认通知对象:流转规则满足触发条件后默认的通知传达对象,支持分派到务组和个人;

    • 默认通知渠道:流转规则满足触发条件默认通知分派对象的通知方式,若选择的默认分配对象是到服务组,通知渠道选择范围:群通知、短信、电话、邮件、移动应用个人通知;可多选;若选择的默认分配对象是到个人,通知渠道选择范围:短信、电话、邮件、移动应用个人通知。

    • 升级规则:可配置故障自动升级规则。当故障持续时长达到一定长度,立即触发自动升级策略。如P3故障持续60分钟未解决后,自动升级至P2。故障升级仅支持逐级上升,不可跨级上升。

image

业务监控来源:触发事件&报警&故障

重要

以下规则仅适用于业务监控的监控源。且进行流转规则配置时,会按当前关联服务进行告警数据过滤,因此务必保证流转规则的关联服务和业务监控的关联服务保持一致。

运维事件中心在业务监控经过数据清洗、分析和告警命中,输出标准数据格式,吐到流转规则,供用户进行自定义配置事件、故障定级。

业务监控告警数据包含:监控项ID,监控项名称,告警等级,告警明细等。

  • 监控项ID

当前告警信息来源的监控项ID,用于追溯指标的监控数据。

  • 监控项名称

监控项名称,可用于按监控项建立事件/故障流转规则。

  • 告警等级

提醒、警告、严重、致命。可用于和事件/故障等级从P4-P1一一对应。

  • 告警明细

告警的指标,告警触发条件和当前指标数值。

  • 告警触发时间

业务监控触发告警的时间。

image
重要

在进行业务监控源的流转规则配置时,alarmId必填字段alarmLevel建议(不强制)按等级(提醒、警告、严重、致命)和事件或故障的等级一一对应。便于后续的通告消息可追溯监控项及监控指标。

编辑流转规则

已设置的流转规则可以在流转规则页面操作列点击编辑进行修改,流转规则名称不可重复。

启用禁用流转规则

流转规则页面操作列点击启用/禁用启用后,满足流转规则条件的会触发对应的报警或事件禁用后,收到的原始报警数据不会触发事件或报警

删除流转规则

操作入口:流转规则页面操作列点击删除删除后,不再触发事件和报警

删除条件:禁用状态下无法删除流转规则。

  • 本页导读 (0)
文档反馈