如何配置流转规则

本文档主要介绍如何配置流转规则。

新增流转规则添加

说明

前提条件:需要配置流转规则的监控源已成功接入集成并设置好业务需要的监控项。

  1. 登录运维事件中心

  2. 在左侧导航栏选择策略中心 > 流转规则,进入流转规则页面。

  3. 单击新增规则进入新增规则页面。

  4. 新增规则页面:

    1. 配置触发条件:设置规则名称触发规则(规则条件需要选择监控源、key)、服务名称

    2. 配置规则触发报警的收敛规则,触发事件的收敛规则和通知/分派规则

    流转规则列表

配置触发条件

  1. 设置规则名称:自定义流转规则名称简单描述规则的作用,最大输入不超过64个字符,流转规则名称不可重复。

  2. 选择当前流转规则关联服务(添加服务可参见新增服务)。

  3. 配置触发规则

  • 触发类型:触发类型需要用户根据告警严重程度主观选择触发类型。

  • 配置子规则:同一流转规则可以配置1-5条子规则,所有子规则的数据源,取自同一监控源,当监控源满足所有或任一子规则时,该流转规则才会被触发。

    image

  1. 报警字段:选择key包含/不包含哪些值;等于/不等于哪些值作为报警条件。

  2. 监控源:只能选择已集成的监控源,不同子规则可以选择同一个监控源。

  3. 配置降噪规则:配置多子规则时需要配置时间窗口实现报警的降噪,规则条件底部会有“设置时间”窗口,最大时间限制为1440分钟,时间单位仅支持分钟。

告警来源:触发事件&报警&故障

重要

以下规则仅适用监控源为:Prometheus/京东云云监控/阿里云云监控等,除业务监控外的所有其他监控源。

新增规则页面,选择触发规则的类型;选择仅触发报警需要配置报警触发规则优先级默认通知对象;选择触发事件需配置事件触发规则优先级影响程度默认分派对象;选择触发故障需要配置故障影响服务、故障等级覆盖。配置完成之后单击提交即可。

  • 仅触发报警:

    • 确定报警触发规则:设置触发的持续时长和次数对报警进行收敛降噪;如,某个规则在持续5分钟内触发3次才会触发报警,只要将时长和次数分别设置为5分钟和3次即可。

    • 报警优先级:选择报警等级 P1-P4P1为最高优先级,P4最低。

    • 默认通知对象:流转规则满足触发条件后默认的通知传达对象,支持分派到务组个人

    • 默认通知渠道:流转规则满足触发条件默认通知分派对象的通知方式,若选择的默认分配对象是到服务组,通知渠道选择范围:群通知短信电话邮件移动应用个人通知,可多选。若选择的默认分配对象是到个人,通知渠道选择范围:短信电话邮件移动应用个人通知

    触发报警

  • 触发事件

    • 确定事件触发规则:设置触发的持续时长和次数对事件进行收敛降噪;如,某个规则在持续5分钟内触发3次才会触发事件,只要将时长和次数分别设置为5分钟和3次即可。

    • 事件优先级:选择事件等级,P1为最高优先级,P4最低。

    • 影响程度:选择事件影响程度

    • 默认分配对象:流转规则满足触发条件后默认的分派对象,支持分派到务组个人

    • 配置通知渠道:流转规则满足触发条件默认通知分派对象的通知方式,若选择的默认分配对象是到服务组,通知渠道选择范围:群通知短信电话邮件移动应用个人通知,可多选。若选择的默认分配对象是到个人,通知渠道选择范围:短信电话邮件移动应用个人通知

    新增流转规则- 触发规则

  • 启动故障应急

    • 确定故障触发规则:设置触发的持续时长和次数对故障进行收敛降噪;如,某个规则在持续5分钟内触发3次才会触发故障,只需将时长和次数分别设置为5分钟和3次即可。

    • 影响服务:设置故障的影响面;故障触发后,对其同样存在影响的关联服务。

    • 故障等级:选择故障等级P1-P4P1为最高优先级,P4最低。

    • 默认通知对象:流转规则满足触发条件后默认的通知传达对象,支持分派到务组和个人

    • 默认通知渠道:流转规则满足触发条件默认通知分派对象的通知方式,若选择的默认分配对象是到服务组,通知渠道选择范围:群通知短信电话邮件移动应用个人通知,可多选。若选择的默认分配对象是到个人,通知渠道选择范围:短信电话邮件移动应用个人通知

    • 升级规则:可配置故障自动升级规则。当故障持续时长达到一定长度,立即触发自动升级策略。如P3故障持续60分钟未解决后,自动升级至P2。故障升级仅支持逐级上升,不可跨级上升。

    image

业务监控来源:触发事件&报警&故障

重要

以下规则仅适用于业务监控的监控源。且进行流转规则配置时,会按当前关联服务进行告警数据过滤,因此务必保证流转规则的关联服务和业务监控的关联服务保持一致。

运维事件中心在业务监控经过数据清洗、分析和告警命中,输出标准数据格式,吐到流转规则,供用户进行自定义配置事件、故障定级。

业务监控告警数据包含:监控项ID,监控项名称,告警等级,告警明细等。

  • 监控项ID:当前告警信息来源的监控项ID,用于追溯指标的监控数据。

  • 监控项名称:监控项名称,可用于按监控项建立事件/故障流转规则。

  • 告警等级:提醒、警告、严重、致命。可用于和事件/故障等级从P4-P1一一对应。

  • 告警明细:告警的指标,告警触发条件和当前指标数值。

  • 告警触发时间:业务监控触发告警的时间。

image

重要

在进行业务监控源的流转规则配置时,alarmId为必填字段,alarmLevel建议(不强制)按等级(提醒、警告、严重、致命)和事件或故障的等级一一对应。便于后续的通告消息可追溯监控项及监控指标。

编辑流转规则

已设置的流转规则可以在流转规则页面操作列单击编辑进行修改,流转规则名称不可重复。

启用禁用流转规则

流转规则页面操作列单击启用/禁用启用后,满足流转规则条件的会触发对应的报警事件禁用后,收到的原始报警数据不会触发事件或报警

删除流转规则

  • 操作入口:流转规则页面操作列单击删除删除后,不再触发事件和报警。

  • 删除条件:禁用状态下无法删除流转规则。