本文主要介绍运维事件中心的基本概念。
集成中心
名词概念 | 说明 |
监控源 | 监控源表示上游监控系统,包括阿里云监控系统、开源监控系统、其他云厂商监控系统、业界商业化监控系统。监控源产生的告警是整个报警、事件、故障的源头。 |
集成接入 | 集成接入是将监控源跟运维事件中心数据打通的必要配置。本产品提供了详细的集成步骤,帮助用户完成集成接入。 |
集成密钥 | 集成密钥是监控源跟运维事件中心数据打通的唯一标识。每一个监控源的集成接入,都需要配置对应的集成密钥。 |
策略中心
名词概念 | 说明 |
策略中心 | 策略中心是整个运维事件中心产品的运行中枢,包含流转规则、通知订阅功能。 |
规则条件 | 规则条件是将已集成接入的监控源告警分发为事件或报警的触发器。同一规则条件下的告警,都将会被收敛、抑制为一个事件/报警。 更多请查看什么是流转规则 |
时间窗口 | 时间窗口是多个规则条件“同时”执行的有效时间范围。仅当规则条件中存在2个及以上监控源时,才需要设置时间窗口。 举例:A监控源配置了a规则条件,B监控源配置了b规则条件,时间窗口设置为:10分钟。则表示当A监控源触发了满足a规则条件的告警,并且在10分钟内,B监控源触发了满足b规则条件的告警,条件才会满足,才会进行事件/报警的分发。a、b规则条件满足无前后顺序要求,在10分钟内同时触发即可。 |
通知渠道 | 事件/报警/故障触发时的通知渠道,目前支持:IM群通知(钉钉、企业微信)、电话、短信、邮件。 |
通知类型 | 通知类型是将事件/报警/故障按照不同优先级、不同影响程度,选择不同通知渠道的订阅配置。 更多请查看什么是通知订阅 |
升级策略 | 升级策略是针对所有事件,按照不同优先级、影响程度,制定系列不同时间、通知策略的规则合集。通过灵活自定义的升级通知策略,帮助用户及时关注并解决关键事件。 更多请查看什么是升级策略 |
事件中心
名词概念 | 说明 |
告警 | 所有监控源推送至运维事件中心的记录,均被称为告警。 |
报警 | 监控源的告警按照规则条件分发并且触发类型为报警时,所有的记录在产品里将被称为报警。 更多请查看什么是报警 |
事件 | 监控源的告警按照规则条件分发并且触发类型为事件时,所有的记录在产品里将被称为事件。 事件比报警优先级更高,将强调分派到具体责任人,并持续跟进解决、归档记录。 更多请查看什么是事件 |
故障 | 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。 故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时,需升级为故障进行深度跟进。 更多请查看什么是故障 |
服务中心
名词概念 | 说明 |
服务 | 服务是企业业务连续性管理的最小单元。 更多请查看什么是服务 |