基本概念

本文主要介绍运维事件中心的基本概念。

集成中心

名词概念

说明

监控源

监控源表示上游监控系统,包括阿里云监控系统、开源监控系统、其他云厂商监控系统、业界商业化监控系统。监控源产生的告警是整个报警、事件、故障的源头。

集成接入

集成接入是将监控源跟运维事件中心数据打通的必要配置。本产品提供了详细的集成步骤,帮助用户完成集成接入。

集成密钥

集成密钥是监控源跟运维事件中心数据打通的唯一标识。每一个监控源的集成接入,都需要配置对应的集成密钥。

策略中心

名词概念

说明

策略中心

策略中心是整个运维事件中心产品的运行中枢,包含流转规则、通知订阅功能。

规则条件

规则条件是将已集成接入的监控源告警分发为事件或报警的触发器。同一规则条件下的告警,都将会被收敛、抑制为一个事件/报警。

更多请查看什么是流转规则

时间窗口

时间窗口是多个规则条件“同时”执行的有效时间范围。仅当规则条件中存在2个及以上监控源时,才需要设置时间窗口。

举例:A监控源配置了a规则条件,B监控源配置了b规则条件,时间窗口设置为:10分钟。则表示当A监控源触发了满足a规则条件的告警,并且在10分钟内,B监控源触发了满足b规则条件的告警,条件才会满足,才会进行事件/报警的分发。a、b规则条件满足无前后顺序要求,在10分钟内同时触发即可。

通知渠道

事件/报警/故障触发时的通知渠道,目前支持:IM群通知(钉钉、企业微信)、电话、短信、邮件。

通知类型

通知类型是将事件/报警/故障按照不同优先级、不同影响程度,选择不同通知渠道的订阅配置。

更多请查看什么是通知订阅

升级策略

升级策略是针对所有事件,按照不同优先级、影响程度,制定系列不同时间、通知策略的规则合集。通过灵活自定义的升级通知策略,帮助用户及时关注并解决关键事件。

更多请查看什么是升级策略

事件中心

名词概念

说明

告警

所有监控源推送至运维事件中心的记录,均被称为告警。

报警

监控源的告警按照规则条件分发并且触发类型为报警时,所有的记录在产品里将被称为报警。

更多请查看什么是报警

事件

监控源的告警按照规则条件分发并且触发类型为事件时,所有的记录在产品里将被称为事件。

事件比报警优先级更高,将强调分派到具体责任人,并持续跟进解决、归档记录。

更多请查看什么是事件

故障

在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。

故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时,需升级为故障进行深度跟进。

更多请查看什么是故障

服务中心

名词概念

说明

服务

服务是企业业务连续性管理的最小单元。

更多请查看什么是服务