告警管理是日志服务告警子系统,负责管理告警降噪和告警事务。
架构
告警管理系统接收来自于告警监控系统的告警事务,完成告警编排(例如静默、抑制、去重等),然后将告警事务发送给通知管理系统,再由通知管理系统通知用户。告警管理系统还提供了告警中心控制台,用于管理告警事务、查看告警链路中心仪表盘和规则中心仪表盘等。
日志服务告警管理系统架构如下图所示:

告警策略
告警策略是告警管理系统的配置实体,当告警管理系统接收到告警事务(含恢复通知)时,自动按照对应的告警策略,进行告警降噪等操作。

- 告警合并
告警合并是将具有相同特征的告警进行分组,便于进行统一通知或后续处理,在一定程度上避免告警风暴。更多信息,请参见多种告警分组合并。
- 告警抑制
告警抑制用于阻止由某告警引发的其他告警通知。例如网络异常时,会导致服务请求延迟过高或者核心链路服务异常,相关非核心服务也会产生异常。此时您最关注是快速处理严重度高、更核心的告警,其它告警延迟处理。为避免一次性发送所有告警通知,您可以使用抑制功能。更多信息,请参见告警抑制机制。
- 告警静默
告警静默用于禁止一段时间内的告警通知。例如在特定时间内维护测试环境,会产生大量的相关告警,此时可通过静默功能避免接收到大量的告警通知。更多信息,请参见告警静默机制。
- 告警策略继承
告警策略之间可以有继承关系,最终的作用效果相当于父策略和子策略合并后的作用效果。更多信息,请参见告警策略继承机制。
- 数据隔离
不同告警策略之间的数据是完全隔离的。