日志服务告警系统支持告警智能合并,在不遗漏重要告警的前提下,有效减少告警数量。本文介绍基于告警智能合并的告警降噪管理方案。
简介
在监控场景下,一旦出现告警风暴,告警本身就会失去意义和价值。日志服务告警智能合并功能,支持一键开启,用于抑制告警风暴。
告警智能合并通过智能算法自动合并,将重复、冗余或者有关联的告警合并到一个分组中,并且每个分组的告警在一段时间内只会通知一次,从而有效减少告警通知的数量。
告警智能合并在最小化您的配置成本的同时,还会通过机器学习、NLP算法,自动学习告警之间的关联或相似关系进行合并,达到智能降噪的效果。
工作流程
告警智能合并主要包括如下流程。
- 多源告警数据汇集:汇集不同来源的告警数据,进行集中处理。
- 告警文本预处理:基于告警专业特色词/停用词库、数据字典、人工标注信息等,对告警全文本进行预处理,剔除无用文本,提取关键词。
- 告警文本聚类:采用两种不同的聚类技术对告警文本进行聚类。
- MinJoin聚类算法:通过最小化局部哈希值进行文本编辑距离计算及聚类。
- 向量相似度聚类:首先对告警文本进行分词,然后利用特征工程将其向量化表示,最后基于告警向量之间的相似度(如余弦相似度等)进行聚类。
- 聚类簇合并:将上述得到的聚类结果进行合并,获得告警智能合并的最终结果。
操作步骤
您可以在设置告警策略时,打开智能合并模式开关。