文档

如何对SLS多logstore告警实现统一的分派流转

更新时间:

文档简介本文档介绍《如何对SLS多logstore的日志告警进行统一的事件分派流转》。

场景

SLS日志服务中通常会通过不同的logstore管理不同应用服务的日志,并以logstore为最小项目单元管理告警;运维事件中心会将SLS的原始告警通过集成密钥接入,基于logstore配置不同的流转规则来实现事件风险任务的定向分派流转;通过钉群协同实现研发运维的快速协同,缩短事件的MTTR,提升事件处理效率,降低业务风险。

视频演示

SLS日志服务配置不同的logstore

说明

根据实际的业务场景配置不同应用服务对应的logstore。

  1. 针对应用服务1和应用服务2分别配置2个logstore:internal-alert-center-log&gam-event-daliy 。

    internalimage

  2. 将logstore下的告警集成接入运维事件中心。

    说明

    运维事件中心阿里云SLS集成接入步骤。

    告警推送运维事件中心

配置流转规则

  1. 分别对:internal-alert-center-log、gam-event-daliy两个不同应用服务的logstore配置2个不同的流转规则。

    流转规则列表

  2. 将流转规则关联相关的服务和服务组。说明 :将服务、服务组、流转规则都取应用服务名称为前缀名称。

    imageimage

事件分派与钉群协同

  1. internal-alert-center-log、gam-event-daliy两个流转规则的原始告警分别满足时,流转规则默认分派的服务组对应的钉群即时接收到待响应的事件卡片。

    钉群协同

  2. 团队成员可以通过触发事件的logstore名称区分各自的任务,清晰区分事件风险来自哪个应用服务,并支持在钉钉侧直接响应、完结、查看事件详情信息。

    钉群协同完结

  3. 事件升级为故障或补录故障升级补录故障发送故障通告

  4. 故障通告&故障恢复通告故障通告