告警管理提供了可靠的告警收敛、通知、自动升级以及其他功能,帮助您快速检测和修复业务告警。本文主要介绍了告警管理的实现原理和优势。

使用说明

ARMS新版告警管理功能仅对2021年04月30日0点之后开通ARMS的阿里云账户开放。如果您想体验该功能,请联系ARMS钉钉服务账号arms160804开通使用。

实现原理

告警管理-实现原理
序号 描述
将自建Prometheus、ARMS、日志服务、云监控或自定义事件集成到ARMS告警管理中。
ARMS告警管理将集成的所有事件汇总并去重。
ARMS告警管理通过静默过滤,过滤掉不重要的、不需要发送告警通知的事件。
ARMS告警管理通过通知策略和升级策略对所有告警事件进行分派,并通过电话、短信、邮件、钉钉等方式发送告警通知,其中,通过钉群发送的告警通知可以在钉钉群中管理告警。

优势

当业务部署到阿里云并使用ARMS产品监控业务后,如果使用告警管理功能处理业务告警,ARMS告警管理能从以下几点来提升您的运维效率。

  • 集成事件后管理更高效。
    • 告警管理默认支持一键化集成阿里云常见的监控工具,并支持更多的监控工具手动接入,方便统一维护。
    • 事件接入模块稳定,能提供7x24小时的无间断事件处理服务。
    • 处理海量事件数据时可以保证低延时。
  • 及时准确地将告警通知给联系人。
    • 配置通知规则,对事件合并后再发送告警通知,减少运维人员出现通知疲劳的情况。
    • 根据告警的紧急程度选择邮件、短信、电话、钉钉等不同的通知方式,来提醒联系人处理告警。
    • 通过升级通知对长时间没有处理的告警进行多次提醒,保证告警及时解决。
  • 帮助您快速便捷地管理告警。
    • 联系人能通过钉钉随时处理告警。
    • 使用通用告警格式,联系人能更好的分析告警。
    • 多个联系人通过钉钉协同处理。
  • 统计告警数据,实时分析处理情况,改进告警处理效率。