事件监控汇集了云产品故障、运维事件以及用户业务异常事件,提供按产品、级别、名称、应用分组汇总统计事件,便于关联业务与问题复盘。支持自定义事件通知对象、通知方式,避免关键事件被忽略,并可以记录事件详情,帮您快速分析定位问题。

云产品事件

事件监控为您提供各类云产品产生的系统事件的统一查询和统计入口,使您明确知晓云产品的使用状态,让云更透明。

通过应用分组进行资源分类后,产品产生的系统事件会自动与组中资源关联,帮助您做各类监控信息的信息集成,方便您的业务出现问题时,快速分析、定位问题。

同时还为您提供了事件的报警功能,您可以根据事件等级配置报警,通过短信、邮件、钉钉等接收通知或设置报警回调,使您第一时间知晓严重事件并及时进行处理,形成线上自动化运维闭环。

事件监控为您提供云产品故障、运维事件的查询及报警服务。

  • ECS事件:支持系统错误或实例错误引发的重启、磁盘性能受损等重要ECS系统事件。
  • SLB事件:HTTPS证书过期事件。
  • OSS事件:Bucket上、下行带宽超过流控阈值或汇报阈值。
  • 弹性伸缩事件:弹性伸缩扩、缩容成功、失败。
  • E-MapReduce事件:集群创建失败、超时、服务组件状态。
更多云产品事件请参考云产品事件

自定义事件

事件监控提供事件类型数据的上报、查询、报警功能,方便您将业务中的各类异常事件或重要变更事件收集上报到云监控,并在异常发生时接收报警。

自定义事件监控与自定义监控的区别:

  • 自定义事件监控用于解决非连续的事件类型数据监控数据上报、查询与报警的场景。
  • 自定义监控用于解决周期性持续采集的时间序列监控数据上报、查询与报警的场景。

报警服务与自动化运维

事件监控支持多种报警方式,便于您进行自动化运维。

  • 报警通知:支持语音电话、短信、邮件、钉钉群等通知方式。
  • 消息队列服务:事件可写入您的消息服务队列中,您可通过消息服务与自有运维系统进行对接。
  • 函数计算:事件触发您的函数服务,进行后续运维逻辑处理。
  • 报警回调:通过HTTP协议的POST请求推送报警通知到您指定的公网URL(已有运维体系或消息通知体系),您在接收到报警通知后,可以根据通知内容做进一步处理。