本文为您介绍如何使用云产品事件报警功能,实现系统异常时进行报警的目的。

背景信息

当阿里云产品发生系统异常时,事件监控的报警能力为您提供以下两种通知能力,方便您及时知晓事件发生、自动化处理异常:

  • 提供通过语音电话、短信、邮件、钉钉群的方式,对事件发生进行报警。
  • 将事件分发到您的消息服务队列、函数计算、日志服务、URL回调,以便您根据业务场景自动化处理异常事件。

使用云产品事件报警的准备工作

如果您需要将系统事件分发到您的消息服务队列、函数计算、日志服务、URL回调,那么请准备消息服务队列、函数、日志服务以及报警回调URL。

使用云产品事件报警的实施步骤

您可以先创建事件报警规则,然后使用系统事件的调试功能,模拟系统事件的发生,以便验证报警规则中设置的消息服务队列是否能正常接收时间、函数计算的函数是否能正常被触发。

  • 创建事件报警规则
    1. 登录云监控控制台
    2. 在左侧导航栏选择事件监控
    3. 报警规则页签,点击右上角的创建事件报警,弹出创建/修改事件报警对话框。
    4. 基本信息区域,填写报警规则名称。
    5. 事件报警规则区域,填写如下信息:
      1. 事件类型:选择系统事件
      2. 产品类型、事件等级、事件名称:按照实际情况填写
      3. 资源范围:选择全部资源时,任何资源发生相关事件,都会按照配置发送通知;选择应用分组时,只有指定分组内的资源发生相关事件时,才会发送通知。
    6. 选择报警方式。目前支持报警通知、消息服务队列、函数服务、日志服务和URL回调等方式。
  • 调试报警规则
    1. 进入事件监控的报警规则列表页面。
    2. 点击操作中的调试,进入调试页面。
    3. 选择需要调试的事件,内容中会显示相应的事件内容,可以根据实际情况修改内容中的实例ID等字段。
    4. 点击确定按钮,将根据内容发送一个事件,触发报警规则设置的报警通知、消息服务队列、函数计算、报警回调。