云数据库Redis产品已接入云监控平台,通过对重要的系统事件设置报警规则,让您在第一时间得知事件的发生与进展,帮助您实时掌握事件动态。

背景信息

云监控(CloudMonitor)是针对阿里云资源和互联网应用提供监控的服务。云监控的报警服务为您提供以下两种报警通知能力,当阿里云产品发生系统异常时,您可以及时知晓发生的事件,并自动处理异常事件(例如云产品故障)。

  • 提供通过短信、邮件、钉钉机器人的方式,对事件发生进行报警。
  • 提供将事件分发到您的消息服务队列、函数计算、URL回调和日志服务中,以便您根据业务场景自动化处理异常事件。

步骤一:设置事件报警

说明 报警联系人和联系组是云监控发送报警通知的基础。您需要先创建报警联系人和报警联系组,并将报警联系人添加到报警联系组,具体操作请参见创建报警联系人或报警联系组
  1. 访问Redis实例列表,在上方选择地域,然后单击目标实例ID。
  2. 在左侧导航栏,单击报警设置
  3. 在页面右上方,单击报警设置,进入云监控控制台。
  4. 在左侧导航栏,选择事件监控 > 系统事件
  5. 单击事件报警规则页签。
  6. 单击创建报警规则
  7. 创建/修改事件报警面板,设置系统事件的报警规则参数。
    参数 说明
    报警规则名称 事件报警规则的名称,长度不超过30个字符,支持英文字母、数字和下划线(_)。
    产品类型 选择为云数据库Redis版,您也可以为其他云产品创建事件报警,操作流程与本文类似。
    事件类型 事件报警规则的事件类型。每个云产品支持的事件类型,请参见云产品系统事件
    事件等级 选择事件的等级,目前云数据库Redis支持的事件等级为严重警告
    事件名称 事件报警规则的事件名称。根据事件等级的设置不同,本参数支持选项也有所不同。关于事件类型和事件等级的关系,请参见云数据库Redis的系统事件,其他云产品请参见云产品系统事件概述
    关键词过滤 报警规则过滤的关键词。取值:
    • 满足包含上面任何一个关键词:当您的报警规则中包含任何一个关键词时,不发送报警通知。
    • 满足不包含上面任何一个关键词:当您的报警规则中不包含任何一个关键词时,不发送报警通知。
    SQL Filter SQL过滤语句。
    资源范围 事件报警规则作用的资源范围。取值:
    • 全部资源:当资源范围选择全部资源时,任何资源发生相关事件,都会按照配置发送通知。
    • 应用分组:当资源范围选择应用分组时,只有指定应用分组内的资源发生相关事件,才会发送通知。
    联系人组 事件报警规则的报警联系人组。
    通知方式 事件报警的级别和通知方式。取值:
    • Critical(电话+短信+邮件+钉钉机器人)
    • Warning(短信+邮件+钉钉机器人)
    • Info(邮件+钉钉机器人)
    消息服务队列 事件报警投递到消息服务的指定队列。
    函数计算 事件报警投递到函数计算的指定函数。
    URL回调 公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用系统事件报警回调
    日志服务 事件报警投递到日志服务的指定日志库。
    通道沉默周期 报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。
  8. 单击确定

步骤二:调试事件通知

创建事件报警规则后,您可以使用系统事件的调试功能,验证系统事件报警规则中设置的消息服务队列、函数计算、URL回调和日志服务是否能正常被触发。

  1. 登录云监控控制台
  2. 在左侧导航栏,选择事件监控 > 系统事件
  3. 单击事件报警规则页签。
  4. 单击目标报警规则对应操作列的调试
  5. 创建事件调试面板,选择待调试事件。
  6. 内容(JSON格式)区域,显示该事件内容,您可以根据实际环境修改其实例ID等信息。
  7. 单击确定
    云监控根据内容发送一个报警事件,触发报警规则。

相关API

云监控产品的API接口 说明
PutEventRule 创建或修改事件的报警规则。