您可以为集群设置报警规则,实时监控集群CPU使用率、磁盘使用率、IOPS使用率以及数据库连接数。系统在监控数据满足条件时,会通知报警联系组中的所有联系人。

背景信息

云原生数据仓库AnalyticDB MySQL版(简称ADB,原分析型数据库MySQL版)支持监控报警,监控报警是通过阿里云云监控实现的。通过云监控,您可以设置监控项,在触发监控项报警规则时,通知报警联系组中的所有联系人。您也可以维护报警监控项对应的报警联系组,以便发生报警时,能及时通知到相关联系人。

监控项包括集群CPU使用率、磁盘使用率、IOPS使用率以及数据库连接数等指标。例如,您可以配置磁盘监控告警,当磁盘水位(磁盘使用率)>=90%时,系统将拒绝您的写数据请求,即写入数据会报错,读数据不受影响。一旦发生磁盘异常立刻为您发出报警通知,让您及时知晓磁盘水位并管理磁盘空间,保证业务正常运行。

操作步骤

  1. 登录AnalyticDB 控制台
  2. 在页面左上角,选择集群所在地域。
  3. 在左侧导航栏,单击集群列表
  4. 3.0集群列表中,单击目标集群ID
  5. 在左侧导航栏单击监控信息
  6. 监控信息页面,单击报警规则设置,系统自动跳转至云监控控制台

    您可以在监控信息页面,单击集群监控或者表监控页签,查看相关监控信息。

    预留模式下,磁盘使用量以百分比形式显示;弹性模式(无需配置磁盘监控)下,显示磁盘的绝对使用量。其他监控项的显示方式,二者相同。

    • 预留模式预留模式
      说明 最大磁盘使用率是指集群实例若干台机器中,磁盘使用量最多的一台,如果该值大于或者等于90%,磁盘将会被锁定。您需要重点关注最大磁盘使用率的值。
    • 弹性模式弹性模式
      说明 弹性模式HDD存储空间自动扩展,控制台集群监控页展现的是实际数据存储量,不存在数据写满磁盘锁定的情况,因此无需配置监控报警。
  7. 报警规则列表页面的阈值报警页签下,单击创建报警规则
  8. 创建报警规则页面,按照页面提示进行参数配置。
    参数1参数2 参数3
    参数 说明
    产品 云监控可管理的产品名称,选择分析型数据库mysql 3.0。
    资源范围 报警规则的作用范围,分为集群全部资源
    • 全部资源:表示该规则作用在用户名下对应产品的全部实例上。例如:您设置了全部资源粒度的分析型数据库mysql 3.0 磁盘使用率>=90%报警,则只要用户名下有分析型数据库mysql 3.0 资源范围选择全部资源时,报警的资源最多1000个,超过1000个可能会导致达到阈值不报警的问题,建议您使用应用分组按业务划分资源后再设置报警。
    • 集群:表示该规则只作用在某个具体集群上。例如您如果设置了集群粒度的磁盘使用率>=90%报警,则当该集群磁盘使用率大于或者等于90%时,会发送报警通知。
    规则名称 报警规则的名称。
    规则描述 报警规则的主体,定义在监控数据满足指定条件时,触发报警规则。例如规则描述为磁盘使用率5分钟平均值>=90%,则报警服务会5分钟检查一次数据是否满足平均值>=90%。
    通道沉默周期 指报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。
    生效时间 报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
    通知对象 发送报警的联系人组。
    报警级别
    • 电话+短信+邮件+钉钉机器人
    • 短信+邮件+钉钉机器人
    • 邮件+钉钉机器人
    邮件备注 自定义报警邮件补充信息。填写邮件备注后,发送报警的邮件通知中会附带您的备注。
    报警回调 填写公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。
  9. 完成上述参数配置后,单击确认创建报警规则。