您可以为AnalyticDB MySQL版集群设置报警规则,实时监控集群CPU使用率、磁盘使用率、IOPS使用率以及数据库连接数。系统在监控数据满足条件时,会通知报警联系组中的所有联系人。

背景信息

云原生数据仓库AnalyticDB MySQL版支持监控报警,监控报警是通过阿里云云监控实现的。通过云监控,您可以设置监控项,在触发监控项报警规则时,通知报警联系组中的所有联系人。您也可以维护报警监控项对应的报警联系组,以便发生报警时,能及时通知到相关联系人。

监控项包括集群CPU使用率、磁盘使用率、IOPS使用率以及数据库连接数等指标。例如,您可以配置磁盘监控告警,当磁盘水位(磁盘使用率)>=90%时,系统将拒绝您的写数据请求,即写入数据会报错,读数据不受影响。一旦发生磁盘异常立刻为您发出报警通知,让您及时知晓磁盘水位并管理磁盘空间,保证业务正常运行。

操作步骤

  1. 使用阿里云账号登录云原生数据仓库AnalyticDB MySQL控制台
  2. 在页面左上角,选择集群所在地域。
  3. 在左侧导航栏,单击集群列表
  4. 3.0集群列表页签下,单击目标集群ID
  5. 在左侧导航栏单击监控信息
  6. 监控信息页面,单击右上角报警规则设置
    说明 关于监控信息页面的各个监控项具体介绍,请参见查看监控信息
  7. 报警规则列表页面的阈值报警页签下,单击创建报警规则
  8. 创建报警规则页面,按照页面提示进行参数配置。
    参数 说明
    产品 云监控可管理的产品名称,选择云原生数据仓库AnalyticDB MySQL版 3.0
    资源范围 报警规则的作用范围,分为集群全部资源
    • 全部资源:表示该规则作用在用户名下对应产品的全部实例上。例如:您设置了全部资源粒度的云原生数据仓库AnalyticDB MySQL版 3.0磁盘使用率大于或等于90%报警,则只要用户名下有云原生数据仓库AnalyticDB MySQL版 3.0资源范围选择全部资源时,报警的资源最多1000个,超过1000个可能会导致达到阈值不报警的问题,建议您使用应用分组按业务划分资源后再设置报警。
    • 集群:表示该规则只作用在某个具体集群上。例如您如果设置了集群粒度的磁盘使用率大于或等于90%报警,则当该集群磁盘使用率大于或者等于90%时,会发送报警通知。
    规则名称 报警规则的名称。
    规则描述 报警规则的主体,定义在监控数据满足指定条件时,触发报警规则。例如规则描述为磁盘使用率5分钟平均值>=90%,则报警服务会5分钟检查一次数据是否满足平均值>=90%。
    通道沉默周期 报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。
    生效时间 报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
    通知对象 发送报警的联系人组。
    报警级别
    • 电话+短信+邮件+钉钉机器人
    • 短信+邮件+钉钉机器人
    • 邮件+钉钉机器人
    弹性伸缩 如果您选中弹性伸缩,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域弹性伸缩组弹性伸缩规则
    日志服务 如果您选中日志服务,当报警发生时,会将报警信息写入日志服务。您需要设置日志服务的地域ProjectLogstore

    关于如何创建Project和Logstore,请参见快速入门

    邮件备注 自定义报警邮件补充信息。填写邮件备注后,发送报警的邮件通知中会附带您的备注。
    报警回调 填写公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调
  9. 完成上述参数配置后,单击确认即可。