设置报警规则

更新时间:

您可以为AnalyticDB for MySQL集群设置报警规则,实时监控集群CPU使用率、磁盘使用率、IOPS使用率、查询耗时以及数据库连接数。系统在监控数据满足条件时,会通知报警联系组中的所有联系人。

背景信息

云原生数据仓库 AnalyticDB MySQL 版支持监控报警,监控报警是通过阿里云云监控实现的。通过云监控,您可以设置监控项,在触发监控项报警规则时,通知报警联系组中的所有联系人。您也可以维护报警监控项对应的报警联系组,以便发生报警时,能及时通知到相关联系人。

监控项包括集群CPU使用率、磁盘使用率、IOPS使用率、查询耗时以及数据库连接数等指标,详情请参见云原生数据仓库AnalyticDB MySQL版3.0。例如,您可以配置磁盘监控告警,当磁盘水位(磁盘使用率)>=80%时,系统将发出报警通知;当磁盘水位(磁盘使用率)>=90%时,集群将被锁定,系统会发出报警通知并拒绝您的写数据请求,即写入数据会报错,读数据不受影响。一旦发生磁盘异常立刻为您发出报警通知,让您及时知晓磁盘水位并管理磁盘空间,但每个报警联系人一天最多被通知4次磁盘报警,收到报警时,请及时处理保证业务正常运行。

操作步骤

  1. 登录云原生数据仓库AnalyticDB MySQL控制台,在左上角选择集群所在地域。在左侧导航栏,单击集群列表。在集群列表上方,选择产品系列,然后单击目标集群ID。

  2. 在左侧导航栏单击监控报警

  3. 单击报警页签,在报警页面,单击创建报警规则

  4. 创建报警规则页面,按照页面提示进行参数配置。

    参数

    说明

    资源范围

    报警规则的作用范围,取值说明:

    • 全部资源:表示该规则作用在用户名下对应产品的全部实例上。例如:您设置了全部资源粒度的云原生数据仓库 AnalyticDB MySQL 版磁盘使用率大于或等于80%报警,则只要用户名下有云原生数据仓库 AnalyticDB MySQL 版资源范围选择全部资源时,报警的资源最多1000个,超过1000个可能会导致达到阈值不报警的问题,建议您使用应用分组按业务划分资源后再设置报警。

    • 应用分组:报警规则作用于指定云产品的指定应用分组内的全部资源上。

    • 实例:表示该规则只作用于指定云产品的指定实例上。例如您如果设置了实例粒度的磁盘使用率大于或等于80%报警,则当该实例磁盘使用率大于或者等于80%时,会发送报警通知。

    规则描述

    报警规则的主体。当监控数据满足报警条件时,触发报警规则。 规则描述的设置方法如下:

    1. 单击添加规则

    2. 添加规则描述面板,设置规则名称指标类型监控指标阈值及报警级别监控图表预览等。

    3. 单击确定

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    生效时间

    报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。

    重要

    磁盘水位报警每个报警联系人一天最多被通知4次,超过4次将被静默。

    报警联系人组

    发送报警的联系人组。

    应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系人组

    报警回调

    填写公网可访问的URL,云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调

    说明

    单击高级设置,可设置该参数。

    弹性伸缩

    如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域弹性伸缩组弹性伸缩规则

    说明

    单击高级设置,可设置该参数。

    日志服务

    如果您打开日志服务开关,当报警发生时,会将报警信息写入日志服务。您需要设置日志服务的地域ProjectLogstore

    关于如何创建Project和Logstore,请参见快速入门

    说明

    单击高级设置,可设置该参数。

    轻量消息队列(原 MNS)— topic

    如果您打开轻量消息队列(原 MNS)— topic开关,当报警发生时,会将报警信息发送至消息服务的主题。您需要设置消息服务的地域和主题。

    关于如何创建主题,请参见创建主题

    无数据报警处理方法

    无监控数据时报警的处理方式。取值:

    • 不做任何处理(默认值)

    • 发送无数据报警

    • 视为恢复

    说明

    单击高级设置,可设置该参数。

    标签

    报警标签会添加到报警内容中。标签名称和标签值是一一对应的,可以设置多对标签。

  5. 完成上述参数配置后,单击确认即可。