文档

使用报警服务

更新时间:

当您需要监控OSS资源的使用情况时,可以创建报警规则。如果资源的监控指标达到报警条件,云监控自动发送报警通知,帮助您及时得知异常监控数据,并快速处理。

创建报警规则

  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警规则

  3. 报警规则页面,单击创建报警规则

  4. 创建报警规则面板,设置报警规则相关参数。

    参数

    说明

    产品

    选择对象存储OSS

    资源范围

    报警规则作用的资源范围。取值:

    • 全部资源:报警规则作用于OSS所有资源。

    • 应用分组:报警规则作用于OSS指定应用分组内的全部资源。

    • 实例:报警规则作用于OSS的指定资源。

    规则描述

    报警规则的主体。当监控数据满足报警条件时,触发报警规则。规则描述的设置方法如下:

    1. 单击添加规则

    2. 添加规则描述面板,设置规则名称、指标类型、监控指标、阈值及报警级别等。

      重要
      • 如果设置的报警通知方式包含电话+短信,则报警短信的免费额度为1000条/月,超出部分,按量付费。报警电话无免费额度,需按量付费。更多信息,请参见按量计费

      • 如果设置的报警通知方式为邮件+WebHook,可免费使用。

      如果设置的报警通知方式为邮件+WebHook,可免费使用。

    3. 单击确定

    通道沉默周期

    报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。

    某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。

    生效时间

    报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。

    报警联系人组

    发送报警的联系人组。

    应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。

    关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系组

    报警回调

    公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调

    说明

    单击高级设置,可设置该参数。

    弹性伸缩

    如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域弹性伸缩组弹性伸缩规则

    说明

    单击高级设置,可设置该参数。

    日志服务

    如果您打开日志服务开关,当报警发生时,会将报警信息写入日志服务的日志库。您需要设置日志服务的地域ProjectNameLogstore

    关于如何创建Project和Logstore,请参见快速入门

    说明

    单击高级设置,可设置该参数。

    消息服务MNS-Topic

    如果您打开消息服务MNS-Topic开关,当报警发生时,会将报警信息写入消息服务的主题。您需要设置消息服务的地域和主题。

    关于如何创建主题,请参见创建主题

    说明

    单击高级设置,可设置该参数。

    无数据处理方法

    无监控数据时报警的处理方式。取值:

    • 不做任何处理(默认值)

    • 发送无数据报警

    • 视为恢复

    说明

    单击高级设置,可设置该参数。

    标签

    报警规则的标签。包括标签名称和标签值。

  5. 单击确认

管理报警规则

您可以对已创建的报警规则执行以下常见操作:

操作

说明

修改报警规则

当已有报警规则不能满足您指定云产品的监控指标的报警需求时,您可以根据需要修改报警规则。

禁用报警规则

当您需要手动停止云产品服务,进行维护或升级时,可以禁用报警规则,避免因人为变更而收到大量且无用的报警通知。

启用报警规则

当您完成云产品的维护或升级后,可以重新启用报警规则。

删除报警规则

当您不再需要某条报警规则时,可以对其执行删除操作。

重要

删除Bucket不会自动删除关联该Bucket的报警规则。如果您不希望保留已创建的报警规则,请手动删除规则。

查看目标报警规则的报警历史

您可以查看指定报警规则中的所有故障资源的报警详情和报警图表,及时定位并处理资源故障。

使用阈值报警回调

云监控除了电话、短信、邮件和WebHook的报警通知方式外,还可以使用报警回调方式,实现将云监控发送的报警通知集成到已有的运维系统或消息通知系统。

报警通知合并

当同一个阿里云账号的多个资源在同一报警规则和周期内同时报警时,为减少报警资源的消耗和冗余信息的干扰,云监控在第一条报警通知发出后,以一分钟为周期对后续的报警通知进行合并发送。