当您需要监控NAS文件系统资源的使用情况时,可以创建报警规则。如果资源的监控指标达到报警条件,云监控自动发送报警通知,帮助您及时得知异常监控数据,并快速处理。

前提条件

操作步骤

  1. 登录云监控控制台
  2. 在左侧导航栏,选择报警服务 > 报警规则,单击创建报警规则
  3. 创建报警规则面板,配置如下相关信息。
    配置项说明
    产品选择文件存储NAS
    资源范围报警规则作用的资源范围。取值:
    • 全部资源:报警规则作用于NAS的全部资源上。
      说明 目前NAS和CPFS共用云监控控制台,选择全部资源时,包含CPFS资源。
    • 应用分组:报警规则作用于NAS的指定应用分组内的全部资源上。
    • 实例:报警规则作用于NAS的指定资源上。
    关联资源当资源范围为应用分组实例时,请在下拉列表中选择需要配置的关联资源。
    规则描述报警规则的主体。当监控数据满足报警条件时,触发报警规则。
    规则描述的设置方法如下:
    1. 单击添加规则
    2. 添加规则描述面板,设置规则名称、监控指标类型、监控指标、阈值、报警级别和报警方式等。
    3. 单击确定
    说明 关于NAS支持的监控指标,请参见监控项
    通道沉默周期报警发生后未恢复正常,间隔多久重复发送一次报警通知。取值:5分钟、15分钟、30分钟、60分钟、3小时、6小时、12小时和24小时。
    某监控指标达到报警阈值时发送报警。
    • 如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知。
    • 如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。
    生效时间报警规则的生效时间,报警规则只在生效时间内才会检查监控数据是否需要报警。
    报警联系人组发送报警的联系人组。

    应用分组的报警通知会发送给该报警联系人组中的报警联系人。报警联系人组是一组报警联系人,可以包含一个或多个报警联系人。

    关于如何创建报警联系人和报警联系人组,请参见创建报警联系人或报警联系组

    标签报警规则的标签。包括标签名称和标签值。
    报警回调公网可访问的URL,用于接收云监控通过POST请求推送的报警信息。目前仅支持HTTP协议。关于如何设置报警回调,请参见使用阈值报警回调
    当您需要测试报警回调地址的连通性时,可以执行以下操作。
    1. 单击回调地址正后方的测试
      WebHook测试面板,您可以通过Webhook返回的状态码和测试结果详情对报警回调地址的连通性进行判断和排查。
      说明 您还可以设置Webhook的回调模板类型语言,再次单击测试,获取对应的测试结果详情。
    2. 单击关闭
    说明 单击高级设置,可配置该参数。
    弹性伸缩如果您打开弹性伸缩开关,当报警发生时,会触发相应的伸缩规则。您需要设置弹性伸缩的地域弹性伸缩组弹性伸缩规则
    说明 单击高级设置,可配置该参数。
    日志服务如果您打开日志服务开关,当报警发生时,会将报警信息写入日志服务的日志库。您需要设置日志服务的地域ProjectNameLogstore

    关于如何创建Project和Logstore,请参见快速入门

    说明 单击高级设置,可配置该参数。
    消息服务MNS-Topic如果您打开消息服务MNS-Topic开关,当报警发生时,会将报警信息写入消息服务的主题。您需要设置消息服务的地域和主题。

    关于如何创建主题,请参见创建主题

    说明 单击高级设置,可配置该参数。
    无数据报警处理方法无监控数据时报警的处理方式。取值:
    • 不做任何处理(默认值)
    • 发送无数据报警
    • 视为正常
  4. 单击确定,完成报警规则的设置。

    当文件系统的监控项超过设定阈值后会自动发送报警通知,使您及时获取监控数据异常。

报警规则配置案例

您可以参照以下示例为NAS实例、全部资源或应用分组配置报警规则,及时得知异常监控数据并快速处理。关于NAS支持的监控指标,请参见监控项

配置单个指标监控

例如,配置某个通用型文件系统读延迟连续3个周期超过5毫秒时,触发警告级别的报警。资源范围和规则描述的配置项建议如下。其他配置信息请参见步骤3
  • 资源范围:实例。
  • 关联资源:选择某个通用型文件系统ID(例如,033a04xxxx)。资源范围
  • 规则描述读延迟
    参数示例值
    指标类型单指标
    监控指标读延迟
    阈值及报警级别
    • 警告级别:警告
    • 周期:连续3个周期(1周期=1分钟)
    • 监控值:>=
    • 阈值:5

配置多个指标监控

例如,配置某个文件系统在连续的1个周期中,读写延迟超过5 ms或低频介质存储容量同比昨天同时间上涨40%时,触发紧急级别的报警。资源范围和规则描述的配置项建议如下。

  • 资源范围:实例
  • 关联资源:选择某个通用型文件系统ID(例如,033a04xxxx)。资源范围
  • 规则描述多指标配置
    参数示例值
    指标类型多指标
    报警级别紧急
    指标类型标准创建
    多指标报警描述
    1. 单击添加指标,在监控指标下拉框中选择capacity > 低频介质数据量
    2. 选择监控值(本示例选择同比昨天同时间上涨)。
    3. 设置阈值,本示例为40。
    4. 然后参照以上步骤依次设置volume > 读延迟volume > 写延迟指标。
    说明 关于如何设置复杂的报警条件,请参见报警规则表达式说明
    多指标关系有一个满足条件就报警(||)
    发出报警需要满足达到阈值的次数连续1个周期

更多参考