云监控服务具有监控数据收集、可视化和实时监控报警等功能。后台云监控会根据您配置的报警规则,判断资源的使用是否超过配置的阈值。如果超过,则通过短信、邮件、旺旺、钉钉机器人等方式通知相应的联系人,以便及时处理异常消息。本文介绍如何为云消息队列 RocketMQ 版上的资源创建报警规则。

云监控服务的详细信息,请参见云产品监控

步骤一:创建服务关联角色

首次使用云监控提供的监控报警功能时,云消息队列 RocketMQ 版会自动为您创建服务关联角色AliyunServiceRoleForOns,以此访问云监控的云资源。云消息队列 RocketMQ 版服务关联角色的详细信息,请参见服务关联角色

  1. 登录云消息队列 RocketMQ 版控制台
  2. 在左侧导航栏,单击实例列表
  3. 在顶部菜单栏,选择地域,如华东1(杭州)
  4. 实例列表页面,找到目标实例,在其操作列,单击详情
  5. 在左侧导航栏,单击监控报警
  6. 服务关联角色对话框,单击确定
    SLR

步骤二:查看监控报表信息

  1. 登录云消息队列 RocketMQ 版控制台
  2. 在左侧导航栏,单击实例列表
  3. 在顶部菜单栏,选择地域,如华东1(杭州)
  4. 实例列表页面,找到目标实例,在其操作列,单击详情
  5. 在左侧导航栏,单击监控报警,并选择需要查看监控数据的资源。
    cloud_monitor_list
    • 如需查看实例的报警信息,请选择实例 > 云监控。示例如下。实例监控
    • 如需查看Topic的报警信息,请选择Topic > 云监控。示例如下。cloud_mointor_topic
    • 如需查看Group ID的报警信息,请选择Group > 云监控。示例如下。cloud_mointor_group
      说明

      消息堆积(个)

      此监控项表示该Group ID下所堆积的消息数量。消息堆积的详细信息,请参见基本概念

您可以选择查看最近1小时、3小时、6小时、12小时、1天、3天、7天或14天的数据,也可以单击最右端的时间选择框,自定义要查看的时间段。

若您要自定义时间段,最长能查看最近31天的数据(超过31天的数据不保留),即时间选择框中的结束时间为当前系统时间,而开始时间最早可为31天前。若结束时间不是当前系统时间,则可查看31天内最长任意7天的数据。

说明 监控项的数据聚合周期为1分钟。

步骤三:设置报警规则

  1. 登录云消息队列 RocketMQ 版控制台
  2. 在左侧导航栏,单击实例列表
  3. 在顶部菜单栏,选择地域,如华东1(杭州)
  4. 实例列表页面,找到目标实例,在其操作列,单击详情
  5. 在左侧导航栏,单击监控报警
  6. 监控报警页面左上角,单击配置报警规则
  7. 创建报警规则页面,设置报警规则和通知方式,详细信息,请参见创建报警规则
    set_mointor_rule
    说明 如需接收短信通知,您需登录云监控控制台,在概览页单击购买短信,购买相应的短信服务。

    云消息队列 RocketMQ 版监控项说明如下表所示。

    说明 已就绪消息量已就绪消息排队时间指标的详细说明,请参见相关概念
    监控项单位MetricNameDimensionsStatistics
    消息堆积量(Group)countConsumerLaguserId、instanceId、groupIdSum
    消息处理延迟时间(GroupId)millisecondConsumerLagLatencyPerGiduserId、instanceId、groupIdMaximum
    消息处理延迟时间(GroupId&Topic)millisecondConsumerLagLatencyPerGidTopicuserId、instanceId、topic、groupIdMaximum
    消息堆积量(Group&Topic)countConsumerLagPerGidTopicuserId、instanceId、groupId、topicSum
    实例API调用频率(Instance)countSecondInstanceApiCallTpsuserId、instanceIdSum
    5.0系列实例公网下行流量带宽byte/SecondInstanceInternetFlowoutBandwidthuserId、instanceIdSum
    5.0系列实例消费API调用TPS峰值countSecondInstanceReceiveApiCallTpsuserId、instanceIdMaximum
    5.0系列实例发送API调用TPS峰值countSecondInstanceSendApiCallTpsuserId、instanceIdMaximum
    5.0系列实例存储大小ByteInstanceStorageSizeuserId、instanceIdSum
    已就绪消息排队时间(Group)millisecondReadyMessageQueueTimeuserId、instanceId、groupIdMaximum
    已就绪消息排队时间(Group&Topic)millisecondReadyMessageQueueTimePerGidTopicuserId、instanceId、groupId、topicMaximum
    已就绪消息量(Group)countReadyMessagesuserId、instanceId、groupIdSum
    已就绪消息量(Group&Topic)countReadyMessagesPerGidTopicuserId、instanceId、groupId、topicSum
    消费者每分钟接收消息数量(Group)count/minReceiveMessageCountPerGiduserId、instanceId、groupIdSum
    消费者每分钟接收消息数量(Group&Topic)count/minReceiveMessageCountPerGidTopicuserId、instanceId、topic、groupIdSum
    消费者每分钟接收消息数的数量(Instance)count/minReceiveMessageCountPerInstanceuserId、instanceIdSum
    每分钟产生死信消息的数量(Group)count/minSendDLQMessageCountPerGiduserId、instanceId、groupIdSum
    每分钟产生死信消息的数量(Group&Topic)count/minSendDLQMessageCountPerGidTopicuserId、instanceId、groupId、topicSum
    生产者每分钟发送消息数量(Instance)count/minSendMessageCountPerInstanceuserId、instanceIdSum
    生产者每分钟发送消息数量(Topic)count/minSendMessageCountPerTopicuserId、instanceId、topicSum
    每分钟(GroupId)消费被限流次数count/minThrottledReceiveRequestsPerGiduserId、instanceId、groupIdSum
    每分钟(GroupId&Topic)消费被限流次数count/minThrottledReceiveRequestsPerGidTopicuserId、instanceId、topic、groupIdSum
    每分钟(Instance)消费被限流次数count/minThrottledReceiveRequestsPerInstanceuserId、instanceIdSum
    每分钟(Instance)发送被限流次数count/minThrottledSendRequestsPerInstanceuserId、instanceIdSum
    每分钟(Topic)发送被限流次数count/minThrottledSendRequestsPerTopicuserId、instanceId、topicSum
    在相应资源的操作列,单击报警规则,您可以查看到刚创建的报警规则信息。