您可通过消息队列 RocketMQ 版的自带监控服务或云监控服务来实现监控数据收集、可视化和实时监控报警等服务,帮助您实时掌握消息消费状态,以便及时处理消费异常。您可按需选择任一服务使用,推荐您使用云监控服务的相关监控功能。本文分别介绍两种监控服务的使用步骤。

(推荐)云监控服务

云监控服务的监控报警可以用于提醒您及时处理问题或升级规格。后台云监控根据您配置的报警规则,判断资源的使用是否超过配置的阈值,如果超过,则通过短信、邮件、旺旺、钉钉机器人等方式通知相应的联系人。

注意
  • 目前,云监控服务仅在华东1(杭州)地域可用。
  • 如需接收短信通知,您需登录云监控控制台,在概览页单击购买短信,购买相应的短信服务。

操作步骤

  1. 授予云资源访问权限。

    首次使用监控报警功能时,消息队列 RocketMQ 版需要您的阿里云主账号授权,才能访问包括云监控在内的云资源。

    说明 主账号授权后,RocketMQ 也可以访问该主账号下的 RAM 用户(子账号)的云资源。授权详情参见RAM 主子账号授权
    1. 登录消息队列 RocketMQ 版控制台
    2. 在顶部菜单栏,选择地域为华东1(杭州)
    3. 实例列表页面,找到目标实例,在其操作列,单击详情
    4. 在左侧导航栏,单击监控报警(推荐)
    5. 云资源访问授权页面,单击同意授权
  2. 查看监控报表信息。
    1. 在顶部菜单栏,选择地域为华东1(杭州)
    2. 实例列表页面,找到目标实例,在其操作列,单击详情
    3. 在左侧导航栏,单击监控报警(推荐),并选择需要查看监控数据的资源。cloud_monitor
      • 如需查看实例的报警信息,请选择实例 > 监控报表。示例如下。instance_cloud_monitor

        消息保留时间

        此监控项表示当前集群中所有消息的最大存活时间,且只适用于铂金版实例。为保持消息系统持续的可用性,磁盘空间达到铂金版实例磁盘容量规格后,消息队列 RocketMQ 版会按照先进先出的策略删除存储时间最早的一批消息。

        您可凭借此监控项衡量您的铂金版实例集群的容量,作为升降配铂金版实例容量规格的参考。

        横轴表示时间点,纵轴表示消息保留时长。例如,横轴时间点显示为 21:00,这个时刻对应的纵轴取值为 10,则表示在 21:00 时刻铂金版的消息保留时长为 10 小时,如果您需将这些消息保留更长时间,那么您需要扩容磁盘。

        铂金版实例详情请参见计费概述

      • 如需查看 Topic 的报警信息,请选择 Topic > 监控报表。示例如下。topic_cloud_monitor
      • 如需查看 Group ID 的报警信息,请选择 Group > 监控报表。示例如下。gid_cloud_monitor

        消息堆积(个)

        表示该 Group ID 下所堆积的消息数量。详情请参见名词解释

      您可以选择查看最近 1 小时、3 小时、6 小时、12 小时、1 天、3 天、7 天或 14 天的数据,也可以单击最右端的时间选择框,自定义要查看的时间段。

      若您要自定义时间段,最长能查看最近 31 天的数据(超过 31 天的数据不保留),即时间选择框中的结束时间为当前系统时间,而开始时间最早可为 31 天前。若结束时间不是当前系统时间,则可查看 31 天内最长任意 7 天的数据。

      说明 监控项的数据聚合周期为 1 分钟。
  3. 设置报警。
    1. 找到要设置报警的资源,在其所在行的操作列中,单击设置报警
    2. 在创建报警规则页面,设置报警规则和通知方式,详情请参见报警服务设置报警规则

RocketMQ 自带监控服务

使用 RocketMQ 自带监控服务可监控某 Group ID 订阅的某 Topic 的消息消费状态并接收报警短信,帮助您实时掌握消息堆积情况。自带监控服务的报警短信不收取额外费用。

前提条件

  • 请确认实例所在地域(Region)支持自带监控报警功能,目前支持自带监控报警功能的地域如下所示:
    • 公网
    • 华东1(杭州)
    • 华东2(上海)
    • 华北1(青岛)
    • 华北2(北京)
    • 华北3(张家口)
    • 华北5(呼和浩特)
    • 华南1(深圳)
    • 中国(香港)
    • 华北2 阿里政务云1
    • 新加坡(新加坡)
    • 日本(东京)
  • 请确保您需监控的 Group ID 已订阅相应 Topic。订阅消息的详细步骤,请参见以下文档:

操作步骤

请按以下步骤创建监控项:

  1. 登录消息队列 RocketMQ 版控制台。在顶部菜单栏,选择地域(Region),如华东1(杭州)
  2. 实例列表页面,找到目标实例,在其操作列,单击详情
  3. 在左侧导航栏,选择监控报警 > 新增监控项create_monitor_item
  4. 新增监控项对话框输入相关信息,单击确认。新建的监控项会出现在监控报警页面。 new_monitor_item

    字段说明如下:

    • Group ID:要监控的 Group ID。
    • Topic:要监控的该 Group ID 订阅的 Topic。
    • 堆积量阈值:消费堆积的报警阈值。阈值的可填范围是 1 到 100,000,000。如果您选择的 Group ID 在消费对应的 Topic 时产生了消息堆积,并且堆积超过了报警阈值,消息队列 MQ 就会给报警接收人发送短信通知。
    • 消费延迟阈值:消费延迟的值是指该 Group ID 最近一次消费该 Topic 消息的时间和该 Topic 最近一次投递消息的时间之间的差值。可设置的消费延迟阈值的最小值是 1 分钟。
    • 报警时间:时间精确到分钟,最大范围为 00:00-23:59。您只会在设置的接收时间范围内才会收到报警短信。
    • 报警频率:每隔 5 分钟、15 分钟或 30 分钟。
    • 报警接收人:包括接收人的昵称和手机号码。昵称长度限制在 100 个字符以内。
    说明 如果您已取消某个 Group ID 对某个 Topic 的订阅,请删除对应的监控项。
  5. (可选)在监控报警页面,您可编辑、禁用、删除已经建好的监控项。对于已禁用的监控项,也可以在其操作列单击启用重新启用。enable_monitor_item