您可通过消息队列 RocketMQ 版(下文简称 RocketMQ)的自带监控服务或云监控服务来实现监控数据收集、可视化和实时监控报警等服务,帮助您实时掌握消息消费状态,以便及时处理消费异常。您可按需选择任一服务使用,推荐您使用云监控服务的相关监控功能。本文分别介绍两种监控服务的使用步骤。

云监控服务

云监控服务的监控报警可以用于提醒您及时处理问题或升级规格。后台云监控根据您配置的报警规则,判断资源的使用是否超过配置的阈值,如果超过,则通过短信、邮件、旺旺、钉钉机器人等方式通知相应的联系人。

注意
  • 目前,云监控服务仅在华东1(杭州)地域可用。
  • 如需接收短信通知,您需登录云监控控制台,在概览页单击购买短信,购买相应的短信服务。
目前针对各资源类型提供的监控项如下:
  • 实例的监控项
    • 实例(Instance)每分钟发送的消息数量(个)
    • 实例(Instance) 每分钟接收的消息数量(个)
    • 消息保留时间(小时)
  • Topic
    • Producer(Topic)每分钟发送的消息数量(count/min)
    • Consumer(Topic)每分钟接收的消息数量(count/min)
  • Group ID
    • Producer(GroupId)每分钟发送的的消息数量(个)
    • Consumer(GroupId)每分钟接收消息数量(个)
    • 消息堆积(个)

操作步骤

  1. 授予云资源访问权限。

    首次使用监控报警功能时,RocketMQ 需要您的阿里云主账号授权,才能访问包括云监控在内的云资源。

    说明 主账号授权后,RocketMQ 也可以访问该主账号下的 RAM 用户(子账号)的云资源。授权详情参见RAM 主子账号授权
    1. 登录消息队列 MQ 控制台。在左侧导航栏,单击监控报警(推荐)
    2. 云资源访问授权页面,单击同意授权
  2. 查看监控报表信息。
    1. 在顶部导航栏,选择地域为华东1(杭州)
    2. 在左侧导航栏,单击监控报警(推荐)。在监控报警页面选择需要查看监控数据的资源:
      • 如需查看实例的报警信息,请直接单击实例页签;
      • 如需查看 Topic 的报警信息,请直接单击 Topic 页签;
      • 如需查看 Group ID 的报警信息,请直接单击 Group 页签。
    3. 找到要查看的资源,在其所在行的操作列中,单击查看监控 。

      您可以选择查看最近 1 小时、3 小时、6 小时、12 小时、1 天、3 天、7 天或 14 天的数据,也可以单击最右端的时间选择框,自定义要查看的时间段。

      若您要自定义时间段,最长能查看最近 31 天的数据(超过 31 天的数据不保留),即时间选择框中的结束时间为当前系统时间,而开始时间最早可为 31 天前。若结束时间不是当前系统时间,则可查看 31 天内最长任意 7 天的数据。

      说明 监控项的数据聚合周期为 1 分钟。
  3. 设置报警。
    1. 找到要设置报警的资源,在其所在行的操作列中,单击设置报警
    2. 在创建报警规则页面,设置报警规则和通知方式,详情请参见报警服务设置报警规则

RocketMQ 自带监控服务

使用 RocketMQ 自带监控服务可监控某 Group ID 订阅的某 Topic 的消息消费状态并接收报警短信,帮助您实时掌握消息堆积情况。自带监控服务的报警短信不收取额外费用。

前提条件

  • 请确认实例所在地域(Region)支持自带监控报警功能,目前支持自带监控报警功能的地域如下所示:
    • 公网
    • 华东1(杭州)
    • 华东2(上海)
    • 华北1(青岛)
    • 华北2(北京)
    • 华北3(张家口)
    • 华北5(呼和浩特)
    • 华南1(深圳)
    • 中国(香港)
    • 华北2 阿里政务云1
    • 新加坡(新加坡)
    • 日本(东京)
  • 请确保您需监控的 Group ID 已订阅相应 Topic。订阅消息的详细步骤,请参见以下文档:

操作步骤

请按以下步骤创建监控项:

  1. 登录消息队列 MQ 控制台。在顶部导航栏,选择地域(Region),如华东 1(杭州)
  2. 在左侧导航栏,单击监控报警
  3. 监控项管理页面右上角,单击新增监控项
  4. 新增监控项对话框输入相关信息,单击确认。新建的监控项会出现在监控项管理页面。

    字段说明如下:

    • Group ID:要监控的 Group ID。
    • Topic:要监控的该 Group ID 订阅的 Topic。
    • 堆积量阈值:消费堆积的报警阈值。阈值的可填范围是 1 到 100,000,000。如果您选择的 Group ID 在消费对应的 Topic 时产生了消息堆积,并且堆积超过了报警阈值,消息队列 MQ 就会给报警接收人发送短信通知。
    • 消费延迟阈值:消费延迟的值是指该 Group ID 最近一次消费该 Topic 消息的时间和该 Topic 最近一次投递消息的时间之间的差值。可设置的消费延迟阈值的最小值是 1 分钟。
    • 报警时间:时间精确到分钟,最大范围为 00:00-23:59。您只会在设置的接收时间范围内才会收到报警短信。
    • 报警频率:每隔 5 分钟、15 分钟或 30 分钟。
    • 报警接收人:包括接收人的昵称和手机号码。昵称长度限制在 100 个字以内。
    说明 如果您已取消某个 Group ID 对某个 Topic 的订阅,请删除对应的监控项。
  5. (可选)在监控新管理页面,您可编辑、禁用、删除已经建好的监控项。对于已禁用的监控项,也可以在其操作列单击启用重新启用。