消息队列Kafka版支持监控您账户下创建的资源,包含实例、Topic和Consumer Group,帮助您以分钟级别实时掌握这些资源的状态。

目前针对各资源类型提供的监控项如下:

  • 实例的监控项
    • 实例消息生产流量(bytes/s)
    • 实例消息消费流量(bytes/s)
    • 实例磁盘使用率(%)
    说明 实例磁盘使用率(%)显示的是实例各节点中磁盘使用率的最大值。
  • Topic的监控项
    • Topic消息生产流量(bytes/s)
    • Topic消息消费流量(bytes/s)
  • Consumer Group的监控项

    Consumer Group未消费消息总数(个)

您还可以为这些监控项设置报警规则。消息队列Kafka版接入了云监控,方便您直接进入云监控的控制台创建报警规则。当监控项数据超过设定的报警阈值时,云监控会通过短信、邮件、旺旺和钉钉机器人等方式通知您,帮助您及时应对异常情况。

查看监控数据

无论您是否设置了报警,您都可以在消息队列Kafka版控制台查看资源监控项的数据统计。

  • 前提条件
  • 操作步骤
    1. 登录消息队列Kafka版控制台。在顶部导航栏,选择要查看监控数据的资源所在地域(Region),例如华东1(杭州)

    2. 在左侧导航栏,单击监控报警。在监控报警页面选择需要查看监控数据的资源:
      • 如需查看实例的监控数据,请直接单击实例页签。
      • 如需查看Topic或Consumer Group的监控数据,请先在页面上方选择Topic或Consumer Group所在实例,再单击TopicConsumer Group页签。
    3. 找到要查看的资源,在其所在行的操作列,单击查看监控

      您可以选择查看最近1小时、3小时、6小时、12小时、1天、3天、7天或14天的数据,也可以单击最右端的时间选择框,自定义要查看的时间段。

      若您要自定义时间段,最长能查看最近31天的数据(超过31天的数据不保留),即时间选择框中的结束时间为当前系统时间,而开始时间最早可为31天前。若结束时间不是当前系统时间,则可查看31天内最长任意7天的数据。

      说明 监控项的数据聚合周期为1分钟,即1分钟计算一次,计算出来每秒多少bytes,可以理解为一分钟内的平均值。
  • 结果验证

    资源下方出现对应的监控项及监控数据。

    monitordata

设置报警

您可以通过创建报警规则及时接收异常情况的通知。

  • 前提条件

    您已经创建了实例、Topic和Consumer Group。详情请参见步骤三:创建资源

  • 操作步骤
    1. 登录消息队列Kafka版控制台。在顶部导航栏,选择需设置报警的资源所在地域,例如华东1(杭州)

    2. 在左侧导航栏,单击监控报警。在监控报警页面选择需要设置报警的资源:
      • 如需为实例设置报警,请直接单击实例页签;
      • 如需为Topic或Consumer Group设置报警,请先在页面上方选择Topic或Consumer Group所在实例,再单击TopicConsumer Group页签。
    3. 找到要设置报警的资源,在其所在行的操作列中,单击设置报警

      页面将跳转至云监控控制台的创建报警规则页面。

    4. 创建报警规则页面,设置报警规则和通知方式,详情请参见报警服务setalarm
      注意
      • 系统不支持跨实例的批量报警设置。
      • 设置topic消息生产流量topic消息消费流量两个监控项的报警规则时,建议在Topic字段不要选择任意选项(选择任意即选定所有的Topic)。
      • 设置具体规则时,请尽量避免使用 “between” 和多表达式。
      • 云监控的免费报警规则额度是50个,若超过此数量则需要升级云监控服务,详情请参见变配说明
  • 结果验证

    详情请参见下文的查看报警信息

查看报警信息

您可以查看已创建的报警规则和相应的报警信息。

  • 前提条件

    您已经创建了报警规则。创建步骤参见设置报警

  • 操作步骤
    1. 登录消息队列Kafka版控制台。在顶部导航栏,选择要查看报警信息的资源所在地域,例如华东1(杭州)
    2. 在左侧导航栏,单击监控报警。在监控报警页面选择需要查看报警信息的资源:
      • 如需查看实例的报警信息,请直接单击实例页签。
      • 如需查看Topic或Consumer Group的报警信息,请先在页面上方选择Topic或Consumer Group所在实例,再单击TopicConsumer Group页签。
    3. 监控报警页面,可选择以下任一方式查看报警详情信息:
      • 单击查看报警信息

        页面跳转到云监控控制台的报警规则列表页面,默认显示所有消息队列Kafka版的报警规则和其状态。您可以查看、修改、禁用(或启用)和删除报警规则。

      • 单击任一资源的报警项情况列中的报警项数:X个(“X” 为您为该资源所设置的报警规则数)。

        在打开的报警项情况窗口中,查看该资源的所有报警规则和相应的报警信息。单击某报警规则的操作列中查看,页面会跳转到云监控控制台的报警规则详情页,供您查看关于该报警规则的所有信息,以及对其进行修改、禁用(或启用)和删除等操作。