消息队列 for Apache Kafka 支持监控您账户下创建的资源,包含实例、Topic 和 Consumer Group,帮助您以分钟级别实时掌握这些资源的状态。

目前针对各资源类型提供的监控项如下:

  • 实例的监控项:

    • 实例消息生产流量(bytes/s)

    • 实例消息消费流量(bytes/s)

    • 实例磁盘使用率(%)

    说明 “实例磁盘使用率(%)”显示的是实例各节点中磁盘使用率的最大值。
  • Topic 的监控项:

    • Topic 消息生产流量(bytes/s)

    • Topic 消息消费流量(bytes/s)

  • Consumer Group 的监控项:

    • Consumer Group 未消费消息总数(个)

您还可以为这些监控项设置报警规则。消息队列 for Apache Kafka 接入了云监控,方便您直接进入云监控的控制台创建报警规则。当监控项数据超过设定的报警阈值时,云监控会通过短信、邮件、旺旺和钉钉机器人等方式通知您,帮助您及时应对异常情况。

查看监控数据

无论您是否设置了报警,您都可以在消息队列 for Apache Kafka 控制台查看资源监控项的数据统计。

  • 前提条件

  • 操作步骤

    1. 登录消息队列 for Apache Kafka 控制台。在顶部导航栏,选择要查看监控数据的资源所在地域(Region),例如华东1(杭州)

    2. 在左侧导航栏,单击监控报警。在监控报警页面选择需要查看监控数据的资源:

      • 如需查看实例的监控数据,请直接单击实例页签;

      • 如需查看 Topic 或 Consumer Group 的监控数据,请先在页面上方选择 Topic 或 Consumer Group 所在实例,再单击TopicConsumer Group 页签。

    3. 找到要查看的资源,在其所在行的操作列中,单击查看监控

      您可以选择查看最近 1 小时、3 小时、6 小时、12 小时、1 天、3 天、7 天或 14 天的数据,也可以单击最右端的时间选择框,自定义要查看的时间段。

      若您要自定义时间段,最长能查看最近 31 天的数据(超过 31 天的数据不保留),即时间选择框中的结束时间为当前系统时间,而开始时间最早可为 31 天前。若结束时间不是当前系统时间,则可查看 31 天内最长任意 7 天的数据。

      说明 监控项的数据聚合周期为 1 分钟,即 1 分钟计算一次,计算出来每秒多少 bytes,可以理解为一分钟内的平均值。
  • 结果验证

    资源下方出现对应的监控项及监控数据。



设置报警

您可以通过创建报警规则及时接收异常情况的通知。

  • 前提条件

    您已经创建了实例、Topic 和 Consumer Group。详情请参见步骤三:创建资源

  • 操作步骤
    1. 登录消息队列 for Apache Kafka 控制台。在顶部导航栏,选择需设置报警的资源所在地域,例如华东1(杭州)

    2. 在左侧导航栏,单击监控报警。在监控报警页面选择需要设置报警的资源:

      • 如需为实例设置报警,请直接单击实例页签;

      • 如需为 Topic 或 Consumer Group 设置报警,请先在页面上方选择 Topic 或 Consumer Group 所在实例,再单击TopicConsumer Group 页签。

    3. 找到要设置报警的资源,在其所在行的操作列中,单击设置报警

      页面将跳转至云监控控制台的创建报警规则页面。

    4. 创建报警规则页面,设置报警规则和通知方式,详情请参见报警服务



      注意
      • 系统不支持跨实例的批量报警设置。

      • 设置 topic消息生产流量topic消息消费流量两个监控项的报警规则时,建议在 Topic 字段不要选择任意选项(选择任意即选定所有的 Topic)。

      • 设置具体规则时,请尽量避免使用 “between” 和多表达式。

      • 云监控的免费报警规则额度是 50 个,若超过此数量则需要升级云监控服务,详情请参见变配说明

  • 结果验证

    详情请参见下文的查看报警信息

查看报警信息

您可以查看已创建的报警规则和相应的报警信息。

  • 前提条件

    您已经创建了报警规则。创建步骤参见设置报警

  • 操作步骤
    1. 登录消息队列 for Apache Kafka 控制台。在顶部导航栏,选择要查看报警信息的资源所在地域,例如华东1(杭州)

    2. 在左侧导航栏,单击监控报警。在监控报警页面选择需要查看报警信息的资源:

      • 如需查看实例的报警信息,请直接单击实例页签;

      • 如需查看 Topic 或 Consumer Group 的报警信息,请先在页面上方选择 Topic 或 Consumer Group 所在实例,再单击TopicConsumer Group 页签。

    3. 监控报警页面,可选择以下任一方式查看报警详情信息:

      • 单击查看报警信息按钮。

        页面跳转到云监控控制台的报警规则列表页面,默认显示所有消息队列 for Apache Kafka 的报警规则和其状态。您可以查看、修改、禁用(或启用)和删除报警规则。

      • 单击任一资源的报警项情况列中的报警项数:X个(“X” 为您为该资源所设置的报警规则数)。

        在打开的报警项情况窗口中,查看该资源的所有报警规则和相应的报警信息。单击某报警规则的操作列中查看,页面会跳转到云监控控制台的报警规则详情页,供您查看关于该报警规则的所有信息,以及对其进行修改、禁用(或启用)和删除等操作。