文档

云监控

更新时间:

云消息队列 Kafka 版支持监控您账户下创建的资源,包括实例、Topic、Group,帮助您实时掌握资源状态。您还可以为云监控项设置报警规则,当监控项数据超过设定的报警阈值时,云监控可以通过电话、短信、邮件、钉钉机器人等方式通知您,帮助您及时应对异常情况。

计费说明

使用云监控功能云消息队列 Kafka 版不收取费用。

前提条件

创建服务关联角色

  • 角色名称:AliyunServiceRoleForAlikafka

  • 角色策略名称:AliyunServiceRolePolicyForAlikafka

  • 权限说明:允许云消息队列 Kafka 版使用该角色访问您的服务(云监控和ARMS服务)以完成云监控和仪表盘相关功能。

  • 具体文档说明:服务关联角色

监控项

说明
  • 监控项的数据聚合周期为1分钟,即1分钟计算一次,计算出来每秒字节数。您可以将该数据理解为一分钟内的平均值。

  • 监控项的数据延时1分钟。

针对各资源类型提供的监控项如下:

资源类型

Metric Name

Metric Id

Dimensions

单位

实例

V3实例集群流入流量(包含副本复制流量)

cluster_message_input

userId、instanceId

B/s

V3实例存储大小

instance_disk_log_size

userId、instanceId

B

V3实例公网读取带宽

instance_internet_rxrate

userId、instanceId

bit/s

V3实例公网写入带宽

instance_internet_txrate

userId、instanceId

bit/s

实例业务实际流入流量

instance_message_input

userId、instanceId

B/s

实例消息生产条数

instance_message_num_input

userId、instanceId

count/s

实例消息消费条数

instance_message_num_output

userId、instanceId

count/s

实例业务实际流出流量

instance_message_output

userId、instanceId

B/s

实例消息发送次数

instance_reqs_input

userId、instanceId

count/s

实例消息消费次数

instance_reqs_output

userId、instanceId

count/s

生产流量在弹性上限占比

InstanceMessageInputRatioV3

userId、instanceId

%

消费流量在弹性上限占比

InstanceMessageOutputRatioV3

userId、instanceId

%

Topic

Topic消息生产量

topic_message_input

userId、instanceId、topic

B/s

Topic消息生产条数

topic_message_num_input

userId、instanceId、topic

count/s

Topic消息消费条数

topic_message_num_output

userId、instanceId、topic

count/s

Topic消息消费量

topic_message_output

userId、instanceId、topic

B/s

Topic消息发送次数

topic_reqs_input

userId、instanceId、topic

count/s

Topic消息消费次数

topic_reqs_output

userId、instanceId、topic

count/s

ConsumerGroup

消费总速率

group_message_num_output

userId、instanceId、consumerGroup

count/s

消费速率(Topic级别)

group_message_num_output_onetopic

userId、instanceId、consumerGroup、topic

count/s

消费速率(Partition级别)

group_message_num_output_onetopic_onepartition

userId、instanceId、consumerGroup、topic、partition

count/s

消息堆积量

message_accumulation

userId、instanceId、consumerGroup

count

ConsumerGroup未消费此Topic消息数

message_accumulation_onetopic

userId、instanceId、consumerGroup、topic

count

查看云监控数据

查看监控数据的步骤如下:

  1. 登录云消息队列 Kafka 版控制台,在概览页面的资源分布区域,选择地域。

  2. 实例列表页面,单击目标实例名称。

  3. 在左侧导航栏,选择可观测 > 云监控

  4. 监控图表页签,设置时间范围,查看监控数据。

    查看监控数据

设置报警规则

设置报警的操作步骤如下:

  1. 登录云消息队列 Kafka 版控制台

  2. 概览页面的资源分布区域,选择地域。

  3. 实例列表页面,单击目标实例名称。

  4. 在左侧导航栏,选择可观测 > 云监控

  5. 云监控页面,单击报警规则页签,然后单击创建报警规则

  6. 创建报警规则面板,设置报警规则和通知方式,单击确定

    如果您需要对已创建的规则进行修改,请单击规则名称右侧操作列的编辑规则进行修改。

查看报警信息

查看报警信息的步骤如下:

  1. 登录云消息队列 Kafka 版控制台

  2. 概览页面的资源分布区域,选择地域。

  3. 实例列表页面,单击目标实例名称。

  4. 在左侧导航栏,选择可观测 > 云监控

  5. 云监控页面,单击报警规则,然后单击规则名称右侧操作列的详情查看报警信息。

相关文档

  • 除云监控之外,您还可以通过仪表盘了解资源状态,更多信息,请参见仪表盘

  • 其他常见的监控报警问题,请参见监控报警问题

  • 本页导读 (1)