云监控

更新时间:2024-10-12 10:26:06

云消息队列 Kafka 版支持监控您账户下创建的资源,包括实例、Topic、Group,帮助您实时掌握资源状态。您还可以为云监控项设置报警规则,当监控项数据超过设定的报警阈值时,云监控可以通过电话、短信、邮件、钉钉机器人等方式通知您,帮助您及时应对异常情况。

计费说明

使用云监控功能云消息队列 Kafka 版不收取费用。

前提条件

创建服务关联角色

  • 角色名称:AliyunServiceRoleForAlikafka

  • 角色策略名称:AliyunServiceRolePolicyForAlikafka

  • 权限说明:允许云消息队列 Kafka 版使用该角色访问您的服务(云监控和ARMS服务)以完成云监控和仪表盘相关功能。

  • 具体文档说明:服务关联角色

监控项

说明
  • 监控项的数据聚合周期为1分钟,即1分钟计算一次,计算出来每秒字节数。您可以将该数据理解为一分钟内的平均值。

  • 监控项的数据延时1分钟。

针对各资源类型提供的监控项如下:

Metric Name

Metric Id

Dimensions

单位

Metric Name

Metric Id

Dimensions

单位

实例业务实际流入流量

instance_message_input

userId、instanceId

B/s

实例集群流入流量(包含副本复制流量)

cluster_message_input

userId、instanceId

B/s

实例业务实际流出流量

instance_message_output

userId、instanceId

B/s

实例消息生产条数

instance_message_num_input

userId、instanceId

count/s

实例消息发送次数

instance_reqs_input

userId、instanceId

count/s

实例消息消费次数

instance_reqs_output

userId、instanceId

count/s

实例存储大小

instance_disk_log_size

userId、instanceId

B

实例公网写入带宽

instance_internet_txrate

userId、instanceId

bit/s

实例公网读取带宽

instance_internet_rxrate

userId、instanceId

bit/s

生产流量在弹性上限占比

InstanceMessageInputRatioV3

userId、instanceId

%

消费流量在弹性上限占比

InstanceMessageOutputRatioV3

userId、instanceId

%

实例单节点最大连接数(公网+内网)

InstanceMaxConnection

userId,instanceId

count

实例单节点最大连接数(公网)

InstanceMaxInternetConnection

userId,instanceId

count

实例总连接数(公网+内网)

InstanceTotalConnection

userId,instanceId

count

实例总连接数(公网)

InstanceTotalInternetConnection

userId,instanceId

count

实例生产限流时间

InstanceThrottleTimeP99InputV3

userId,instanceId

ms

实例消费限流时间

InstanceThrottleTimeP99OutputV3

userId,instanceId

ms

最大节点生产流量在节点弹性上限占比

InstanceMaxNodeInputRatioV3

userId、instanceId

%

最大节点消费流量在节点弹性上限占比

InstanceMaxNodeOutputRatioV3

userId、instanceId

%

查看云监控数据

查看监控数据的步骤如下:

  1. 登录云消息队列 Kafka 版控制台,在概览页面的资源分布区域,选择地域。

  2. 实例列表页面,单击目标实例名称。

  3. 在左侧导航栏,选择可观测 > 云监控

  4. 监控图表页签,设置时间范围,查看监控数据。

    页面会自动显示当前资源所有的监控项图表。

设置报警规则

设置报警的操作步骤如下:

  1. 登录云消息队列 Kafka 版控制台

  2. 概览页面的资源分布区域,选择地域。

  3. 实例列表页面,单击目标实例名称。

  4. 在左侧导航栏,选择可观测 > 云监控

  5. 云监控页面,单击报警规则页签,然后单击创建报警规则

  6. 创建报警规则面板,设置报警规则和通知方式,单击确定

    如果您需要对已创建的规则进行修改,请单击规则名称右侧操作列的修改进行修改。

查看报警信息

查看报警信息的步骤如下:

  1. 登录云消息队列 Kafka 版控制台

  2. 概览页面的资源分布区域,选择地域。

  3. 实例列表页面,单击目标实例名称。

  4. 在左侧导航栏,选择可观测 > 云监控

  5. 云监控页面,单击报警规则,然后单击规则名称右侧操作列的详情查看报警信息。

相关文档

  • 除云监控之外,您还可以通过仪表盘了解资源状态,更多信息,请参见仪表盘

  • 其他常见的监控报警问题,请参见监控报警问题

  • 本页导读 (1)
  • 计费说明
  • 前提条件
  • 监控项
  • 查看云监控数据
  • 设置报警规则
  • 查看报警信息
  • 相关文档
AI助理

点击开启售前

在线咨询服务

你好,我是AI助理

可以解答问题、推荐解决方案等