如果您希望实时掌握Kafka资源(实例、Topic、Group)状态,监控资源数据是否超过阈值,您可以使用云监控实时监测您账户下创建的资源。您还可以为云监控项设置报警规则,当监控项数据超过设定的报警阈值时,云监控可以通过电话、短信、邮件、钉钉机器人等方式通知您,帮助您及时应对异常情况。
监控项
监控项的数据聚合周期为1分钟,即1分钟计算一次,计算出来每秒多少字节。您可以将该数据理解为一分钟内的平均值。
监控项的数据延时1分钟。
云消息队列 Kafka 版监控指标支持以下监控项:
监控项 | 单位 |
实例业务实际流入流量 | B/s |
实例业务实际流出流量 | B/s |
实例消息生产条数 | count/s |
实例消息发送次数 | count/s |
实例消息消费次数 | count/s |
实例磁盘使用率 说明 实例磁盘使用率(%)显示的是实例各节点中磁盘使用率的最大值。 | % |
实例公网写入带宽 | bit/s |
实例公网读取带宽 | bit/s |
实例公网读取带宽(节点维度) | bit/s |
实例公网写入带宽(节点维度) | bit/s |
实例公网读取带宽使用率(节点维度) | % |
实例公网写入带宽使用率(节点维度) | % |
生产流量在实例规格占比 | % |
消费流量在实例规格占比 | % |
分区在实例规格占比 | % |
计费说明
使用云监控功能云消息队列 Kafka 版不收取费用。
前提条件
创建服务关联角色
角色名称:AliyunServiceRoleForAlikafka
角色策略名称:AliyunServiceRolePolicyForAlikafka
权限说明:允许云消息队列 Kafka 版使用该角色访问您的服务(云监控和ARMS服务)以完成云监控相关功能。
具体文档说明:服务关联角色。
查看云监控数据
在概览页面的资源分布区域,选择地域。
在实例列表页面,单击目标实例名称。
在左侧导航栏,选择 。
在云监控页面,单击报警规则页签,单击要查看监控数据的资源页签,找到要查看监控数据的资源,单击其右侧操作列的云监控,设置时间范围,查看监控数据。
页面会自动显示当前资源所有的监控项图表。
设置报警规则
在云监控页面,单击报警规则,选择实例、Topic或Group资源页签,设置报警规则。
页面将跳转至云监控控制台的创建报警规则面板。
在创建报警规则面板按提示设置规则和通知信息,然后单击确定。具体参数设置,请参见创建报警规则。
查看报警信息
在云监控页面,单击报警规则,然后单击要查看报警信息的资源(实例、Topic或Group)页签。
找到具体的资源名称,单击操作列的报警规则。
在关联的报警规则面板,选择目标报警规则,单击其操作列的详情,您可以查看报警规则、禁用或启用报警规则、删除报警规则、查看报警历史。
相关文档
实例的Prometheus监控数据,请参见Prometheus监控。
关于监控报警的更多常见问题,请参见监控报警问题。