云监控服务具有监控数据收集、可视化和实时监控报警等功能。云消息队列 RocketMQ 版支持通过云监控创建监控规则,帮助您自动监控服务的运行状态,并自动发送报警通知, 便于您及时预警服务的异常信息,提高运维效率。
云监控服务的详细信息,请参见云产品监控。
监控项说明
已就绪消息量和已就绪消息排队时间指标的详细说明,请参见相关概念。
监控项的数据聚合周期为1分钟。
分组 | 监控项 | MetricName | 单位 | Dimensions |
Instance | 实例 API 调用频率 | InstanceApiCallTps | count/s | userId、instanceId |
生产者每分钟发送消息数量 | SendMessageCountPerInstance | count/m | userId、instanceId | |
消费者每分钟接收消息数的数量 | ReceiveMessageCountPerInstance | count/m | userId、instanceId | |
每分钟 (Instance) 发送被限流次数 | ThrottledSendRequestsPerInstance | count/m | userId、instanceId | |
每分钟 (Instance) 消费被限流次数 | ThrottledReceiveRequestsPerInstance | count/m | userId、instanceId | |
5.0 系列实例发送 API 调用 TPS 峰值 | InstanceSendApiCallTps | count/s | userId、instanceId | |
5.0 系列实例消费 API 调用 TPS 峰值 | InstanceReceiveApiCallTps | count/s | userId、instanceId | |
5.0 系列实例存储大小 | InstanceStorageSize | B | userId、instanceId | |
5.0 系列实例公网下行流量带宽 | InstanceInternetFlowoutBandwidth | B/s | userId、instanceId | |
Group | 消息堆积量 | ConsumerLag | count | userId、instanceId、groupId |
消息处理延迟时间 | ConsumerLagLatencyPerGid | ms | userId、instanceId、groupId | |
已就绪消息量 | ReadyMessages | count | userId、instanceId、groupId | |
已就绪消息排队时间 | ReadyMessageQueueTime | ms | userId、instanceId、groupId | |
消费者每分钟接收消息数量 | ReceiveMessageCountPerGid | count/m | userId、instanceId、groupId | |
每分钟(GroupId)消费被限流次数 | ThrottledReceiveRequestsPerGid | count/m | userId、instanceId、groupId | |
每分钟产生死信消息的数量 | SendDLQMessageCountPerGid | count/m | userId、instanceId、groupId | |
Topic | Producer (Topic) 每分钟发送消息数量 | SendMessageCountPerTopic | count/m | userId、instanceId、topic |
每分钟 (Topic) 发送被限流次数 | ThrottledSendRequestsPerTopic | count/m | userId、instanceId、topic | |
GroupId&Topic | 消息堆积量 | ConsumerLagPerGidTopic | count | userId、instanceId、groupId、topic |
消息处理延迟时间 | ConsumerLagLatencyPerGidTopic | ms | userId、instanceId、topic、groupId | |
已就绪消息量 | ReadyMessagesPerGidTopic | count | userId、instanceId、groupId、topic | |
已就绪消息排队时间 | ReadyMessageQueueTimePerGidTopic | ms | userId、instanceId、groupId、topic | |
消费者每分钟接收消息数量 | ReceiveMessageCountPerGidTopic | count/m | userId、instanceId、topic、groupId | |
每分钟(GroupId&Topic)消费被限流次数 | ThrottledReceiveRequestsPerGidTopic | count/m | userId、instanceId、topic、groupId | |
每分钟产生死信消息的数量 | SendDLQMessageCountPerGidTopic | count/m | userId、instanceId、groupId、topic |
计费说明
使用监控报警功能云消息队列 RocketMQ 版不收取费用。
前提条件
创建服务关联角色
角色名称:AliyunServiceRoleForOns
角色策略名称:AliyunServiceRolePolicyForOns
权限说明:允许云消息队列 RocketMQ 版使用该角色访问您的服务(云监控和ARMS服务)以完成监控报警和Dashboard相关功能。
具体文档说明:服务关联角色。
查看监控指标
登录云消息队列 RocketMQ 版控制台,在左侧导航栏单击实例列表。
在顶部菜单栏选择地域,如华东1(杭州),然后在实例列表中,单击目标实例名称。
在左侧导航栏单击监控报警。
在监控报警页面选择要查看的资源,并选择查询时间。
页面会自动显示当前资源所有的监控项图表。
创建告警规则
在实例列表页面中单击目标实例名称。
在左侧导航栏单击监控报警。
在监控报警页面单击创建报警规则。
页面将跳转至云监控控制台的创建报警规则面板。
在创建报警规则面板按提示设置规则和通知信息,然后单击确定。具体参数设置,请参见创建报警规则。
相关文档
通过监控报警您可为云消息队列 RocketMQ 版的核心监控项和业务指标配置告警规则,具体的告警配置原则和推荐的指标项,请参见配置消息监控告警实现风险预警。