监控报警
云监控服务具有监控数据收集、可视化和实时监控报警等功能。后台云监控会根据您配置的报警规则,判断资源的使用是否超过配置的阈值。如果超过,则通过短信、邮件、旺旺、钉钉机器人等方式通知相应的联系人,以便及时处理异常消息。本文介绍云消息队列 RocketMQ 版的监控项以及如何创建报警规则。
云监控服务的详细信息,请参见云产品监控。
监控项说明
说明
已就绪消息量和已就绪消息排队时间指标的详细说明,请参见相关概念。
监控项的数据聚合周期为1分钟。
监控项 | 单位 | MetricName | Dimensions | Statistics |
消息堆积量(Group) | count | ConsumerLag | userId、instanceId、groupId | Sum |
消息处理延迟时间(GroupId) | millisecond | ConsumerLagLatencyPerGid | userId、instanceId、groupId | Maximum |
消息处理延迟时间(GroupId&Topic) | millisecond | ConsumerLagLatencyPerGidTopic | userId、instanceId、topic、groupId | Maximum |
消息堆积量(Group&Topic) | count | ConsumerLagPerGidTopic | userId、instanceId、groupId、topic | Sum |
实例API调用频率(Instance) | countSecond | InstanceApiCallTps | userId、instanceId | Sum |
5.0系列实例公网下行流量带宽 | byte/Second | InstanceInternetFlowoutBandwidth | userId、instanceId | Sum |
5.0系列实例消费API调用TPS峰值 | countSecond | InstanceReceiveApiCallTps | userId、instanceId | Maximum |
5.0系列实例发送API调用TPS峰值 | countSecond | InstanceSendApiCallTps | userId、instanceId | Maximum |
5.0系列实例存储大小 | Byte | InstanceStorageSize | userId、instanceId | Sum |
已就绪消息排队时间(Group) | millisecond | ReadyMessageQueueTime | userId、instanceId、groupId | Maximum |
已就绪消息排队时间(Group&Topic) | millisecond | ReadyMessageQueueTimePerGidTopic | userId、instanceId、groupId、topic | Maximum |
已就绪消息量(Group) | count | ReadyMessages | userId、instanceId、groupId | Sum |
已就绪消息量(Group&Topic) | count | ReadyMessagesPerGidTopic | userId、instanceId、groupId、topic | Sum |
消费者每分钟接收消息数量(Group) | count/min | ReceiveMessageCountPerGid | userId、instanceId、groupId | Sum |
消费者每分钟接收消息数量(Group&Topic) | count/min | ReceiveMessageCountPerGidTopic | userId、instanceId、topic、groupId | Sum |
消费者每分钟接收消息数的数量(Instance) | count/min | ReceiveMessageCountPerInstance | userId、instanceId | Sum |
每分钟产生死信消息的数量(Group) | count/min | SendDLQMessageCountPerGid | userId、instanceId、groupId | Sum |
每分钟产生死信消息的数量(Group&Topic) | count/min | SendDLQMessageCountPerGidTopic | userId、instanceId、groupId、topic | Sum |
生产者每分钟发送消息数量(Instance) | count/min | SendMessageCountPerInstance | userId、instanceId | Sum |
生产者每分钟发送消息数量(Topic) | count/min | SendMessageCountPerTopic | userId、instanceId、topic | Sum |
每分钟(GroupId)消费被限流次数 | count/min | ThrottledReceiveRequestsPerGid | userId、instanceId、groupId | Sum |
每分钟(GroupId&Topic)消费被限流次数 | count/min | ThrottledReceiveRequestsPerGidTopic | userId、instanceId、topic、groupId | Sum |
每分钟(Instance)消费被限流次数 | count/min | ThrottledReceiveRequestsPerInstance | userId、instanceId | Sum |
每分钟(Instance)发送被限流次数 | count/min | ThrottledSendRequestsPerInstance | userId、instanceId | Sum |
每分钟(Topic)发送被限流次数 | count/min | ThrottledSendRequestsPerTopic | userId、instanceId、topic | Sum |
计费说明
使用监控报警功能云消息队列 RocketMQ 版不收取费用。
前提条件
创建服务关联角色
角色名称:AliyunServiceRoleForOns
角色策略名称:AliyunServiceRolePolicyForOns
权限说明:允许云消息队列 RocketMQ 版使用该角色访问您的服务(云监控和ARMS服务)以完成监控报警和Dashboard相关功能。
具体文档说明:服务关联角色。
查看监控指标
登录云消息队列 RocketMQ 版控制台,在左侧导航栏单击实例列表。
在顶部菜单栏选择地域,如华东1(杭州),然后在实例列表中,单击目标实例名称。
- 在左侧导航栏单击监控报警,然后在监控报警页面单击监控图表页签。
- 在监控图表页签选择要查看的资源,并选择查询时间。页面会自动显示当前资源所有的监控项图表。