监控报警

云监控服务具有监控数据收集、可视化和实时监控报警等功能。云消息队列 RocketMQ 版支持通过云监控创建监控规则,帮助您自动监控服务的运行状态,并自动发送报警通知, 便于您及时预警服务的异常信息,提高运维效率。

云监控服务的详细信息,请参见云产品监控

监控项说明

说明
  • 已就绪消息量已就绪消息排队时间指标的详细说明,请参见相关概念

  • 监控项的数据聚合周期为1分钟。

分组

监控项

MetricName

单位

Dimensions

Instance

实例 API 调用频率

InstanceApiCallTps

count/s

userId、instanceId

生产者每分钟发送消息数量

SendMessageCountPerInstance

count/m

userId、instanceId

消费者每分钟接收消息数的数量

ReceiveMessageCountPerInstance

count/m

userId、instanceId

每分钟 (Instance) 发送被限流次数

ThrottledSendRequestsPerInstance

count/m

userId、instanceId

每分钟 (Instance) 消费被限流次数

ThrottledReceiveRequestsPerInstance

count/m

userId、instanceId

5.0 系列实例发送 API 调用 TPS 峰值

InstanceSendApiCallTps

count/s

userId、instanceId

5.0 系列实例消费 API 调用 TPS 峰值

InstanceReceiveApiCallTps

count/s

userId、instanceId

5.0 系列实例存储大小

InstanceStorageSize

B

userId、instanceId

5.0 系列实例公网下行流量带宽

InstanceInternetFlowoutBandwidth

B/s

userId、instanceId

Group

消息堆积量

ConsumerLag

count

userId、instanceId、groupId

消息处理延迟时间

ConsumerLagLatencyPerGid

ms

userId、instanceId、groupId

已就绪消息量

ReadyMessages

count

userId、instanceId、groupId

已就绪消息排队时间

ReadyMessageQueueTime

ms

userId、instanceId、groupId

消费者每分钟接收消息数量

ReceiveMessageCountPerGid

count/m

userId、instanceId、groupId

每分钟(GroupId)消费被限流次数

ThrottledReceiveRequestsPerGid

count/m

userId、instanceId、groupId

每分钟产生死信消息的数量

SendDLQMessageCountPerGid

count/m

userId、instanceId、groupId

Topic

Producer (Topic) 每分钟发送消息数量

SendMessageCountPerTopic

count/m

userId、instanceId、topic

每分钟 (Topic) 发送被限流次数

ThrottledSendRequestsPerTopic

count/m

userId、instanceId、topic

GroupId&Topic

消息堆积量

ConsumerLagPerGidTopic

count

userId、instanceId、groupId、topic

消息处理延迟时间

ConsumerLagLatencyPerGidTopic

ms

userId、instanceId、topic、groupId

已就绪消息量

ReadyMessagesPerGidTopic

count

userId、instanceId、groupId、topic

已就绪消息排队时间

ReadyMessageQueueTimePerGidTopic

ms

userId、instanceId、groupId、topic

消费者每分钟接收消息数量

ReceiveMessageCountPerGidTopic

count/m

userId、instanceId、topic、groupId

每分钟(GroupId&Topic)消费被限流次数

ThrottledReceiveRequestsPerGidTopic

count/m

userId、instanceId、topic、groupId

每分钟产生死信消息的数量

SendDLQMessageCountPerGidTopic

count/m

userId、instanceId、groupId、topic

计费说明

使用监控报警功能云消息队列 RocketMQ 版不收取费用。

前提条件

创建服务关联角色

  • 角色名称:AliyunServiceRoleForOns

  • 角色策略名称:AliyunServiceRolePolicyForOns

  • 权限说明:允许云消息队列 RocketMQ 版使用该角色访问您的服务(云监控和ARMS服务)以完成监控报警和Dashboard相关功能。

  • 具体文档说明:服务关联角色

查看监控指标

  1. 登录云消息队列 RocketMQ 版控制台,在左侧导航栏单击实例列表

  2. 在顶部菜单栏选择地域,如华东1(杭州),然后在实例列表中,单击目标实例名称。

  3. 在左侧导航栏单击监控报警

  4. 监控报警页面选择要查看的资源,并选择查询时间。

    页面会自动显示当前资源所有的监控项图表。

创建告警规则

  1. 实例列表页面中单击目标实例名称。

  2. 在左侧导航栏单击监控报警

  3. 监控报警页面单击创建报警规则

    页面将跳转至云监控控制台的创建报警规则面板。

  4. 创建报警规则面板按提示设置规则和通知信息,然后单击确定。具体参数设置,请参见创建报警规则

相关文档

通过监控报警您可为云消息队列 RocketMQ 版的核心监控项和业务指标配置告警规则,具体的告警配置原则和推荐的指标项,请参见配置消息监控告警实现风险预警