监控报警

云监控服务具有指标采集、可视化、实时报警等功能,云消息队列 RocketMQ 版支持通过云监控创建监控规则,帮助您自动监控服务的运行状态,并自动发送报警通知, 便于您及时预警服务的异常信息,提高运维效率。

监控项说明

说明

消息堆积量、消息处理延迟时间、已就绪消息量、已就绪消息排队时间等消息堆积场景相关的指标的详细说明,请参见堆积场景指标说明

指标分类

监控指标

MetricName

统计方法

单位

Instance

实例API调用TPS

InstanceApiCallTps

Sum

count/s

5.0系列实例存储大小

InstanceStorageSize

Sum

byte

5.0系列实例公网下行流量带宽

InstanceInternetFlowoutBandwidth

Max

byte/s

5.0系列实例发送API调用TPS峰值

InstanceSendApiCallTps

Max

count/s

5.0系列实例消费API调用TPS峰值

InstanceReceiveApiCallTps

Max

count/s

Producer

Producer(Instance)每分钟发送消息数量

SendMessageCountPerInstance

Sum

count/min

Producer(Topic)每分钟发送消息数量

SendMessageCountPerTopic

Sum

count/min

每分钟(Instance)发送被限流次数

ThrottledSendRequestsPerInstance

Sum

count/min

每分钟(Topic)发送被限流次数

ThrottledSendRequestsPerTopic

Sum

count/min

Consumer

Consumer(Instance)每分钟接收消息数量

ReceiveMessageCountPerInstance

Sum

count/min

Consumer(GroupId)每分钟接收消息数量

ReceiveMessageCountPerGid

Sum

count/min

Consumer(GroupId&Topic)每分钟接收消息数量

ReceiveMessageCountPerGidTopic

Sum

count/min

每分钟(Instance)消费被限流次数

ThrottledReceiveRequestsPerInstance

Sum

count/min

每分钟(GroupId)接收被限流次数

ThrottledReceiveRequestsPerGid

Sum

count/min

每分钟(GroupId&Topic)接收被限流次数

ThrottledReceiveRequestsPerGidTopic

Sum

count/min

消息堆积量(GroupId)

ConsumerLag

Sum

count

消息堆积量(GroupId&Topic)

ConsumerLagPerGidTopic

Sum

count

消息处理延迟时间(GroupId)

ConsumerLagLatencyPerGid

Max

ms

消息处理延迟时间(GroupId&Topic)

ConsumerLagLatencyPerGidTopic

Max

ms

已就绪消息排队时间

(GroupId)ReadyMessageQueueTime

Max

ms

已就绪消息排队时间(GroupId&Topic)

ReadyMessageQueueTimePerGidTopic

Max

ms

已就绪消息量(GroupId)

ReadyMessages

Sum

count

已就绪消息量(GroupId&Topic)

ReadyMessagesPerGidTopic

Sum

count

每分钟转为死信状态的消息量(GroupId)

SendDLQMessageCountPerGid

Sum

count/min

每分钟转为死信状态的消息量(GroupId&Topic)

SendDLQMessageCountPerGidTopic

Sum

count/min

计费说明

使用监控报警功能云消息队列 RocketMQ 版不收取费用。

前提条件

创建服务关联角色

  • 角色名称:AliyunServiceRoleForOns

  • 角色策略名称:AliyunServiceRolePolicyForOns

  • 权限说明:允许云消息队列 RocketMQ 版使用该角色访问您的服务(云监控和ARMS服务)以完成监控报警和Dashboard相关功能。

  • 具体文档说明:服务关联角色

查看监控指标

  1. 登录云消息队列 RocketMQ 版控制台,在左侧导航栏单击实例列表

  2. 在顶部菜单栏选择地域,如华东1(杭州),然后在实例列表中,单击目标实例名称。

  3. 在左侧导航栏单击监控报警

  4. 监控报警页面选择要查看的资源,并选择查询时间。

    页面会自动显示当前资源所有的监控项图表。

创建告警规则

  1. 实例列表页面中单击目标实例名称。

  2. 在左侧导航栏单击监控报警

  3. 监控报警页面单击创建报警规则

    页面将跳转至云监控控制台的创建报警规则面板。

  4. 创建报警规则面板按提示设置规则和通知信息,然后单击确定。具体参数设置,请参见创建报警规则

相关文档

通过监控报警您可为云消息队列 RocketMQ 版的核心监控项和业务指标配置告警规则,具体的告警配置原则和推荐的指标项,请参见配置消息监控告警实现风险预警