云消息队列 RocketMQ 版支持自助问题排查功能,可以根据日志文件分析异常、对实例进行后端服务诊断等,并可以根据异常给出合理的处理建议。问题排查期间可能会对您的实例探测并进行诊断分析,但不会对您的实例配置和正常业务造成影响。
地域限制
自助问题排查功能暂时仅支持华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)、西南1(成都)地域。
前提条件
RAM用户使用自助问题排查功能需要进行授权,详情请参见示例四:授予RAM用户所有实例诊断功能的操作权限。
日志诊断
根据以.log
为扩展名的日志文件进行日志诊断,并在诊断报告中给出相应的处理意见。异常和处理意见,请参见日志诊断处理建议。
操作步骤
登录云消息队列 RocketMQ 版控制台,在顶部菜单栏选择地域,如华东1(杭州)。
在左侧导航栏选择
。在自助问题排查页面,单击日志诊断,在日志区域中上传以
.log
为扩展名的日志文件,然后单击提交诊断。上传的日志文件大小不能超过64MB。
在诊断报告页面,耐心等待几分钟,待任务执行完成后即可查看相应的结果。也可以单击稍后查看并退出,在诊断历史页面,待刚才创建的诊断任务状态为执行完成后,单击其操作列的详情,重新回到诊断报告页面,查看诊断结果。
后端服务诊断
根据选择的实例进行后端服务诊断,并在诊断报告中给出相应的处理意见。异常和处理意见,请参见后端服务诊断处理建议。
操作步骤
登录云消息队列 RocketMQ 版控制台,在顶部菜单栏选择地域,如华东1(杭州)。
在左侧导航栏选择
。在自助问题排查页面,单击后端服务诊断,配置以下参数,然后单击提交诊断。
5.x版本实例4.x版本实例参数
说明
示例
实例
选择云消息队列 RocketMQ 版的实例ID。
rmq-cn-vkl42*****
时间范围
选择诊断的时间范围。
2024-12-24 10:30:31 - 2024-12-24 11:30:31
参数
说明
示例
实例
选择云消息队列 RocketMQ 版的实例ID。
rmq-cn-vkl42*****
Topic 名称
选择诊断的Topic。
test_topic
SDK类型
选择使用的SDK类型。
HTTP SDK
TCP SDK
TCP SDK
时间范围
选择诊断的时间范围。
2024-12-24 10:30:31 - 2024-12-24 11:30:31
在诊断报告页面,耐心等待几分钟,待任务执行完成后即可查看相应的结果。也可以单击稍后查看并退出,在诊断历史页面,待刚才创建的诊断任务状态为执行完成后,单击其操作列的详情,重新回到诊断报告页面,查看诊断结果。
Topic访问拓扑
根据选择的实例、Topic和时间范围,查询访问Topic的生产者和消费者。
仅支持云消息队列 RocketMQ 版5.x系列实例。
操作步骤
登录云消息队列 RocketMQ 版控制台,在顶部菜单栏选择地域,如华东1(杭州)。
在左侧导航栏选择
。在自助问题排查页面,单击Topic访问拓扑,配置以下参数,然后单击提交诊断。
参数
说明
示例
参数
说明
示例
实例
选择云消息队列 RocketMQ 版的实例ID。
rmq-cn-vkl42*****
Topic 名称
选择需要查询的Topic。
testTopic
时间范围
选择诊断的时间范围。
2024-12-24 10:30:31 - 2024-12-24 11:30:31
在诊断报告页面,耐心等待几分钟,待任务执行完成后即可查看相应的结果。也可以单击稍后查看并退出,在诊断历史页面,待刚才创建的诊断任务状态为执行完成后,单击其操作列的详情,重新回到诊断报告页面,查看诊断结果。
处理建议
日志诊断
异常问题 | 处理建议 |
异常问题 | 处理建议 |
日志中存在未收录的日志 | 以下日志未被诊断系统收录,请提交工单咨询。 |
签名算法未找到 | 请检查JDK和操作系统版本,以及是否存在依赖冲突。 |
消费异常 | 请检查消费端代码或提交工单咨询。 |
心跳发送失败 | 请检查 Topic、Group 资源是否创建。如果伴随网络/后端服务异常,处理建议参考网络/后端服务异常,或提交工单咨询。 |
消费确认失败 | 如果伴随网络/后端服务异常,处理建议参考网络/后端服务异常,或提交工单咨询。 |
消息拉取失败 | 请检查 Topic、Group 资源是否创建。如果伴随网络/后端服务异常,处理建议参考网络/后端服务异常,或提交工单咨询。 |
消息发送失败 | 请检查 Topic 资源是否创建。如果伴随网络/后端服务异常,处理建议参考网络/后端服务异常,或提交工单咨询。 |
获取路由失败 | 请检查 Topic 资源是否创建。如果伴随网络/后端服务异常,处理建议参考网络/后端服务异常,或提交工单咨询。 |
客户端下线失败 | 如果伴随网络/后端服务异常,处理建议参考网络/后端服务异常。若发生在应用进程终止时,可忽略。 |
触发服务端限流 | 登录云消息队列 RocketMQ 版控制台,可通过查看实例仪表盘中的生产/消费TPS水位及被限流请求次数对实例的规格进行升配。升降配请参见实例升降配。 |
消费 group 信息未找到 | 请检查客户端订阅时采用的Group是否已创建。登录云消息队列 RocketMQ 版控制台,在实例列表页面单击客户端访问的实例名称,然后在Group 管理页面查询客户端订阅时采用的Group是否存在。 |
AK 不合法 | 请检查客户端中,认证信息是否正确。
|
SK 不合法 | 请检查客户端中,认证信息是否正确。
|
非法的定时消息时长 | 调整定时消息时长或升级实例的版本,实例的定时消息间隔时长请参见配额与限制。 |
非法的消息属性 | 请根据错误日志,检查消息属性是否存在冲突。消息属性,请参见消息内部属性。 |
消息类型不匹配 | 请检查控制台Topic消息类型与实际代码中发送的消息类型是否匹配。 |
本地消息缓存满 | 消费处理速度太慢,请检查消费逻辑。 |
网络异常 | 网络异常,详情请提交工单咨询。 |
无在线消费端 | 登录云消息队列 RocketMQ 版控制台,在实例列表页面单击客户端访问的实例名称,然后在Group 管理页面单击客户端使用的Group ID。
|
本地请求丢失 | 可能的原因:
|
后端服务异常 | 服务端异常,详情请提交工单咨询。 |
订阅关系不一致 | 登录云消息队列 RocketMQ 版控制台,在实例列表页面单击客户端访问的实例名称,然后在Group 管理页面单击客户端使用的Group ID,在Group 详情页面订阅关系区域查看是否存在不一致的订阅关系。确保Topic主题的订阅关系一致。订阅关系一致性的说明,请参见订阅关系(Subscription)。 |
订阅关系不存在 | 请检查消费端是否在线,以及网络是否正常。 |
topic 未找到 | 请检查客户端发送/订阅的Topic是否已创建。登录云消息队列 RocketMQ 版控制台,在实例列表页面单击客户端访问的实例名称,然后在Topic 管理页面查询客户端访问的Topic是否存在。 |
请求码不支持 | 常见code 320,不支持批量消息。 |
后端服务诊断
检查项 | 异常问题 | 处理建议 |
检查项 | 异常问题 | 处理建议 |
实例检查 | 实例不存在 | 请检查实例名称。 |
实例不在运行状态 | 请检查实例状态。 | |
Topic检查 | topic 不存在 | 请检查Topic资源是否在控制台创建。 |
服务端检查 | 服务端机器宕机 | 后端物理服务器集群中单台机器发生宕机,可能导致短时间网络报错,可忽略。 |
服务端发布更新 | 后端服务器集群存在运维操作,可能导致秒级别网络闪断,客户端日志可见短时间网络报错,可忽略。若未提前收到运维通知,请提交工单咨询。 |
- 本页导读 (1)
- 地域限制
- 前提条件
- 日志诊断
- 操作步骤
- 后端服务诊断
- 操作步骤
- Topic访问拓扑
- 操作步骤
- 处理建议
- 日志诊断
- 后端服务诊断