云消息队列 Kafka 版实例的实时诊断功能能够定期对实例进行检测,支持查看诊断发现的问题、提供修复建议,并将异常的检查项上报告警给相关联系人,帮助您及时处理异常。
实现方案
检测项
说明
若检测出实例存在风险,请参考控制台上提示的修复建议进行修复。
名称 | 含义 |
kafka.risk.name.tcpConnection | TCP总连接数 |
kafka.risk.name.publicTcpConnection | 公网TCP总连接数 |
kafka.risk.name.inputIo | 写入流量超过上限 |
kafka.risk.name.outputIo | 读取流量超过上限 |
kafka.report.name.produceConversionTime | Topic存在格式转换现象 |
kafka.risk.name.partitionLeft | 剩余可用分区数量 |
操作步骤
登录云消息队列 Kafka 版控制台,在概览页面的资源分布区域,选择地域。
在实例列表页面,单击目标实例名称。
在实例详情页面,选择
。在实例风险页面中,查看实例风险项。
参数
描述
示例值
风险类型
当前实例风险的类型描述。
消费接收数据耗时较大的 Group
指标等级
当前实例指标的等级。取值:
尽快修复
重要
一般
紧急
风险状态
当前实例的健康状态。取值:
待修复
已修复
待修复
上次发现风险时间
上次发现该风险的时间。
2022年3月31日
操作
当前实例风险项可以执行的动作。
详情:查看当前实例风险详细信息和修复建议。
在目标风险操作列,单击详情。
修改报警状态:风险修复后,您可以设置风险状态为已修复,或者在近一个月内忽略未修复的风险。
在目标风险操作列,单击修改报警状态。
说明风险修复后,不会再发送告警通知。如果风险修复后,出现相同的风险,系统会在7天后再次发送风险报警通知。
无
文档内容是否对您有帮助?