本文汇总了Hologres常见问题排查合集,您可以通过合集排查Hologres相关问题,并根据解决方案进一步优化和调整,以提升实例运行的稳定性。
OOM排查指南
通常,若出现报错Total memory used by all existing queries exceeded memory limitation.
则说明Query出现了OOM问题,可以通过OOM常见问题排查指南排查和治理OOM。
性能调优指南
当出现Hologres查询或写入性能降低等问题时,可以通过如下性能调优指南进一步对SQL进行调优。
活跃Query管理指南
当CPU持续高负载影响线上业务,或者监控指标中正在运行的Query持续时间较长时,可以通过活跃Query查看当前时刻正在运行的Query,及时通过Superuser账号kill掉不符合预期的Query,快速处理问题,详情请参见HoloWeb可视化活跃Query管理。
连接数管理指南
当出现terminating connection due to idle state timeout
、terminating connection due to idle-session timeout
、remaining connection slots are reserved for non-replication superuser connections
等报错时,说明有连接数超过了实例规格,或者连接超时,可以通过Superuser账号进行连接数管理,及时kill掉不符合预期的连接,或者调整连接超时时间。详情请参见连接数管理。
SQL语法问题
出现bigint out of range
或division by zero
等报错时,通常是SQL使用问题导致,详情请参见Hologres SQL语句的常见问题。
权限问题排查指南
使用某个账号在实例内操作出现permission denied
、cloud authentication failed
、you have no privilege
等报错时,表示该账号遇到了权限相关问题,可以根据详细的报错信息前往权限相关问题进行排查。
外部表查询问题排查指南
查询MaxCompute外部表,出现Failed to get MaxCompute table:Not enable schema evolution
、Failed to get MaxCompute table:Not enable acid table
或ERROR: not an ORC file
等报错时,可以通过对接MaxCompute常见问题与诊断进行排查。
Flink相关问题排查指南
使用Flink写入数据至Hologres,或者从Hologres读取数据时,出现性能降低、ERPC CONNECTION CLOSED
或Read timed out
问题时,可以通过Blink和Flink常见问题及诊断进行进一步的排查。
监控指标使用指南
监控指标的含义、通过指标监控异常或通过指标排查问题等操作,请参见Hologres管控台的监控指标。