Hologres常见问题排查合集

本文汇总了Hologres常见问题排查合集,您可以通过合集排查Hologres相关问题,并根据解决方案进一步优化和调整,以提升实例运行的稳定性。

OOM排查指南

通常,若出现报错Total memory used by all existing queries exceeded memory limitation.则说明Query出现了OOM问题,可以通过OOM常见问题排查指南排查和治理OOM。

性能调优指南

当出现Hologres查询或写入性能降低等问题时,可以通过如下性能调优指南进一步对SQL进行调优。

活跃Query管理指南

当CPU持续高负载影响线上业务,或者监控指标中正在运行的Query持续时间较长时,可以通过活跃Query查看当前时刻正在运行的Query,及时通过Superuser账号kill掉不符合预期的Query,快速处理问题,详情请参见HoloWeb可视化活跃Query管理

连接数管理指南

当出现terminating connection due to idle state timeoutterminating connection due to idle-session timeoutremaining connection slots are reserved for non-replication superuser connections等报错时,说明有连接数超过了实例规格,或者连接超时,可以通过Superuser账号进行连接数管理,及时kill掉不符合预期的连接,或者调整连接超时时间。详情请参见连接数管理

SQL语法问题

出现bigint out of rangedivision by zero等报错时,通常是SQL使用问题导致,详情请参见Hologres SQL语句的常见问题

权限问题排查指南

使用某个账号在实例内操作出现permission deniedcloud authentication failedyou have no privilege等报错时,表示该账号遇到了权限相关问题,可以根据详细的报错信息前往权限相关问题进行排查。

外部表查询问题排查指南

查询MaxCompute外部表,出现Failed to get MaxCompute table:Not enable schema evolutionFailed to get MaxCompute table:Not enable acid tableERROR: not an ORC file等报错时,可以通过对接MaxCompute常见问题与诊断进行排查。

Flink相关问题排查指南

使用Flink写入数据至Hologres,或者从Hologres读取数据时,出现性能降低、ERPC CONNECTION CLOSEDRead timed out问题时,可以通过Blink和Flink常见问题及诊断进行进一步的排查。

监控指标使用指南

监控指标的含义、通过指标监控异常或通过指标排查问题等操作,请参见Hologres管控台的监控指标