慢日志

更新时间:
复制 MD 格式

慢日志问题极大地影响数据库的稳定性,当数据库出现负载高、性能抖动等问题时,数据库管理员或开发首先会查看是否有慢日志在执行。数据库自治服务DAS(Database Autonomy Service)支持慢日志分析功能,会统计并分析数据库中执行时间超过阈值的SQL语句,并提供相应的治理方案,帮助您快速定位并解决数据库性能问题,提高系统的稳定性和可靠性。

前提条件

数据库引擎为:

  • RDS MySQL

  • 自建MySQL

说明

不支持RDS MySQL基础系列。

背景信息

慢日志由数据库内核输出,不同数据库引擎慢日志的配置参数及阈值不相同,具体的配置参数和阈值请参见对应数据库引擎的官方文档。对于RDS MySQL,可以在参数设置中修改long_query_time参数来配置慢日志的阈值。

操作步骤

本文以查看RDS MySQL的慢日志为例。

  1. 登录DAS控制台

  2. 在左侧导航栏中,单击智能运维中心 > 实例监控

  3. 找到目标实例,单击实例ID,进入目标实例详情页。

  4. 在左侧导航栏单击请求分析 > 慢日志

  5. 慢日志分析页签,选择需要查看的时间段,查看该时间段内慢日志趋势事件分布慢日志统计慢日志明细

    • 您可以在慢日志趋势图中选择某个时间点,查看该时间点的慢日志统计慢日志明细

      说明

      如果慢日志语句内容过长,没有完整展示,您可以将鼠标指针放置在对应的慢日志语句上,系统将以弹框的形式展示完整的慢日志语句。

    • 慢日志统计慢日志明细页签中单击image,可以将慢日志信息保存到本地查看。

    • 单击image,可携带当前已选择和输入的参数,跳转至OpenApi控制台,进行API调试。

    • 事件分布区域:可以查询到指定时间范围内的慢日志事件,单击后可查询事件详情。

    • 慢日志统计区域:

      • 在列表上侧,可选择过滤条件,对数据进行筛选,不同的数据库引擎可筛选条件不同。

      • 单击目标SQL模板Query ID列的数据ID,可查看包含用户分布、客户端分布和指标趋势的相关性及明细列表。

      • 单击目标SQL模板操作列的优化,在弹出的SQL诊断优化对话框中,查看SQL诊断结果。

        若您采纳诊断建议,单击页面右上角的复制,并将优化后的SQL粘贴到数据库客户端或DMS上执行,若不采纳诊断建议,可直接单击取消结束诊断。

        说明

        DAS会根据SQL的复杂程度、对应表的数据量、数据库负载等进行SQL诊断,诊断建议的返回时间可能会超过20秒。完成诊断后,SQL诊断引擎会给出诊断结果、优化建议和预期优化收益,您可以根据诊断结果确认是否采纳建议。

      • 单击目标SQL模板操作列的限流,在SQL限流页面配置限流参数,对目标SQL进行限流。详细操作请参见SQL限流

      • 对于PolarDB MySQL数据库实例,单击目标SQL模板操作列的IMCI,查看列存索引(IMCI)的相关文档。

        说明
        • PolarDB MySQL数据库实例未购买列存索引节点,且慢日志的最大执行时间超过20秒,最大扫描行超过20万行时,显示IMCI按钮。

        • 对于大数据量复杂查询,推荐使用列存索引(IMCI)提升查询性能。

    • 慢日志明细区域,单击目标SQL操作列的优化限流,也可对目标SQL进行SQL诊断优化SQL限流

常见问题

  • Q:为什么我看不到任何慢日志数据?

    A: 由于采用实时计算窗口聚合技术,慢日志最新统计数据会晚于当前时间3分钟展示。同时也请检查:

    • 数据库实例的慢日志功能是否开启且阈值合理;

    • 所选时间范围内是否确实有慢日志产生;

    • 当前账号是否拥有目标实例的DAS访问权限。

  • Q:为什么部分实例显示为黄色(当前用户无实例的访问权限)?

    A:黄色标识表示子账号无该实例的数据访问权限,可通过以下两种方式解决:

    • 联系管理员:为子账号添加该实例的访问权限;

    • 授予全局组权限:建议授予DASGlobalGroupAdmin权限,以便子账号按需创建用户组,并批量查看其有权限的实例数据。

  • Q:为什么慢日志中返回行数(Rows_sent)显示为0,但实际查询有数据返回?

    A:这通常是由于应用使用了Server-side Cursor(服务端游标)模式导致的。在Cursor模式下,一条SQL的执行会被分为两个阶段:

    • EXECUTE阶段:服务器执行查询并生成结果集,但不立即发送数据行给客户端,仅返回列定义等元数据。

    • FETCH阶段:客户端通过FETCH命令逐批拉取数据行。

    慢日志记录的是EXECUTE阶段的统计信息。在该阶段,MySQL已扫描数据(因此Rows_examined不为0),但尚未发送任何数据行给客户端(数据在后续FETCH阶段发送),因此Rows_sent记录为0。

    常见触发场景:

    • Java/JDBC:连接URL中开启了useCursorFetch=true,且设置了PreparedStatement.setFetchSize()为大于0的值或Integer.MIN_VALUE

    • Python:使用了MySQLdb.cursors.SSCursorpymysql.cursors.SSCursor

    • ORM框架:部分ORM在处理大数据集查询时,默认使用流式查询(Streaming Query),底层即为Cursor模式。

    如需确认是否为此原因,可检查应用代码中是否配置了fetchSize或使用了流式游标,也可在数据库中执行SHOW GLOBAL STATUS LIKE 'Com_stmt_fetch';查看是否有FETCH请求。

  • Q:为什么会出现慢日志记录的SQL执行完成时间与SQL语句的实际执行时间不同?

    A:这通常是因为执行SQL语句时修改了时区导致的。慢日志记录的SQL执行时间的时区,存在会话级别、数据库级别和系统级别。慢日志时间设置逻辑为:当数据库存在时区时,以数据库的时区为准,否则以系统时区为准。当通过SQL语句修改了会话级别的时区时,可能导致慢日志记录的时区无法正常转换。

相关文档

您可以开启DAS的自动治理功能,以便在数据库实例出现慢SQL时自动进行优化。