RDS MySQL临时文件导致实例磁盘空间满且出现“锁定中”状态

问题描述

阿里云云数据库RDS MySQL实例由于临时文件占用磁盘空间较多,导致实例的运行状态为“锁定中”。基本信息

问题原因

MySQL实例可能会由于查询语句的排序、分组、关联表产生的临时表文件,或者大事务未提交前产生的binlog cache文件,导致实例磁盘空间满。为避免数据丢失,RDS会将实例锁定,在锁定之后,将无法进行写入操作。

解决方案

在紧急情况下建议扩容实例存储空间,扩容后需要耐心等待一段时间(5分钟左右),方可解锁实例,关于如何升级实例配置,请参见变更配置

若您无法扩容实例存储空间,可以重启实例,释放临时文件。详情请参见重启实例

如果重启实例后,仍然不能解锁,请参考以下操作处理:

  1. 通过DMS连接实例。

  2. 执行以下SQL语句,查看数据库的会话。

    show processlist
  3. 单击显示结果中的State,进行状态排序,在状态栏查看是否有大量“Copy to tmp table”、“Sending data”等信息,然后记录该会话的ID值。state

  4. 执行以下SQL语句,终止会话。

    kill [$ID];
    说明

    [$ID]为上一步获取的ID值,注意确认终止该会话不会影响业务。

后续维护

若锁定问题已解决,请参考以下步骤,预防再次出现锁定问题:

  • 在资源不足时,实例自动扩容存储空间,详情请参见设置存储空间自动扩容

  • 针对查询产生的临时文件,应该优化SQL语句,避免频繁使用order by、group by操作,可以适当的将tmp_table_size和max_heap_table_size值调大,但是为了减少磁盘使用而调高tmp_table_size和max_heap_table_size并不明智,因为内存资源远比磁盘资源宝贵。您可以通过explain加SQL语句查看是否使用内部临时表,示例如下,在Extra字段中有“Using temporary”字样,则代表会使用内部临时表。

    explain select * from alarm group by created_on order by default;

    系统显示类似如下。系统显示类

  • 针对binlog cache,应该减少执行大事务的情况,尤其应该减少在多个连接同时执行大事务的情况,如果大事务比较多,可以适当将binlog_cache_size值调大,但是同样不建议为了节省磁盘空间调整这个参数,建议使用短连接执行大事务,降低临时空间开销。

  • 建议您监控磁盘使用率,及时清理数据或进行数据拆分,使磁盘使用率不超过80%。

更多信息

若您暂时无法清理临时文件进行解锁,您可以清理其他类型的文件,降低磁盘空间使用率,如下所示:

常见问题

Q:如果实例基本信息页中,重启实例按钮不可用,该如何处理?

A:您可以通过如下方式触发实例重启:

  1. 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。
  2. 在左侧导航栏单击参数设置。

  3. 在可修改参数标签页,查看是否重启列,找到一个该列取值为的参数进行修改。