Redis连接问题排查与解决

Redis连接问题排查与解决

概述

本文主要介绍Redis连接问题的排查与解决。

详细信息

当您发现与Redis的连接出现异常时,可以根据本文的内容,从如下几个方面进行排查。

Redis与ECS之间的连接问题

在ECS实例上通过内网地址访问Redis实例需要确保ECS与Redis之间可以相互连接。如果二者无法互访,可能是下列原因引起的。

说明:如因条件限制无法实施以下解决方法,您可以重新创建ECS或Redis实例,使二者在同一VPC中。

  • Redis实例和ECS实例不在同一账号下,解决方法如下所示。
  • ECS与Redis不在相同地域,解决方法如下所示。
  • ECS与Redis的网络类型不同,一个是经典网络而另一个是VPC网络。
  • ECS的安全组规则阻塞了对Redis地址和端口的访问。
  • Redis的白名单中未加入ECS的内网地址。
    • 设置Redis白名单,将ECS的内网IP加入其中,操作方法请参见设置IP白名单
      说明:如果出现“Caused by: redis.clients.jedis.exceptions.JedisConnectionException: java.net.ConnectException: 拒绝连接 (Connection refused)”报错,请检查Redis白名单设置,若白名单设置无误且可以在ECS实例上ping通Redis实例,请检查应用中的连接配置。
  • DNS解析问题。客户端出现“UnknownHostException”或者“failed to connect: r-***************.redis.rds.aliyuncs.com could not be resolved”之类的报错,解决方法如下所示。
    • 使用ping或者telnet命令测试Redis连接地址,查看解析情况,如不成功请检查DNS配置。
  • ECS异常行为触发安全策略,导致服务被禁止。如果多台正常连接到Redis的ECS实例中有某个实例出现突发的连接问题,尤其是ECS能ping通Redis实例,但使用telnet命令测试6379端口失败时,可能是该ECS存在异常行为(例如对外攻击),导致服务被禁止,解决方法如下所示。
    • 请检查服务器,在安全组的出方向设置精确的规则,比如限定该ECS只能访问业务需要的地址和端口,此处为Redis实例的6379端口。若问题还不能解决,请提交工单进行详细排查。

从外网连接Redis

如您需要从本地主机连接云数据库Redis版,请参见外网连接或者使用代理工具实现外网连接

说明:建议您使用阿里云内网通过ECS连接Redis实例,提高安全性,降低网络耗时对Redis性能的影响。

忘记密码

若忘记Redis密码,请在控制台修改密码

客户端连接问题

客户端连接主要有如下几种方法。

  • 使用Jedis、PHP Redis、Python Redis、C/C++、.NET、Nodejs Redis、C#等客户端连接Redis的方法请参见Redis客户端连接
  • 使用阿里云的数据管理工具DMS连接并管理数据库请参见使用DMS登录Redis
  • 使用redis-cli连接Redis的方法请参见redis-cli连接

说明:如果使用各语言的客户端或者redis-cli连接Redis失败,请先排查Redis与ECS实例之间的连接问题。

客户端连接常见的问题如下所示。

带宽超限导致连接受限

每种规格的Redis实例都有相应的带宽限制,详情请参见规格性能。在网络带宽资源充足的情况下,云数据库Redis版的带宽限制不生效,当资源不足时,实例的带宽上限开始生效,此时如果流量过大,则业务请求会受到带宽限制。

  • 升级实例规格,提升带宽。
  • 转换为同规格的集群版实例,提升带宽。
  • 转换为同规格的读写分离实例,提升带宽,同时可以把大Key或者热点Key存储在只读实例中,避免其影响其它业务。

性能问题导致连接不畅或失败

使用KEYSHGETALL等命令影响了Redis性能,导致线程阻塞等情况,进而出现连接问题。

  • 禁止线上环境使用KEYSFLUSHALLFLUSHDB等命令。禁用方式请参见禁用高风险命令
  • 查看监控指标,找出问题原因并采取针对性的办法。
  • 查询慢日志,根据慢日志详情进行优化。您可以在Redis控制台查看慢日志或使用SHOW LOG命令查看。
  • 如实例的引擎版本为4.0或以上,可以借助LazyFree机制的UNLINKFLUSHALL ASYNCFLUSHDB ASYNC命令和相关参数优化业务代码。

适用于

  • 云数据库Redis