本文介绍混合云备份HBR备份客户端的常见网络问题。
背景信息
在非阿里云VPC的各类线下环境中安装备份客户端时,可能遇到各种未知且复杂的网络环境。例如防火墙会阻拦域名或端口的连接导致备份失败,防火墙会限制网络传输速度导致部分请求超时,网络行为检测工具会检测并修改一些HTTP请求内容,上行带宽过小时会导致请求超时甚至备份失败等。
常见网络问题概览
问题 | 诊断工具检测 | 客户端日志 | 问题分析及排查方法 |
---|---|---|---|
控制台显示打开备份库失败 | 通过诊断工具检测,出现如下问题:
| 客户端日志中出现如下相关描述:
| 备份客户端到对应域名的请求失败。可能原因如下:
|
控制台显示打开备份库失败 | 通过诊断工具检测,出现如下问题: This is usually a temporary error during hostname resolution and means that the local server did not receive a response from an authoritative server. | 客户端日志中出现如下相关描述: This is usually a temporary error during hostname resolution and means that the local server did not receive a response from an authoritative server. | 对应域名的DNS解析失败。可能原因如下:
|
请求失败排查方法
- 检查网络和HBR接入点域名及端口的连通性。
- 执行telnet访问对应接入点及端口,确认当前网络中上行(备份)或下行(恢复)可用带宽。其中接入点可以为HBR客户端问题诊断工具检测到的管控(通信)网络公网域名。例如telnet访问接入点及端口的命令如下:
telnet post-cn-mp90rcien05.mqtt.aliyuncs.com 80
- 若存在网络监控,请查看网络流量监控在备份、恢复的时间点对应的网络流量情况。
- 若使用公网,建议咨询运营商或网络管理员了解网络流量情况。
- 若使用云企业网或阿里云VPN,请在云企业网或阿里云VPN控制台确认带宽以及查看对应监控数据。
- 根据带宽以及同时进行的任务数,判断是否当前带宽不足导致。例如上行带宽有20 MB/s,而可用于备份的可能仅有10 MB/s,这种情况若数据量足够大,会导致类似请求失败问题。
- 若无法确定带宽(主要上行带宽),建议使用ossutil(oss官方工具) probe进行探测,了解网络流量情况。
- 若经过上述检查,确实为可用带宽不足的问题导致,建议进行以下操作。
DNS解析失败排查方法
- 检查本机DNS配置。若未配置私有DNS服务器,建议配置为阿里云公共DNS地址
223.5.5.5
。 - 检查防火墙规则,HBR备份客户端使用的接入点及端口,必须配置白名单或者放行规则。
- 咨询网络管理员是否有其他限制。
- 确保到诊断工具提示的地址可以正确解析后,重新尝试备份。