排查和处理文件备份客户端状态异常

文件备份客户端状态异常,可能导致备份和恢复任务执行失败。本文介绍排查和处理文件备份客户端状态异常操作方法。

  • 问题现象

    在云备份控制台,出现客户端状态为“已停止”,且提示“客户端未正常连接”,以及备份任务状态为“失败”,并提示“备份客户端失去连接导致备份失败”的现象。

    image

    image

  • 问题原因

    • 文件备份客户端程序运行异常,例如进程已停止。

    • 文件备份客户端和服务端之间的网络连接异常,例如网络不通、防火墙拦截,或者客户端设置不正确等。

    • 文件备份客户端注册失败,例如本地服务器更换网卡等。

  • 解决方法

    1. 检查文件备份客户端运行状态。

      Windows系统

      当前支持的Windows版本备份客户端存在新版和旧版之分,新版和旧版的区别如下:

      • 新版文件备份客户端服务名称为:Alibaba Cloud Hybrid Backup Service

      • 旧版文件备份客户端服务名称为:Aliyun Hybrid Backup Service

      您可以使用以下方法查看客户端的运行状态:

      • 查看服务运行状态

        说明

        在更改服务的启动类型之前,请确保您了解服务的功能和作用,以避免对系统造成不良影响。对于某些服务,可能需要以管理员身份执行操作。

        1. 打开服务管理器。可以通过以下方式打开:

          • 使用快捷键Win + R打开运行对话框,输入services.msc

          • Windows搜索栏中输入服务,然后单击服务应用

        2. 服务管理器窗口中,您可以看到列出的所有Windows服务。

          • 要启动服务,双击服务名称,进入服务属性窗口,然后单击启动按钮。

          • 要停止服务,双击服务名称,进入服务属性窗口,然后单击停止按钮。

        3. 查看本地服务,如果程序运行正常,可以看到备份服务处于正在运行状态。正在运行

      Linux系统

      当前支持的Linxu版本备份客户端存在新版和旧版之分,新版和旧版的区别如下:

      • 新版文件备份客户端服务进程为:hbrclient

      • 旧版文件备份客户端服务进程为:hybridbackup

      新版文件备份客户端(hbrclient)

      您可以使用以下方法查看客户端的运行状态:

      • 查看进程运行状态

        执行systemctl status hbrclientservice hbrclient status或者ps axu|grep hbrclient命令,查看服务客户端运行状态。如果存在activerun,说明已经启动,一切运行正常。

      • 查看端口是否正常打开

        执行netstat -lpt | grep hbrclient命令,查看端口运行状态。如果端口打开正常,可以看到端口处于LISTEN状态。

        tcp6       0      0 [::]:43565              [::]:*                  LISTEN      1727/hbrclient

      旧版文件备份客户端(hybridbackup)

      您可以使用以下方法查看客户端的运行状态:

      • 查看进程运行状态

        执行ps axu|grep hybridbackup命令,如果存在结果,说明已经启动,一切运行正常。

      • 查看端口8011是否正常打开

        执行lsof -i:8011命令,查看端口运行状态,如果端口打开正常,可以看到端口处于LISTEN状态。如果命令行提示command not found,您可以使用yum install lsofapt install lsof安装lsof后重试。

        COMMAND     PID USER   FD   TYPE   DEVICE SIZE/OFF NODE NAME
        hybridbac 11477 username    5u  IPv6 10625414      0t0  TCP *:8011 (LISTEN)

      重启或者重新安装客户端

      • 若客户端没有正常运行,您可以尝试重启备份服务。

        说明

        不同Linux操作系统指令不同:

        新版客户端重启命令:

        • systemctl restart hbrclient

        • systemctl restart hbrclientupdater

        旧版客户端重启命令:

        • systemctl restart hybridbackup

        • systemctl restart updater

      • 若客户端仍然没有正常运行,您可以卸载客户端并重新安装。具体操作,请参见如何卸载云备份客户端下载并激活Linux客户端

      如何查看备份客户端日志,请参见如何查看云备份客户端默认安装路径和日志

    2. 检查日志和网络。

      检查备份客户端的运行日志和网络情况,重新设置并激活备份客户端。

      1. 检查运行日志Log。

        说明

        新版备份客户端默认安装路径参考如下,操作中请以实际安装路径为准。

        • Windows版本日志路径:本地磁盘(C)> Program Files > Aliyun Hybrid Backup Service Client > logs

        • Linux版本日志路径:/opt/alibabacloud/hbrclient/logs

        1. 打开Log文件,搜索Failed to register client. AppError: ErrorCode=

        2. ErrorCodeInvalidInstanceId,则表示网络正常但备份客户端注册失败,执行步骤

        3. ErrorCode不为InvalidInstanceId,则重启云备份服务。Linux系统可执行service hbrclient restart重启云备份服务。

        4. 若仍然异常,请检查网络状态,执行步骤

        5. 若仍然注册失败,请提交工单获取支持。

      2. 检查服务器网络状态。

        1. 建议使用云备份客户端问题诊断工具对客户端所处网络环境进行监测。常见网络问题,请参见常见网络问题

        2. 打开客户端network.log文件。

        3. 若日志文件中出现Failed on ping,则表示网络异常(包括防火墙和路由配置等异常)。请您联系服务器所在网络的IT支撑人员,根据网络接入点设置云备份对应地域的公网接入点或ECS内网接入点。

        4. 若未搜索到Failed on ping,执行步骤

      3. 确认服务器是否更换过网卡。

        联系服务器所在网络的IT支撑人员,确认安装过备份客户端的服务器是否更换过网卡。

        1. 若更换过网卡,则该操作会导致服务器MAC地址变化,导致备份客户端无法注册,从而备份客户端状态异常。请按照步骤重新激活备份客户端。

        2. 若未更换过网卡,执行步骤

      4. 如果为旧版客户端,请检查服务器是否被克隆过。

        联系服务器所在网络的IT支撑人员,确认安装过备份客户端的服务器是否被克隆过。

        1. 若被克隆过,则该操作会导致安装的备份客户端也被克隆,从而导致克隆出来的服务器上的备份客户端注册失败。

          • 若原服务器备份客户端仍在使用,请在克隆出来的服务器上卸载备份客户端后,重新安装备份客户端即可。

          • 若原服务器备份客户端未使用,则在克隆出来的服务器上,按照步骤重新激活客户端。

        2. 若未被克隆过,执行步骤

      5. 请检查服务器操作系统是否重新安装过。

        说明

        重新安装服务器操作系统后,文件备份客户端会和云备份控制台之间失去联系,造成文件备份客户端在云备份控制台显示异常。您重新安装文件备份客户端并注册后,会出现第二台名称相同的文件备份客户端。

        1. 先停止新文件备份客户端服务。

        2. 云备份控制台获取旧文件备份客户端的重新激活Token(包含执行命令和Token)。客户端失联一个小时后才允许重新激活,若无法点击重新激活请稍等。

        3. 在服务器对应客户端目录执行获取的重新激活命令。

        4. 等待一会儿,云备份控制台的旧文件客户端显示为已激活。

        5. 在云备份控制台,删除已经异常的新文件备份客户端。

      6. 如果还是异常,请重新激活文件备份客户端。

        1. 登录云备份Cloud Backup控制台

        2. 选择备份数据源。

          • ECS文件备份

            在左侧导航栏,选择备份 > ECS文件备份

          • 本地文件备份

            在左侧导航栏,选择备份 > 本地文件备份

        3. 在顶部菜单栏左上角,选择所在地域。

        4. 找到目标备份客户端,在其右侧的操作栏选择更多 > 重新激活客户端

        5. 重新激活客户端面板,拷贝命令。并在服务器上的客户端安装目录下执行该命令,等待激活成功。

        激活完成后,客户端状态显示为已激活

      7. 如果以上排查仍未解决问题,请提交工单获取支持。

错误处理相关文档