本文档介绍了安骑士Agent处于离线状态时如何进行问题排查和处理。
问题描述
安骑士控制台资产列表页面中Agent处于离线状态。

问题排查
建议按照以下步骤对Agent离线的问题进行排查:
- 登录您的服务器查看安骑士Agent相关进程是否正常运行。如果Agent相关进程没有正常运行,建议重启您的服务器,或者重新安装安骑士Agent。
- Windows系统:在任务管理器中查看进程AliYunDun和AliYunDunUpdate是否正常运行。
- Linux系统:执行命令
ps aux | grep AliYunDun
命令查看进程AliYunDun和AliYunDunUpdate是否正常运行。
- Windows系统:在任务管理器中查看进程AliYunDun和AliYunDunUpdate是否正常运行。
- 如果首次安装安骑士Agent后显示安骑士状态不在线,可参考以下方式重新启动安骑士Agent:
- Windows系统:在服务项中定位到以下两个进程服务项并右键单击重新启动即可。
- Linux系统:执行命令
killall AliYunDun && killall AliYunDunUpdate && /usr/local/aegis/aegis_client/aegis_10_xx/AliYunDun
重启。说明 将命令中的xx
替换为该目录下的最大数字。
说明 购买ECS实例时勾选安全加固选项即可自动安装安骑士Agent。 - Windows系统:在服务项中定位到以下两个进程服务项并右键单击重新启动即可。
- 检查您的服务器网络连接是否正常。
- 服务器有公网IP(如经典网络、EIP、非阿里云主机)
- Windows 系统 : 在命令行中执行
ping jsrv.aegis.aliyun.com -l 1000
。 - Linux 系统 : 执行命令
ping jsrv.aegis.aliyun.com -s 1000
。
- Windows 系统 : 在命令行中执行
- 服务器无公网IP(只覆盖阿里云ECS,如金融云、VPC 专有网络)
- Windows 系统: 在命令行中执行
ping jsrv3.aegis.aliyun.com -l 1000
。 - Linux 系统:
- VPC专有网络:在命令行中执行
ping jsrv2.aegis.aliyun.com -s 1000
命令。 - 中国地域经典网络:在命令行中执行
ping jsrv4.aegis.aliyun.com -s 1000
命令。 - 中国以外地域经典网络:在命令行中执行
ping jsrv5.aegis.aliyun.com -s 1000
命令。
- VPC专有网络:在命令行中执行
- Windows 系统: 在命令行中执行
说明 连通以上任意一个网络即视为服务器网络连接正常。 - 服务器有公网IP(如经典网络、EIP、非阿里云主机)
- 如果连接不通,请根据以下方法检查您的服务器网络连接状况:
- 确认您的服务器的DNS服务正常运行。如果DNS服务无法运行,请您重启您的服务器或检查服务器DNS服务是否有问题。
- 检查服务器是否设置了防火墙ACL规则或阿里云安全组规则。如果有,请确认已将服务器安全(安骑士)的服务端IP加入防火墙白名单(出、入方向均需添加)以允许网络访问。
将下列IP段的80端口添加至白名单,最后一个IP段需要同时添加80和443端口至白名单:
- 10.84.135.0/24 Port: 80 443
- 106.11.248.0/24 Port: 80 443
- 106.11.250.0/24 Port: 80 443
- 100.100.0.0/16 Port: 80 443
- 检查您的服务器公网带宽是否为零。
如果您的服务器公网带宽为零,请参考以下步骤进行解决:
- 在您服务器的hosts文件添加以下域名解析记录:
- 中国地域经典网络:
100.100.110.61 jsrv.aegis.aliyun.com
、100.100.45.131 jsrv.aegis.aliyun.com
100.100.110.62 update.aegis.aliyun.com
和100.100.45.29 update.aegis.aliyun.com
- 中国以外地域经典网络:
100.100.103.52 jsrv.aegis.aliyun.com
、100.100.30.54 jsrv.aegis.aliyun.com
、100.100.30.55 update.aegis.aliyun.com
和100.100.103.54 update.aegis.aliyun.com
- 中国地域经典网络:
- 修改hosts文件后,执行
ping jsrv.aegis.aliyun.com
命令。如果返回的结果不是
100.100.25.3
,请重启服务器或检查服务器DNS服务是否有问题。 - 如果仍然无法解析到正确的IP,您可以尝试修改安骑士安装目录下conf 目录中的network_config 配置文件,将t_srv_domain对应值修改为
100.100.30.25
、将h_srv_domain对应值修改为100.100.167.125
。修改完成后,重启安骑士Agent进程。说明- 修改前请务必备份network_config配置文件。
- 此方法只适用于公网带宽为0且安骑士Agent离线的服务器。
- 如果Ping命令执行解析成功,再次执行Telnet命令
telnet 140.205.140.205 80
查看是否能连通解析出的域名IP的80端口。如果无法连通,请确认防火墙是否存在相关限制。
- 在您服务器的hosts文件添加以下域名解析记录:
- 检查您的服务器CPU、内存是否长期维持较高占用率(如 95%、100%),此情况可能导致安骑士Agent进程无法正常工作。
- 检查服务器是否已安装第三方的防病毒产品(如安全狗、云锁等)。部分第三方防病毒软件可能会禁止安骑士Agent插件访问网络。如果有,请暂时关闭该产品并重新安装安骑士Agent。