本文为您介绍云监控插件异常停止的处理方法。
背景信息
云监控插件默认每3分钟一次心跳。如果15分钟没有心跳,则主机判断插件已停止运行。
云监控插件自动停止的可能原因如下:
- 云监控插件无法与云监控服务器通信。关于如何检查网络,请参见配置网络。
- 云监控插件进程已退出。关于如何处理云监控插件进程自动退出问题,请参见如何处理云监控插件进程自动退出问题?。
排除以上两种情况后,如果云监控插件仍没有心跳,您可以参考以下方案处理。
重新安装云监控插件
如果云监控插件之前运行正常,您可以通过重新安装云监控插件来恢复其运行状态。
- 自动安装插件
具体操作,请参见自动安装插件(推荐)。
- 手动安装插件
具体操作,请参见安装和卸载C++版本插件或安装和卸载C++版本插件。
查看插件的运行状态和日志
重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。
您可以通过查看云监控插件的运行状态和日志来判断停止原因。如果出现云监控插件进程已退出的情况,则可能是云监控自身缺陷导致,建议您直接提工单,并保留问题。
- 查看插件日志
- Windows
- 以Administrator用户登录待安装云监控插件的主机。
- 进入云监控插件日志所在目录C:\Program Files\Alibaba\cloudmonitor\local_data\logs。
- 选中日志文件argusagent.log或argusagentd.log,通过记事本或写字板打开。
- argusagentd.log:云监控C++版本插件运行时为了守护进程而记录的日志。日志主要包括监控进程的启动、停止等信息。
- argusagent.log:云监控C++版本插件的运行日志。
- Linux
- 以root用户登录待安装云监控插件的主机。
- 执行以下命令,查看云监控插件日志。
cd /usr/local/cloudmonitor/local_data/logs
cat argusagent.log
cat argusagentd.log
- argusagentd.log:云监控C++版本插件运行时为了守护进程而记录的日志。日志主要包括监控进程的启动、停止等信息。
- argusagent.log:云监控C++版本插件的运行日志。
- Windows
- 查看插件运行状态
- Windows
- 以Administrator用户登录云监控插件所在主机。
- 打开服务页面。
通过键盘快捷键Win+R打开运行对话框,输入命令services.msc,单击确定。
- 查看服务argusagent service的状态。
- Linux
- 以root用户登录云监控插件所在主机。
- 执行以下命令,查看云监控插件状态。
ps aux | grep argusagent | grep -v grep
- Windows