当某个主机的云监控插件的状态为已停止时,云监控将不能对该主机进行监控。您需要判断该主机的云监控插件的停止原因,并恢复其运行状态。
问题分析
云监控插件默认每3分钟一次心跳。如果15分钟没有心跳,则主机判断插件已停止运行。云监控插件自动停止的可能原因如下:
云监控插件所在主机无法与云监控服务器通信。
处理方法,请参见配置网络。
云监控插件进程已退出。
处理方法,请参见如何处理云监控插件进程自动退出问题。
排除以上两种情况后,如果云监控插件仍没有心跳,您可以参考以下方案处理。
重新安装或升级云监控插件
查看插件的运行状态和日志
您可以通过查看云监控插件的运行状态和日志来判断停止原因。如果出现云监控插件进程已退出的情况,则可能是云监控自身缺陷导致,建议您直接提工单,并保留问题。
查看插件日志
Windows
以Administrator用户登录待安装云监控插件的主机。
进入云监控插件日志所在目录C:\Program Files\Alibaba\cloudmonitor\local_data\logs。
选中日志文件argusagent.log或argusagentd.log,通过记事本或写字板打开。
argusagentd.log:云监控插件运行时为了守护进程而记录的日志。日志主要包括监控进程的启动、停止等信息。
argusagent.log:云监控插件的运行日志。
Linux
以root用户登录待安装云监控插件的主机。
执行以下命令,查看云监控插件日志。
cd /usr/local/cloudmonitor/local_data/logs
cat argusagent.log
cat argusagentd.log
argusagentd.log:云监控插件运行时为了守护进程而记录的日志。日志主要包括监控进程的启动、停止等信息。
argusagent.log:云监插件的运行日志。
查看插件运行状态
Windows
以Administrator用户登录云监控插件所在主机。
打开服务页面。
通过键盘快捷键Win+R打开运行对话框,输入命令services.msc,单击确定。
查看服务argusagent service的状态。
Linux
以root用户登录云监控插件所在主机。
执行以下命令,查看云监控插件状态。
ps aux | grep argusagent | grep -v grep