本文为您介绍云监控插件异常停止问题的排查和处理方法。

背景信息

云监控插件默认每3分钟一次心跳联网。如果15分钟没有心跳联网,则主机判断插件已经停止运行。

云监控插件自动停止的可能原因如下:
  • 云监控插件无法与云监控服务器通信。
  • 云监控插件进程已退出。

插件无法与云监控服务器通信

如果云监控插件之前运行正常,您可以通过重新安装云监控插件来恢复其运行状态。

插件进程已退出

您可以通过查看云监控插件的运行状态和日志来判断停止原因。如果出现云监控插件进程已退出的情况,则可能是云监控自身缺陷导致,建议您直接提工单,并保留问题。
  • 查看插件日志
    • Windows
      1. 以Administrator用户登录待安装云监控插件的主机。
      2. 进入云监控插件日志所在目录C:\Program Files\Alibaba\cloudmonitor\local_data\logs
      3. 选中日志文件argusagent.logargusagentd.log,通过记事本或写字板打开。
        • argusagentd.log:云监控C++版本插件运行时为了守护进程而记录的日志。日志主要包括监控进程的启动、停止等信息。
        • argusagent.log:云监控C++版本插件的运行日志。
    • Linux
      1. 以root用户登录待安装云监控插件的主机。
      2. 执行以下命令,查看云监控插件日志。

        cd /usr/local/cloudmonitor/local_data/logs

        cat argusagent.log

        cat argusagentd.log

        • argusagentd.log:云监控C++版本插件运行时为了守护进程而记录的日志。日志主要包括监控进程的启动、停止等信息。
        • argusagent.log:云监控C++版本插件的运行日志。
  • 查看插件运行状态
    • Windows
      1. 以Administrator用户登录云监控插件所在主机。
      2. 打开服务页面。

        通过键盘快捷键Win+R打开运行对话框,输入命令services.msc,单击确定

      3. 查看服务argusagent service的状态。
    • Linux
      1. 以root用户登录云监控插件所在主机。
      2. 执行以下命令,查看云监控插件状态。

        ps aux | grep argusagent | grep -v grep