如何处理云监控插件异常停止问题?

当某个主机的云监控插件的状态为已停止时,云监控将不能对该主机进行监控。您需要判断该主机的云监控插件的停止原因,并恢复其运行状态。

问题分析

云监控插件默认每3分钟一次心跳。如果15分钟没有心跳,则主机判断插件已停止运行。云监控插件自动停止的可能原因如下:

排除以上两种情况后,如果云监控插件仍没有心跳,您可以参考以下方案处理。

重新安装或升级云监控插件

如果云监控插件之前运行正常,您可以通过重新安装插件来恢复其运行状态;如果云监控插件为Go版本或Java版本,请您将其升级为C++版本(最新版本)。具体操作如下:

说明

Go版本和Java版本云监控插件不再维护。

查看插件的运行状态和日志

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。

您可以通过查看云监控插件的运行状态和日志来判断停止原因。如果出现云监控插件进程已退出的情况,则可能是云监控自身缺陷导致,建议您直接提工单,并保留问题。

  • 查看插件日志

    • Windows

      1. 以Administrator用户登录待安装云监控插件的主机。

      2. 进入云监控插件日志所在目录C:\Program Files\Alibaba\cloudmonitor\local_data\logs

      3. 选中日志文件argusagent.logargusagentd.log,通过记事本或写字板打开。

        • argusagentd.log:云监控插件运行时为了守护进程而记录的日志。日志主要包括监控进程的启动、停止等信息。

        • argusagent.log:云监控插件的运行日志。

    • Linux

      1. 以root用户登录待安装云监控插件的主机。

      2. 执行以下命令,查看云监控插件日志。

        cd /usr/local/cloudmonitor/local_data/logs

        cat argusagent.log

        cat argusagentd.log

        • argusagentd.log:云监控插件运行时为了守护进程而记录的日志。日志主要包括监控进程的启动、停止等信息。

        • argusagent.log:云监插件的运行日志。

  • 查看插件运行状态

    • Windows

      1. 以Administrator用户登录云监控插件所在主机。

      2. 打开服务页面。

        通过键盘快捷键Win+R打开运行对话框,输入命令services.msc,单击确定

      3. 查看服务argusagent service的状态。

    • Linux

      1. 以root用户登录云监控插件所在主机。

      2. 执行以下命令,查看云监控插件状态。

        ps aux | grep argusagent | grep -v grep

相关文档