进程监控默认为您采集最近一段时间内活跃进程的CPU使用率、内存使用率和文件打开数。如果您添加了进程关键字,还可以采集包含关键字的进程个数。

前提条件

请确保您已安装云监控插件,操作方法请参见安装和卸载插件

背景信息

  • 云监控插件每分钟统计一次CPU消耗Top5的进程,记录这些进程的CPU使用率、内存使用率和打开文件数。
    • 进程的CPU使用率与内存使用率。

      您可以参考Linux中的top命令理解这两个监控项的含义。

    • 进程的打开文件数。

      您可以参考Linux中的lsof命令理解这个监控项的含义。

  • 如果您的进程占用多个CPU,则会出现CPU使用率超过100%的情况,因为采集结果为多核CPU的总使用率。
  • 如果您查询的时间范围内,CPU消耗Top5的进程不固定,进程列表会显示该时间范围内全部进入过Top5的进程,列表中的时间表示该进程最后一次进入Top5的时间。
  • 云监控只采集CPU消耗Top5进程的CPU使用率、内存使用率和打开文件数。如果进程在查询的时间范围内未持续进入Top5,则监控图表中会出现数据点不连续的情况,数据点的密集程度表明了该进程在主机上的活跃程度。示例如下:
    • Wrapper进程未持续进入主机CPU消耗Top5,监控图表中的数据点稀疏,且不连续,表示有数据点的时间该进程进入Top5。wrapper
    • Java进程在监控图表中的数据点非常密集,且连续,表示该进程已持续进入CPU消耗Top5。JAVA

添加指定进程

您可以通过监控主机的进程数,采集关键进程的数量,及时获取关键进程的存活状态。

假设您的主机运行了如下进程 :
  • /usr/bin/java -Xmx2300m -Xms2300m org.apache.catalina.startup.Bootstrap
  • /usr/bin/ruby
  • nginx -c /ect/nginx/nginx.conf
您添加了6个进程关键字,采集结果如下:
  • 进程关键字为ruby,采集进程数为1,命中进程名称。
  • 进程关键字为nginx,采集进程数为1,命中进程名称与参数。
  • 进程关键字为/usr/bin,采集进程数为2,命中路径(2个进程包含该路径)。
  • 进程关键字为apache.catalina,采集进程数为1,命中部分参数。
  • 进程关键字为nginx.conf,采集进程数为1,命中部分参数。
  • 进程关键字为-c,采集进程数为1, 命中部分参数。
  1. 登录云监控控制台
  2. 在左侧导航栏,选择主机监控
  3. 主机监控实例列表页签,单击目标主机的实例名称链接,或单击目标主机对应操作列的监控图表
  4. 实例详情页面,单击进程监控页签。
  5. 进程监控页签,单击右上角的添加进程监控
  6. 添加进程监控页面,输入进程名称,单击添加
  7. 单击关闭

删除指定进程

  1. 登录云监控控制台
  2. 在左侧导航栏,选择主机监控
  3. 主机监控实例列表页签,单击目标主机的实例名称链接,或单击目标主机对应操作列的监控图表
  4. 实例详情页面,单击进程监控页签。
  5. 进程监控页签,单击右上角的添加进程监控
  6. 添加进程监控页面,单击目标进程对应操作列的删除
  7. 单击关闭

为指定进程设置报警规则

您设置监控指定进程后,可以为该进程设置报警规则。当进程数发生变化时,您可以收到报警通知。

  1. 登录云监控控制台
  2. 在左侧导航栏,选择主机监控
  3. 主机监控实例列表页签,单击报警规则
  4. 报警规则页签,单击右上角的新建报警规则
  5. 创建报警规则页面,规则描述选择进程数,根据所需设置报警规则其他参数。
    • 如果主机上设置了多个进程,且每个进程数不同,可以单击添加报警规则,为多个进程设置报警规则。
    • 报警规则相关参数的设置方法,请参见创建阈值报警规则
  6. 单击确认