主机监控

云监控可以监控阿里云主机和非阿里云主机。本文以监控阿里云主机(ECS实例),并为CPU使用率设置报警规则为例,为您介绍监控主机的具体操作流程。

前提条件

步骤一:查看主机是否安装云监控插件

当您在云服务器ECS控制台上创建阿里云主机(ECS实例)后,在云监控控制台的主机监控列表中会显示该主机。仅当阿里云主机(ECS实例)安装云监控插件后,云监控才能对其进行监控。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > 主机监控

  3. 查看新创建的阿里云主机是否已安装云监控插件。

    • 是,执行步骤二:为主机创建报警规则

      当目标阿里云主机的argusagent状态显示为运行中时,说明已安装云监控插件。

    • 否,手动为阿里云主机安装插件。具体操作,请参见自动安装(推荐)

      当目标阿里云主机的argusagent状态显示为重装/升级时,说明未安装云监控插件。

说明

步骤二:为主机创建报警规则

当您在查看阿里云主机(ECS实例)的监控指标时,还可以为其创建报警规则,当该监控指标达到报警条件时,会给您发送报警通知,以便您及时关注该监控指标的动态。

  1. 登录云监控控制台

  2. 在左侧导航栏,选择云资源监控 > 主机监控

  3. 主机监控页面,单击目标主机名称。

  4. 在目标主机的主机监控详情页面,单击CPU使用率(%)区域的image.png图标。

  5. 设置规则描述面板,先设置规则名称,再设置监控指标的阈值和报警级别,然后单击确定

    CPU使用率的阈值设置为80,报警级别设置为警告,报警方式默认为短信+邮件+WebHook

  6. 创建报警规则面板,设置报警联系人组,其他参数均保持默认值。

    关于如何设置报警规则的更多参数,请参见创建报警规则

    说明

    如果报警联系人只设置了手机号码、邮箱和WebHook中的任意一种,则接收报警通知的方式也只能是短信、邮件或WebHook中的一种。

  7. 单击确定

    关于修改、禁用、启用和删除报警规则的操作,请参见管理报警规则

步骤三:查看主机报警

创建报警规则后,您可以在报警服务中查看新创建的报警规则及其报警状态。

  1. 登录云监控控制台

  2. 在左侧导航栏,单击报警服务 > 报警规则

  3. 报警规则页面,您可以看到目标报警规则以及报警状态。

    • 当报警规则的状态为正常时,说明未发生报警。

    • 当报警规则的状态为报警时,说明已发生报警,且您已收到报警通知,您还可以查看报警历史,具体操作,请参见查看报警历史