监控您的ECS实例是否健康非常重要,您需要确保用户始终可以快速打开您的网站和应用,或者快速完成数据处理和渲染等任务。阿里云提供了监控数据收集、可视化以及实时监控告警等服务,确保您的实例始终处于正常的运行状态。

背景信息

目前,您可以通过ECS自带监控服务和云监控服务监控实例。ECS自带监控服务提供vCPU使用率、网络流量和磁盘I/O监控。云监控提供更加精细化的监控粒度。以下是对部分监控信息的说明:
  • vCPU:阿里云提供实例vCPU使用率监控数据,单位为百分比。百分比数值越高,实例vCPU负载越高。您可以通过ECS管理控制台、云监控管理控制台、调用ECS API或者远程连接实例后查询监控数据。以下是远程连接实例后查看vCPU使用率的方式:
    • Windows实例:在任务管理器中查看vCPU使用情况,您可以按vCPU使用率排序,定位占用实例vCPU资源的进程。
    • Linux实例:运行top命令查看vCPU使用情况。在键盘上按下Shift+P根据vCPU使用率排序,定位占用实例vCPU资源的进程。
    说明 如果CPU持续保持高使用率,则会对系统稳定性和业务运行造成影响。您可以参见以下方法进行优化:
  • 网络流量:阿里云提供实例出方向和入方向的网络流量监控数据,单位为kbps。ECS自带监控服务一般提供公网流量监控,云监控可以获取公网和内网流量监控。例如,您的公网出网带宽为1 Mbps,当出网流量达到1024 kbps,表示您的公网带宽已经满负荷。
    说明 经典网络公网带宽监控数据不包含高防回源流量,如需查看完整监控数据,请登录云监控管理控制台

ECS自带监控服务

在ECS管理控制台上查看监控信息的步骤如下所示。

  1. 登录ECS管理控制台
  2. 在左侧导航栏,选择实例与镜像 > 实例
  3. 在顶部菜单栏左上角处,选择地域。
  4. 找到目标实例,单击实例ID。
  5. 实例详情页,单击监控页签。
  6. 设置监控时间范围,看到vCPU使用率等监控信息。
    实例监控
    说明 由于显示的聚合方式不一样,选择时间段的长短会影响显示的精度。选择时间范围越小,显示效果越精细。例如,1小时和6小时的平均值会显示不一样的结果。

您也可以使用DescribeInstanceMonitorDataDescribeDiskMonitorDataDescribeEniMonitorData接口获取监控数据。

以下为ECS自带监控项的详细列表,指标采集粒度为1分钟。
监控项名称 监控项含义 单位
CPU使用率 CPU使用率 %
经典网络公网流入带宽 公网入流量平均速率 bit/s
内网流入带宽 私网入流量平均速率 bit/s
经典网络公网流出带宽 公网出流量平均速率 bit/s
内网流出带宽 私网出流量平均速率 bit/s
所有磁盘读取BPS 系统磁盘每秒读取字节总数 Byte/s
所有磁盘写入BPS 系统磁盘每秒写入字节总数 Byte/s
所有磁盘每秒读取次数 所有磁盘读IOPS 个/秒
所有磁盘每秒写入次数 所有磁盘写IOPS 个/秒
IP维度公网流入带宽 公网流入带宽 bit/s
IP维度公网流出带宽 公网流出带宽 bit/s
IP维度公网流出带宽使用率 公网流出带宽使用率 bit/s
经典网络公网流入流量 公网流入流量 Byte
经典网络公网流出流量 公网流出流量 Byte
内网流入带宽 内网流入流量 Byte

云监控

云监控为您提供开箱即用的企业级开放型一站式监控解决方案。云监控为您的ECS提供主机监控服务:
  • 云监控中的主机监控介绍,请参见概览
  • 云监控中的主机监控项和监控指标,请参见监控项说明

在云监控管理控制台上获取ECS实例监控数据的操作步骤如下所示。

  1. 登录云监控管理控制台
  2. 在左侧导航栏中,单击主机监控
  3. 找到目标实例。
  4. 可选:如果实例未安装云监控插件,单击安装/更新Agent更新插件。
  5. 单击监控图标图标,获取监控数据。
    说明 监控数据保留最大天数为30天。
  6. 单击报警规则设置报警规则。
设置报警规则