文档

使用云监控对ECI实例进行监控

更新时间:

云监控会自动获取您当前阿里云账号下的云产品资源,您可以在云监控控制台查看ECI实例的监控图表,了解ECI实例运行状况,也可以设置报警规则,以便及时得知异常监控数据,并进行处理。

监控指标说明

云监控(CloudMonitor)是一项针对阿里云资源和互联网应用进行监控的服务。对于ECI实例,云监控支持以下监控指标:

类别

指标

说明

实例

instance_cpu_utilization

CPU利用率

instance_memory_utilization

内存利用率

GPU

gpu_memory_used

GPU显存使用量

gpu_memory_utilization

GPU显存利用率

gpu_utilization

GPU利用率

Volume

volume_space_total

存储空间的总容量

volume_space_used

存储空间的已使用容量

volume_space_utilization

存储空间的利用率

volume_inode_total

Inode可用容量

volume_inode_used

Inode使用量

volume_inode_utilization

Inode利用率

重要
  • Volume类别的指标仅支持临时存储空间和挂载的云盘数据卷,不支持其他类型的数据卷。

  • Linux的Inode节点中记录了文件的类型、大小、权限、所有者、文件连接的数目、创建时间与更新时间等重要信息,以及指向数据块的指针信息。Inode利用率达到100%会造成无法继续新建目录或者文件。

更多信息,请参见ECI监控指标

查看监控数据

您可以在云监控控制台查看ECI实例的运行状态和各个指标的监控数据。

  1. 登录云监控控制台

  2. 在左侧导航栏,单击云资源监控 > 云产品监控

  3. 云产品监控页面,选择弹性容器实例ECI

  4. 在页面上方,选择地域。

  5. 在实例列表中,单击要查看监控数据的ECI实例。

  6. 选择想要查看的监控指标类别。

    • 默认分组:CPU和内存指标。

    • GPU:GPU相关指标。

      仅指定GPU实例规格(例如gn7等规格族)创建的ECI GPU实例,可以查看GPU的指标数据。

      选择该类别后,可进一步选择查看某一GPU的数据。

    • Volume:存储相关指标。

      该类别指标仅支持临时存储空间和挂载的云盘数据卷,不支持其他类型的数据卷。

      择该类别后,可进一步选择查看临时存储空间(EphemeralVolume)或者某个数据卷的数据。

  7. 根据需要选择或自定义设置时间段,查看监控数据。

    说明

    一次最多可查看连续30天的监控数据。

    默认分组

    云监控-默认-无页签.png

    GPU

    GPU指标.png

    Volume

    云监控-volume.png

后续操作

您可以针对ECI实例的一个或多个监控指标设置报警规则(例如CPU利用率高于80%),当监控数据符合报警规则时,云监控会自动发送报警通知,便于您及时了解资源运行状态,处理异常情况。

教程示例:通过云监控及时获取存储空间不足的实例信息