云监控会自动获取您当前阿里云账号下的云产品资源,您可以在云监控控制台查看ECI实例的监控图表,了解ECI实例运行状况,也可以设置报警规则,以便及时得知异常监控数据,并进行处理。
监控指标说明
云监控(CloudMonitor)是一项针对阿里云资源和互联网应用进行监控的服务。对于ECI实例,云监控支持以下监控指标:
类别  | 指标  | 说明  | 
实例  | instance_cpu_utilization  | CPU利用率  | 
instance_memory_utilization  | 内存利用率  | |
GPU  | gpu_memory_used  | GPU显存使用量  | 
gpu_memory_utilization  | GPU显存利用率  | |
gpu_utilization  | GPU利用率  | |
Volume  | volume_space_total  | 存储空间的总容量  | 
volume_space_used  | 存储空间的已使用容量  | |
volume_space_utilization  | 存储空间的利用率  | |
volume_inode_total  | Inode可用容量  | |
volume_inode_used  | Inode使用量  | |
volume_inode_utilization  | Inode利用率  | 
Volume类别的指标仅支持临时存储空间和挂载的云盘数据卷,不支持其他类型的数据卷。
Linux的Inode节点中记录了文件的类型、大小、权限、所有者、文件连接的数目、创建时间与更新时间等重要信息,以及指向数据块的指针信息。Inode利用率达到100%会造成无法继续新建目录或者文件。
更多信息,请参见ECI监控指标。
查看监控数据
您可以在云监控控制台查看ECI实例的运行状态和各个指标的监控数据。
在页面上方,选择地域。
在实例列表中,单击要查看监控数据的ECI实例。
选择想要查看的监控指标类别。
默认分组:CPU和内存指标。
GPU:GPU相关指标。
仅指定GPU实例规格(例如gn7等规格族)创建的ECI GPU实例,可以查看GPU的指标数据。
选择该类别后,可进一步选择查看某一GPU的数据。
Volume:存储相关指标。
该类别指标仅支持临时存储空间和挂载的云盘数据卷,不支持其他类型的数据卷。
择该类别后,可进一步选择查看临时存储空间(EphemeralVolume)或者某个数据卷的数据。
根据需要选择或自定义设置时间段,查看监控数据。
说明一次最多可查看连续30天的监控数据。
默认分组

GPU

Volume

后续操作
您可以针对ECI实例的一个或多个监控指标设置报警规则(例如CPU利用率高于80%),当监控数据符合报警规则时,云监控会自动发送报警通知,便于您及时了解资源运行状态,处理异常情况。
教程示例:通过云监控及时获取存储空间不足的实例信息。