本文为您介绍如何通过云监控控制台和API查询GPU监控数据。

前提条件

  • 请确保您已在云服务器ECS上创建GPU计算型实例,且已安装GPU驱动。具体操作,请参见创建配备NVIDIA GPU的实例
  • 请确保您已在云服务器ECS上安装云监控插件。具体操作,请参见安装和卸载插件
  • 请确保您已添加监控图表,且包含GPU的监控项。具体操作,请参见添加监控图表

GPU监控项说明

您可以从GPU、实例和应用分组维度查看GPU相关监控项。GPU的监控项如下表所示。
监控项 单位 MetricName Dimensions
(Agent)GPU维度解码器使用率 % gpu_decoder_utilization userId、instanceId、gpuId
(Agent)GPU维度编码器使用率 % gpu_encoder_utilization userId、instanceId、gpuId
(Agent)GPU维度GPU温度 gpu_gpu_temperature userId、instanceId、gpuId
(Agent)GPU维度GPU使用率 % gpu_memory_userdutilization userId、instanceId、gpuId
(Agent)GPU维度显存空闲量 Byte gpu_memory_freespace userId、instanceId、gpuId
(Agent)GPU维度显存空闲率 % gpu_memory_freeutilization userId、instanceId、gpuId
(Agent)GPU维度显存使用量 Byte gpu_memory_userdspace userId、instanceId、gpuId
(Agent)GPU维度显存使用率 % gpu_memory_usedutilization userId、instanceId、gpuId
(Agent)GPU维度GPU功率 W gpu_power_readings_power_draw userId、instanceId、gpuId

通过云监控控制台查看GPU的监控数据

  1. 登录云监控控制台
  2. 在左侧导航栏,单击主机监控
  3. 主机监控实例列表页签,单击目标主机的实例名称链接,或单击目标主机对应操作列的监控图表
  4. 实例详情页面,单击GPU监控页签。
    GPU监控页签,查看GPU相关监控图表。

通过API查看GPU的监控数据

通过DescribeMetricList接口查询GPU监控数据。更多信息,DescribeMetricList
说明 Namespace取值为acs_ecs_dashboardMetricNameDimensions的取值,请参见GPU监控项说明