通过控制台自助排查功能诊断GPU

GPU实例在运行过程中可能会存在潜在的故障隐患或者安全风险,例如显卡故障、驱动程序错误等问题,ECS管理控制台支持配置GPU设备健康检查功能,方便您自行诊断当前实例的GPU卡或驱动是否存在异常,及时发现并解决潜在问题。

操作步骤

说明

操作前,请确认GPU实例处于运行中状态。

  1. 进入ECS控制台-自助问题排查,在页面左侧顶部,选择目标GPU实例所在地域。

  2. 单击常见问题场景 > GPU 设备检测下的发起诊断

  3. 创建诊断任务页面选择需要诊断的GPU实例和时间范围。单击发起诊断

  4. 诊断完成后,查看诊断报告,根据指引完成修复操作。

    image