GPU实例在运行过程中可能会存在潜在的故障隐患或者安全风险,例如显卡故障、驱动程序错误等问题,ECS管理控制台支持配置GPU设备健康检查功能,方便您自行诊断当前实例的GPU卡或驱动是否存在异常,及时发现并解决潜在问题。
操作步骤
说明
操作前,请确认GPU实例处于运行中状态。
进入ECS控制台-自助问题排查,在页面左侧顶部,选择目标GPU实例所在地域。
单击下的发起诊断。
在创建诊断任务页面选择需要诊断的GPU实例和时间范围。单击发起诊断。
诊断完成后,查看诊断报告,根据指引完成修复操作。

该文章对您有帮助吗?