更换GPU实例的操作系统时如何取消自动安装Tesla驱动功能

创建GPU实例时,选择镜像后并同时选择了安装GPU驱动选项,则创建实例后会自动安装GPU(Tesla)驱动。如果因某种原因(例如当前使用的操作系统不能满足业务需求),您需要更换该GPU实例的操作系统,则同时也需要取消自动安装Tesla驱动功能,单独手动安装适配新操作系统的Tesla驱动,确保正常使用GPU实例的高性能特性。

操作步骤

  1. 远程连接GPU实例。

    具体操作,请参见通过密码或密钥认证登录Linux实例

  2. 执行nvidia-smi命令,查看Tesla驱动版本。

    驱动版本.jpg

  3. 停止GPU实例。

    停机GPU实例时,建议您选择停止模式普通停机模式,避免更换实例的操作系统时启动失败。具体操作,请参见停止实例

  4. 在实例列表中,找到已停止的GPU实例,在对应操作列,选择icon1 > 实例设置 > 设置用户数据

  5. 用户数据区域,删除用户数据内容并单击确定

  6. 更换GPU实例的操作系统。

    更换操作系统的本质是更换系统盘,您可以通过更换实例的镜像来更换操作系统。具体操作,请参见更换操作系统(系统盘)

  7. 在实例列表中,单击已更换操作系统的实例ID,在实例详情页签下确认实例的操作系统和镜像信息已更换。

    验证更换.jpg

  8. 重新远程连接GPU实例,并执行nvidia-smi命令,确认已取消自动安装Tesla驱动功能。

    Dingtalk_20240807181010.jpg

后续步骤

GPU实例更换操作系统并取消自动安装Tesla驱动功能后,您需要根据实际业务场景手动安装与该GPU实例相匹配的驱动,才能正常使用GPU实例的高性能特性。具体操作,请参见在GPU计算型实例中手动安装Tesla驱动(Linux)