首页 GPU 云服务器 操作指南 创建GPU实例 创建未配备驱动的GPU实例

创建未配备驱动的GPU实例

更新时间: 2023-08-15 10:24:48

如果您仅需要购买未配备驱动的普通GPU实例,可以参考本文操作指导创建GPU实例,但为了不影响您的使用,请务必在创建完成后手动安装相关驱动。

背景信息

本文适用于以下场景:

  • 已经通过NVIDIA官网或其他渠道获取了GRID License及驱动。

  • 想要通过阿里云购买未配备驱动的GPU实例,再前往NVIDIA购买GPU驱动并手动安装。

不同场景适用的驱动类型和安装方式有所不同,更多信息,请参见NVIDIA驱动安装指引

准备工作

  • 注册阿里云账号并完成实名认证。具体操作,请参见阿里云账号注册流程

  • 开通按量付费ECS资源时,您的阿里云账户余额(即现金余额)和代金券的总值不得小于100.00元人民币。具体充值操作,请参见如何充值

操作步骤

步骤1:完成基础配置

基础配置包括购买实例的基础需求,即付费类型、地域、网络及可用区。

  1. 前往实例创建页

  2. 选择自定义购买页签。

  3. 选择付费类型。

    付费模式影响实例的计费和收费规则,不同付费模式的实例遵循的资源状态变化规则也存在差异。

    付费类型

    说明

    相关文档

    包年包月

    先付费后使用,最短可以按周购买

    包年包月

    按量付费

    先使用后付费,计费周期精确到秒,方便您按需购买和释放资源。

    说明

    推荐搭配使用节省计划优化成本。

    抢占式实例

    先使用后付费,相对于按量付费实例价格有一定的折扣,但可能因市场价格变化或实例规格库存不足而自动释放实例。

    抢占式实例

  4. 选择地域。

    地域指数据中心所在的地理区域,选择距离近的地域可以降低网络时延,实例创建完成后不支持更改地域。更多信息,请参见地域和可用区

  5. 选择网络和可用区。

    推荐您使用专有网络,专有网络之间逻辑上彻底隔离,安全性更高,且支持弹性公网IP(EIP)、弹性网卡、IPv6等功能。

    可用区是指在同一地域内,电力和网络互相独立的物理区域。同一可用区内实例之间的网络延时更小,其用户访问速度更快。

    网络类型

    说明

    相关文档

    专有网络

    专有网络是您在阿里云自己定义的一个隔离网络环境,您可以完全掌控自己的专有网络,例如选择IP地址范围、配置路由表和网关等。

    如果在创建实例时不需要自定义专有网络配置,您可以跳过本步骤,系统会自动创建默认专有网络和交换机。

    选择已有的专有网络和交换机,或者单击创建专有网络创建交换机前往专有网络控制台即时创建专有网络和交换机。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看专有网络和交换机列表。

    说明

    如果您需要为实例分配IPv6地址,请选择已开通IPv6网段的专有网络和交换机。

    经典网络

    经典网络类型的实例统一部署在阿里云公共基础设施内,规划和管理由阿里云负责。

    说明

    如果您是在2017年6月14日17:00(UTC+8)以后第一次购买ECS实例,不能再选择经典网络。

    网络类型

步骤2:完成实例和镜像配置

  1. 选择实例规格。

    可选的实例规格和地域等因素有关,您可以前往ECS实例可购买地域查看实例的可购情况。

    如果您有特定的配置需求,例如需要挂载多张弹性网卡、使用ESSD云盘、使用本地盘等,请确认实例规格是否支持。关于实例规格的特点、适用场景、指标数据等信息,请参见实例规格族

    如果选择付费类型抢占式实例,配置使用时长和上限价格。

    • 实例使用时长:使用时长指抢占式实例的保护期,超出保护期后可能因市场价格变化或实例规格库存不足而自动释放实例。

      实例使用时长

      说明

      设定实例使用1小时

      抢占式实例创建后有1小时保护期,在保护期内不会被自动释放。

      无确定使用时长

      抢占式实例创建后没有保护期,但比有保护期的抢占式实例更优惠。

    • 单台实例上限价格

      单台实例上限价格

      说明

      使用自动出价

      始终使用实例规格的实时市场价格,该市场价格不会超过对应按量付费实例的价格。使用自动出价可以避免抢占式实例因实时市场价格超过上限被自动释放,但不能避免因实例规格的库存不足被自动释放。

      设置单台上限价

      自行输入明确的价格上限,实例规格的实时市场价格超出该上限或者库存不足时,抢占式实例都会被自动释放。

    完成实例配置后,您可以在当前选择后确认所选实例规格信息。如果您需要体验阿里云推出的集群极速部署工具FastGPU,帮助您将人工智能计算任务一键部署在阿里云的IaaS资源上,可以单击了解更多>,FastGPU的更多信息,请参见什么是集群极速部署工具FastGPU

  2. 选择镜像。

    镜像提供了运行实例所需的信息,阿里云提供多种镜像来源供您方便地获取镜像,如下表所示。

    镜像来源

    说明

    公共镜像

    阿里云官方提供的基础镜像,均已获得正版授权,涵盖Windows Server系统镜像和主流的Linux系统镜像。

    自定义镜像

    您自行创建或导入的镜像,包含了初始系统环境、应用环境、软件配置等信息,可以节省重复配置的时间。

    共享自定义镜像

    其他阿里云账号共享的自定义镜像,方便跨账号使用同一镜像创建实例。

    云市场镜像

    云市场镜像中的镜像均经过严格审核,种类丰富,方便您一键部署用于建站、应用开发等场景的云服务器。

    社区镜像

    社区镜像是一种完全公开的镜像。您可以将制作好的自定义镜像发布为社区镜像供他人使用,也可以获取并使用他人发布的社区镜像。

    如果选择公共镜像或者云市场镜像中的镜像时,需注意以下事项:

    • 公共镜像页签下选择某操作系统镜像时,如果同时支持选择是否自动安装GPU驱动,请勿选中安装GPU驱动选项。

    • 云市场镜像页签下选择某操作系统镜像时,由于云市场镜像中存在部分已预装GPU驱动或GRID驱动的免费镜像(如下表所示),请勿选中该类免费镜像。

      实例规格

      已预装GPU驱动的镜像

      已预装GRID驱动的镜像

      GPU计算型实例(Windows)

      • Windows Server 2022中文版预装GRID 15.2 SWL驱动镜像

      • Windows Server 2019中文版预装GRID 15.2 SWL驱动镜像

      GPU虚拟型实例(Windows)

      • Windows Server 2022中文版预装GRID 13.5 SWL驱动镜像

      • Windows Server 2019中文版预装GRID 13.5 SWL驱动镜像

      GPU虚拟型实例(Linux)

      • Alibaba Cloud Linux 2.1903 LTS 64位预装GRID 13.5 SWL驱动镜像

      • Alibaba Cloud Linux 3.2104 LTS 64位预装GRID 13.5 SWL驱动镜像

      • CentOS 7.9 64位预装GRID 13.5 SWL驱动镜像

      • Ubuntu 18.04 64位预装GRID 13.5 SWL驱动镜像

      • Ubuntu 20.04 64位预装GRID 13.5 SWL驱动镜像

      • Ubuntu 22.04 64位预装GRID 13.5 SWL驱动镜像

      部分GPU计算型实例(Linux):gn7e、gn7i、gn6e、gn6v、gn6i、gn5、gn5i、ebmgn7i、ebmgn6e、ebmgn6v、ebmgn6i

      • Alibaba Cloud Linux 2 64位(预装NVIDIA GPU驱动)

      • Ubuntu 20.04 64位(预装NVIDIA GPU驱动)

      • CentOS 7.9 64位(预装NVIDIA GPU驱动)

步骤3:完成存储配置

实例通过添加系统盘、数据盘和共享盘NAS获得存储能力,云服务器ECS提供了云盘和本地盘满足不同场景的需求。

  • 云盘可以用作系统盘和数据盘,包括ESSD云盘、SSD云盘、高效云盘等类型。更多信息,请参见云盘概述

    说明

    随实例一起创建的云盘和实例的付费模式相同。

  • 本地盘只能用作数据盘,如果实例规格配备了本地盘(例如本地SSD型、大数据型等),页面中会显示本地盘的信息。更多信息,请参见本地盘

    说明

    不支持自行为实例挂载本地盘。

  1. 选择系统盘。

    系统盘用于安装操作系统,默认容量为40 GiB,但实际可设置的最低容量和镜像类型有关,如下表所示。

    镜像

    系统盘容量范围(GiB)

    Linux(不包括FreeBSD和Red Hat)

    [max{20, 镜像文件大小}, 2048]

    FreeBSD

    [max{30, 镜像文件大小}, 2048]

    Red Hat

    [max{40, 镜像文件大小}, 2048]

    Windows

    [max{40, 镜像文件大小}, 2048]

  2. 可选:选择数据盘。

    数据盘用于存储应用数据,选择数据盘时,您还可以加密云盘满足数据安全或法规合规等场景的要求。关于数据加密的介绍,请参见云盘加密概述

    说明

    单台实例支持挂载的数据盘存在数量限制。更多信息,请参见块存储使用限制

  3. 可选:配置快照服务。

    快照是云盘在某一时间点数据状态的备份文件,用快照创建云盘便于快速导入数据。创建实例时即可为云盘开启自动备份,有效应对数据误删等风险。

    选择已有的自动快照策略,或者单击创建自动快照策略前往快照页面即时创建自动快照策略。具体操作,请参见创建自动快照策略。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看自动快照策略列表。

    重要

    使用快照会产生费用,更多详情,请参见快照计费

  4. 可选:选择共享盘NAS。

    如果您有较多数据需要供多台实例共享访问,推荐使用NAS文件系统,可以节约大量拷贝与同步成本。

    选择已有的NAS文件系统,或者单击创建新NAS文件系统前往NAS文件系统控制台即时创建NAS文件系统。具体操作,请参见通过控制台创建通用型NAS文件系统。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看NAS文件系统列表。关于挂载NAS文件系统时的注意事项,请参见新购ECS时挂载NAS文件系统

步骤4:完成带宽和安全组配置

网络和安全组配置提供了公网以及与其他阿里云资源通信的能力,并保障实例在网络中的安全。

  1. 配置公网IP。

    如果实例需要进行公网通信,必须分配公网IP。您可以在创建实例时选择自动分配一个固定公网IP,或者在创建实例后自行配置,通过EIP、NAT网关等方式进行公网通信。EIP、NAT网关需要自行购买,更多信息,请参见什么是弹性公网 IP什么是NAT网关

    选中分配公网 IPv4 地址,设置带宽计费模式带宽值带宽峰值

    关于公网带宽计费的详细规则,请参见公网带宽计费

    带宽计费模式

    说明

    按固定带宽

    按您选择的带宽值计费,适用于对网络带宽有稳定要求的场景。

    按使用流量

    按实际使用的流量计费,此时选择的带宽峰值用于防止突然爆发的流量产生较高费用。适用于对网络带宽要求变化大的场景,例如大部分时间流量较低,但间歇性出现流量高峰。

  2. 配置安全组。

    安全组是一种虚拟防火墙,用于控制安全组内实例的入流量和出流量。更多信息,请参见安全组概述

    如果在创建实例不需要自定义安全组配置,您可以跳过本步骤,系统会自动创建默认安全组。默认安全组入方向放行22端口、3389端口及ICMP协议,在创建完成后您可以修改安全组配置。

    如果您需要创建一个新的安全组,单击新建安全组,配置安全组名称安全组类型开通IPv4端口

    说明

    关于安全组各项配置的详细说明,请参见创建安全组

  3. 可选:配置弹性网卡。

    弹性网卡分为主网卡和辅助网卡。主网卡不支持从实例解绑,只能随实例一起创建和释放。辅助网卡支持自由绑定至实例和从实例解绑,方便您在实例之间切换网络流量。如需随实例一起创建辅助网卡,请单击add-nic图标,然后选择辅助网卡所属的交换机。

    说明

    创建实例时只能添加1块辅助网卡,您也可以在实例创建完成后单独创建辅助网卡并绑定至实例。关于各实例规格支持绑定的弹性网卡的数量,请参见实例规格族

  4. 可选:配置IPv6。

    开通了IPv6后,IPv6的地址数量不仅能解决网络地址资源数量的问题,而且也解决了多种接入设备连入互联网的障碍。

    选中免费分配 IPv6 地址。分配IPv6地址后,您需要登录实例并在操作系统内部进行IPv6地址相关的配置,才能正常使用IPv6地址。具体操作,请参见Windows实例配置IPv6地址Linux实例配置IPv6地址

步骤5:完成管理设置

管理设置包括登录凭证和标签,用于远程连接实例和方便地检索和管理资源。

  1. 配置登录凭证。

    登录凭证用于安全地登录实例,关于实例连接方式的介绍,请参见连接方式概述

    登录凭证

    说明

    密钥对

    说明

    仅Linux实例支持使用密钥对登录认证。

    选择登录实例的用户名和已有的密钥对,或者单击创建密钥对即时创建密钥对。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看密钥对列表。具体操作,请参见创建SSH密钥对

    用户名支持设置为rootecs-user

    警告

    root具有操作系统的最高权限,使用root作为用户名可能会导致安全风险,建议您使用普通用户ecs-user作为用户名。

    使用镜像预设密码

    说明

    自定义镜像共享镜像支持此认证方式。

    可以直接使用所选镜像的预设密码进行登录认证。为了保证您的正常使用,请确保所选镜像中已经设置了密码。

    自定义密码

    输入并确认密码。使用登录名和密码登录实例时,用户名信息如下:

    • Linux实例:支持设置为rootecs-user

      警告

      root具有操作系统的最高权限,使用root作为用户名可能会导致安全风险,建议您使用普通用户ecs-user作为用户名。

    • Windows实例:默认为administrator

    创建后设置

    在实例创建完成后,自行绑定密钥对或者重置实例密码。具体操作,请参见绑定SSH密钥对重置实例登录密码

  2. 配置标签。

    标签由一对键值(Key-Value)组成。使用标签标识具有相同特征的资源后,例如所属组织或用途相同的资源,您可以基于标签方便地检索和管理资源。更多信息,请参见标签概述

    选择已有的标签,或者填写标签键和标签值即时创建标签。

步骤六:(可选)完成高级选项配置

高级选项包括主机名、实例元数据、实例自定义数据等,用于定制实例在控制台和操作系统内显示的信息或使用方式。

参数

说明

实例名称描述主机名有序后缀

创建多台实例时,设置有序的实例名称和主机名称便于从名称了解实例的批次等信息。关于设置有序名称的规则,请参见批量设置有序的实例名称或主机名称

实例RAM角色

实例通过实例RAM角色获得该角色拥有的权限,可以基于临时安全令牌STS(Security Token Service)访问指定云服务的API和操作指定的云资源,安全性更高。

选择已有的实例RAM角色,或者单击创建实例RAM角色前往RAM控制台即时创建实例RAM角色。创建完成后,返回ECS实例创建向导并单击refresh图标,查看实例RAM角色列表。具体操作,请参见创建实例RAM角色并为角色授予权限

元数据访问模式

实例元数据(metadata)包含了实例在阿里云系统中的信息,您可以在运行中的实例内方便地查看实例元数据,并基于实例元数据配置或管理实例。关于如何查看实例元数据,请参见查看实例元数据

自定义数据

实例自定义数据可以作为实例自定义脚本在启动实例时执行,实现自动化配置实例,或者仅作为普通数据传入实例。更多信息,请参见使用实例自定义数据(Linux实例)使用实例自定义数据(Windows实例)

在输入框输入您准备的实例自定义数据。如果实例自定义数据已进行Base64编码,请选中输入已采用 Base64 编码

资源组

资源组供您从业务角度管理跨地域、跨产品的资源,并支持针对资源组管理权限。更多信息,请参见资源组

选择已有的资源组,或者单击创建资源组前往资源管理控制台即时创建资源组。创建完成后,返回ECS实例创建向导并单击refresh图标,查看资源组列表。具体操作,请参见创建资源组

部署集

部署集支持高可用策略,部署集内实例会严格分散在不同的物理服务器上,保证业务的高可用性和底层容灾能力。

选择已有的部署集,或者单击管理部署集即时创建部署集。创建完成后,返回ECS实例创建向导并单击refresh图标,查看部署集列表。具体操作,请参见创建部署集

专有宿主机

专有宿主机是一台由单租户独享物理资源的云主机,具有满足严格的安全合规要求、允许自带许可证(BYOL)上云等优势。

选择已有的专有宿主机,或者单击创建专有宿主机即时创建专有宿主机。创建完成后,返回ECS实例创建向导并单击refresh图标,查看专有宿主机列表。具体操作,请参见创建DDH

私有池类型

创建弹性保障或容量预定后,系统会自动生成私有池,预留特定属性特定数量的实例。从关联的私有池中创建这一类实例,可以提供资源确定性保障。更多信息,请参见资源管家概述

说明

弹性保障和容量预定仅支持为按量付费实例保障资源供应确定性。

  • 开放:优先使用开放类型私有池的容量,如果开放类型私有池无可用容量,则尝试使用公共池的容量。

  • 不使用:不使用任何私有池的容量。

  • 指定:继续指定一个专用或开放类型私有池的ID,使用其容量创建实例。如果该私有池没有可用容量,则创建失败。

步骤7:确认订单

在最终创建实例前,请检查实例的整体配置并配置使用时长等选项,确保各项配置符合您的要求。

  1. 检查所选配置。

    如需修改配置,单击对应配置项进入相应页面进行修改。

  2. 配置实例的使用时长。

    • 按量付费实例或抢占式实例:设置自动释放实例的时间。您也可以在创建实例后手动释放实例,或者配置自动释放。具体操作,请参见释放实例

    • 包年包月实例:选择购买时长以及是否启用自动续费。您也可以在创建实例后手动续费实例,或者配置自动续费。具体操作,请参见续费概述

  3. 选择对应的服务协议。

    • 如果您购买的是按量付费实例或抢占式实例,请阅读《云服务器ECS服务条款》,如无疑问,选中《云服务器ECS服务条款》

    • 如果您购买的是包年包月实例,请阅读《云服务器ECS服务条款》《镜像商品使用条款》《云服务器ECS退订说明》,如无疑问,选中《云服务器ECS服务条款》|《镜像商品使用条款》|《云服务器ECS退订说明》

  4. 单击确定下单

  5. 在支付页面,查看实例的总费用,如无疑问按照提示完成支付。

相关文档

阿里云首页 GPU 云服务器 相关技术圈