如果您仅需要购买未配备驱动的普通GPU实例,可以参考本文操作指导创建GPU实例,但为了不影响您的使用,请务必在创建完成后手动安装相关驱动。

背景信息

本文适用于以下场景:
  • 已经通过NVIDIA官网或其他渠道获取了GRID License及驱动。
  • 想要通过阿里云购买未配备驱动的GPU实例,再前往NVIDIA购买GPU驱动并手动安装。

不同场景适用的驱动类型和安装方式有所不同,更多信息,请参见NVIDIA驱动安装指引

准备工作

  1. 注册阿里云账号,并完善账号信息。
    • 完成实名认证。具体操作,请参见阿里云账号注册流程
    • 开通按量付费ECS资源时,您的阿里云账户余额(即现金余额)和代金券的总值不得小于100.00元人民币。具体充值操作,请参见如何充值
  2. 前往实例创建页

操作流程

步骤1:完成基础配置

基础配置包括购买实例的基础需求(付费模式、地域可用区)以及一台实例所需的基础资源(实例规格、镜像、存储)。完成基础设置后,单击下一步:网络和安全组设置

  1. 选择付费模式。
    付费模式影响实例的计费和收费规则,不同付费模式的实例遵循的资源状态变化规则也存在差异。
    付费模式 说明 相关文档
    包年包月 先付费后使用,最短可以按周购买 包年包月
    按量付费 先使用后付费,计费周期精确到秒,方便您按需购买和释放资源。
    说明 推荐搭配使用节省计划优化成本。
    抢占式实例 先使用后付费,相对于按量付费实例价格有一定的折扣,但可能因市场价格变化或实例规格库存不足而自动释放实例。 抢占式实例
  2. 选择地域及可用区。
    选择距离近的地域可以降低网络时延,实例创建完成后不支持更改地域和可用区。更多信息,请参见地域和可用区
  3. 选择实例规格并进行相关配置。
    1. 定位到异构计算GPU/FPGA/NPU架构下的GPU计算型或者GPU虚拟化型,然后选择实例规格。
      说明
      • 可选的实例规格和地域等因素有关,您可以前往ECS实例可购买地域查看实例的可购情况。
      • 如果您有特定的配置需求,例如需要挂载多张弹性网卡、使用ESSD云盘、使用本地盘等,请确认实例规格是否支持。关于实例规格的特点、适用场景、指标数据等信息,请参见实例规格族
      • 如果您需要针对特定场景购买实例,可以查看场景化选型页签中的推荐信息,例如适用于AI机器学习等场景的GPU实例规格。
    2. 当前选择实例后确认所选实例规格信息。
      如果您需要体验阿里云推出的集群极速部署工具FastGPU,帮助您将人工智能计算任务一键部署在阿里云的IaaS资源上,可以单击FastGPU极速创建GPU集群>,前往阿里云开发者实验室,通过三个训练场景中的应用实验进行学习与体验。FastGPU的更多信息,请参见什么是集群极速部署工具FastGPU
    3. 如果选择付费模式抢占式实例,配置使用时长和上限价格。
      使用时长指抢占式实例的保护期,超出保护期后可能因市场价格变化或实例规格库存不足而自动释放实例。使用时长选项说明如下表所示。
      抢占式实例使用时长 说明
      设定使用实例1小时 抢占式实例创建后有1小时保护期,在保护期内不会被自动释放。
      无确定使用时长 抢占式实例创建后没有保护期,但比有保护期的抢占式实例更优惠。
      上限价格选项说明如下表所示。
      单台实例规格上限价 说明
      使用自动出价 始终使用实例规格的实时市场价格,该市场价格不会超过对应按量付费实例的价格。使用自动出价可以避免抢占式实例因实时市场价格超过上限被自动释放,但不能避免因实例规格的库存不足被自动释放。
      设置单台上限价 自行输入明确的价格上限,实例规格的实时市场价格超出该上限或者库存不足时,抢占式实例都会被自动释放。
    4. 配置购买实例的数量。
      使用向导单次最多购买100台实例。此外,您持有的实例数量不能超过配额,具体配额以页面显示为准。更多信息,请参见查看和提升实例配额
  4. 选择镜像。
    镜像提供了运行实例所需的信息,阿里云提供多种镜像来源供您方便地获取镜像,如下表所示。
    镜像来源 说明 相关文档
    公共镜像 阿里云官方提供的基础镜像,均已获得正版授权,涵盖Windows Server系统镜像和主流的Linux系统镜像。 公共镜像概述
    自定义镜像 您自行创建或导入的镜像,包含了初始系统环境、应用环境、软件配置等信息,可以节省重复配置的时间。 自定义镜像概述
    共享镜像 其他阿里云账号共享的自定义镜像,方便跨账号使用同一镜像创建实例。 共享或取消共享镜像
    镜像市场 镜像市场中的镜像均经过严格审核,种类丰富,方便您一键部署用于建站、应用开发等场景的云服务器。 镜像市场
  5. 选择存储并进行相关配置。
    实例通过添加系统盘、数据盘和共享盘NAS获得存储能力,云服务器ECS提供了云盘和本地盘满足不同场景的需求。
    云盘可以用作系统盘和数据盘,包括ESSD云盘、SSD云盘、高效云盘等类型。更多信息,请参见云盘概述
    说明 随实例一起创建的云盘和实例的付费模式相同。
    本地盘只能用作数据盘,如果实例规格配备了本地盘(例如本地SSD型、大数据型等),页面中会显示本地盘的信息。更多信息,请参见本地盘
    说明 不支持自行为实例挂载本地盘。
    1. 选择系统盘。
      系统盘用于安装操作系统,默认容量为40 GiB,但实际可设置的最低容量和镜像类型有关,如下表所示。
      镜像 系统盘容量范围(GiB)
      Linux(不包括CoreOS和Red Hat) [max{20, 镜像文件大小}, 500]
      FreeBSD [max{30, 镜像文件大小}, 500]
      CoreOS [max{30, 镜像文件大小}, 500]
      Red Hat [max{40, 镜像文件大小}, 500]
      Windows [max{40, 镜像文件大小}, 500]
    2. 可选:选择数据盘。
      支持创建空云盘或者用快照创建云盘。快照是云盘在某一时间点数据状态的备份文件,用快照创建云盘便于快速导入数据。选择数据盘时,您还可以加密云盘满足数据安全或法规合规等场景的要求。关于数据加密的介绍,请参见加密概述
      说明 单台实例支持挂载的数据盘存在数量限制。更多信息,请参见块存储使用限制
    3. 可选:选择共享盘NAS。
      如果您有较多数据需要供多台实例共享访问,推荐使用NAS文件系统,可以节约大量拷贝与同步成本。

      选择已有的NAS文件系统,或者单击创建文件系统前往NAS文件系统控制台即时创建NAS文件系统。具体操作,请参见通过控制台创建通用型NAS文件系统。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看最新的NAS文件系统列表。关于挂载NAS文件系统时的注意事项,请参见新购ECS时挂载NAS文件系统

  6. 可选:配置快照服务。
    创建实例时即可为云盘开启自动备份,有效应对数据误删等风险。

    选择已有的自动快照策略,或者单击创建自动快照策略前往快照页面即时创建自动快照策略。具体操作,请参见创建自动快照策略。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看最新的自动快照策略列表。

步骤2:完成网络和安全组配置

网络和安全组配置提供了公网以及与其他阿里云资源通信的能力,并保障实例在网络中的安全。完成网络和安全组配置后,单击下一步:系统配置

  1. 选择网络及公网IP。
    配置项 说明 相关文档
    网络 选择专有网络

    专有网络是您在阿里云自己定义的一个隔离网络环境,您可以完全掌控自己的专有网络,例如选择IP地址范围、配置路由表和网关等。

    如果在创建实例时不需要自定义专有网络配置,您可以跳过本步骤,系统会自动创建默认专有网络和交换机。
    说明 仅当实例所属地域不存在已创建的自定义专有网络时,才支持跳过本步骤。
    选择已有的专有网络和交换机,或者单击前往控制台创建前往专有网络控制台即时创建专有网络和交换机。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看最新的专有网络和交换机列表。
    说明 如果您需要为实例分配IPv6地址,请选择已开通IPv6网段的专有网络和交换机。
    公网IP 如果您在基础配置页面中选择了Windows 2008 R2及以下版本的镜像,您必须在此处选中分配公网IPv4地址复选框,或者在创建实例后绑定弹性公网IP,以便通过其他协议连接实例,例如RDP(Windows自带的远程连接)、PCOIP、XenDesktop HDX 3D等。否则,在GPU驱动安装完成后,您将无法通过管理终端连接实例,连接实例时会始终显示黑屏或停留在启动界面。
    说明 RDP不支持DirectX、OpenGL等应用,您需要自行安装VNC服务和客户端。
    具体操作如下:
    1. 选中分配公网IPv4地址
    2. 选择带宽计费模式。
      • 按固定带宽:按您选择的带宽值计费,适用于对网络带宽有稳定要求的场景。
      • 按使用流量:按实际使用的流量计费,此时选择的带宽峰值用于防止突然爆发的流量产生较高费用。适用于对网络带宽要求变化大的场景,例如大部分时间流量较低,但间歇性出现流量高峰。
    3. 选择按固定带宽的带宽值或按使用流量的带宽峰值。
    什么是弹性公网IP
  2. 选择安全组。
    安全组是一种虚拟防火墙,用于控制安全组内实例的入流量和出流量。更多信息,请参见安全组概述

    如果在创建实例不需要自定义安全组配置,您可以跳过本步骤,系统会自动创建默认安全组。默认安全组入方向放行22端口、3389端口及ICMP协议,在创建完成后您可以修改安全组配置。

    1. 如果您需要创建一个新的安全组,单击新建安全组
      关于安全组各项配置的详细说明,请参见创建安全组
    2. 单击重新选择安全组
    3. 请选择安全组对话框,选择一个或多个安全组,然后单击选择
  3. 配置弹性网卡。
    弹性网卡分为主网卡和辅助网卡。主网卡不支持从实例解绑,只能随实例一起创建和释放。辅助网卡支持自由绑定至实例和从实例解绑,方便您在实例之间切换网络流量。如需随实例一起创建辅助网卡,请单击add-nic图标,然后选择辅助网卡所属的交换机。
    说明 创建实例时只能添加1块辅助网卡,您也可以在实例创建完成后单独创建辅助网卡并绑定至实例。关于各实例规格支持绑定的弹性网卡的数量,请参见实例规格族

(可选)步骤3:完成系统配置

系统配置包括登录凭证、主机名、实例自定义数据等,用于定制实例在控制台和操作系统内显示的信息或使用方式。完成系统配置后,单击下一步:分组设置

  1. 配置登录凭证。
    登录凭证用于安全地登录实例,关于实例连接方式的介绍,请参见连接方式概述
    登录凭证 说明
    密钥对 选择已有的密钥对,或者单击创建密钥对即时创建密钥对。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看最新的密钥对列表。具体操作,请参见创建SSH密钥对
    说明 仅Linux实例支持使用密钥对登录。
    自定义密码 输入并确认密码。使用用户名和密码登录实例时,Linux实例默认用户名为root,Windows实例默认用户名为administrator
    创建后设置 在实例创建完成后,自行绑定密钥对或者重置实例密码。具体操作,请参见绑定SSH密钥对重置实例登录密码
  2. 配置控制台中显示的实例名称和操作系统内部显示的主机名称。
    创建多台实例时,设置有序的实例名称和主机名称便于从名称了解实例的批次等信息。关于设置有序名称的规则,请参见批量设置有序的实例名称或主机名称
  3. 配置高级选项。
    1. 选择实例RAM角色。
      实例通过实例RAM角色获得该角色拥有的权限,可以基于临时安全令牌STS(Security Token Service)访问指定云服务的API和操作指定的云资源,安全性更高。

      选择已有的实例RAM角色,或者单击创建实例RAM角色前往RAM控制台即时创建实例RAM角色。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看最新的实例RAM角色列表。具体操作,请参见创建实例RAM角色并为角色授予权限

    2. 选择实例元数据访问模式。
      实例元数据(metadata)包含了实例在阿里云系统中的信息,您可以在运行中的实例内方便地查看实例元数据,并基于实例元数据配置或管理实例。关于如何通过普通模式和加固模式查看实例元数据,请参见查看实例元数据
      实例元数据访问模式 说明
      普通模式(兼容加固模式) 实例创建完成后,支持通过普通模式或者加固模式查看实例元数据。
      仅加固模式 实例创建完成后,仅支持通过加固模式查看实例元数据。
      警告 选择仅加固模式会导致cloud-init组件初始化配置失败,影响实例的元数据、自定义数据等配置,请慎重选择。
    3. 配置实例自定义数据。
      实例自定义数据可以作为实例自定义脚本在启动实例时执行,实现自动化配置实例,或者仅作为普通数据传入实例。更多信息,请参见使用实例自定义数据(Linux实例)使用实例自定义数据(Windows实例)

      在输入框输入您准备的实例自定义数据。如果实例自定义数据已进行Base64编码,请选中输入已采用Base64编码

(可选)步骤4:完成分组设置

分组设置提供标签、资源组等批量管理实例的方式。完成分组设置后,单击下一步:确认订单

  1. 配置标签。
    标签由一对键值(Key-Value)组成。使用标签标识具有相同特征的资源后,例如所属组织或用途相同的资源,您可以基于标签方便地检索和管理资源。更多信息,请参见标签概述

    选择已有的标签,或者填写标签键和标签值即时创建标签。

  2. 选择资源组。
    资源组供您从业务角度管理跨地域、跨产品的资源,并支持针对资源组管理权限。更多信息,请参见资源组

    选择已有的资源组,或者单击去创建前往资源管理控制台即时创建资源组。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看最新的资源组列表。具体操作,请参见创建资源组

  3. 选择部署集。
    部署集支持高可用策略,部署集内实例会严格分散在不同的物理服务器上,保证业务的高可用性和底层容灾能力。

    选择已有的部署集,或者单击管理部署集即时创建部署集。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看最新的部署集列表。具体操作,请参见创建部署集

  4. 选择专有宿主机。
    专有宿主机是一台由单租户独享物理资源的云主机,具有满足严格的安全合规要求、允许自带许可证(BYOL)上云等优势。

    选择已有的专有宿主机,或者单击创建专有宿主机即时创建专有宿主机。创建完成后,返回ECS实例创建向导并单击refresh按钮,查看最新的专有宿主机列表。具体操作,请参见创建DDH

  5. 选择私有池。
    创建弹性保障或容量预定后,系统会自动生成私有池,预留特定属性特定数量的实例。从关联的私有池中创建这一类实例,可以提供资源确定性保障。更多信息,请参见资源保障概述
    说明 弹性保障和容量预定仅支持为按量付费实例保障资源供应确定性。
    私有池容量 说明
    开放 优先使用开放类型私有池的容量,如果开放类型私有池无可用容量,则尝试使用公共池的容量。
    不使用 不使用任何私有池的容量。
    指定 继续指定一个专用或开放类型私有池的ID,使用其容量创建实例。如果该私有池没有可用容量,则创建失败。

步骤5:确认订单

在最终创建实例前,请检查实例的整体配置并配置使用时长等选项,确保各项配置符合您的要求。

  1. 检查所选配置。
    如需修改配置,单击edit图标前往对应页面。您可以基于所选配置生成模板,方便后续快捷创建配置类似的实例,如下表所示。
    快捷操作 说明 相关文档
    保存为启动模板 将所选配置保存为启动模板,使用启动模板创建实例可以免去重复配置的操作。 使用实例启动模板创建实例
    生成Open API最佳实践脚本 自动生成API工作流和SDK示例供您参考。
    保存当前购买配置为ROS模板 将所选配置保存为ROS模板,方便继续使用ROS模板创建资源栈,实现一键交付资源。 创建资源栈
  2. 配置实例的使用时长。
    • 按量付费实例:设置自动释放实例的时间。您也可以在创建实例后手动释放实例,或者配置自动释放。具体操作,请参见释放实例
    • 包年包月实例:选择购买时长以及是否启用自动续费。您也可以在创建实例后手动续费实例,或者配置自动续费。具体操作,请参见续费概述
  3. 阅读云服务器ECS服务条款,如无疑问,选中《云服务器ECS服务条款》
  4. 在页面底部查看实例的总费用,如无疑问,确认创建实例并按提示完成支付。