本章节介绍云服务器ECS GPU计算型实例规格族的特点,并列出了具体的实例规格。

GPU计算型实例规格族gn7s

gn7s的特点如下:
  • 采用全新的Intel Icelake处理器,同时搭载Nvidia Ampere架构的NVIDIA A30 GPU计算卡,您可以根据需要选择不同计算卡数和不同CPU资源的规格,灵活适应不同的AI业务需求。
  • 基于阿里云全新的第三代神龙架构,VPC和云盘网络带宽相比上一代平均提升一倍。
  • 计算:
    • 采用NVIDIA A30 GPU计算卡
      • 创新的Nvidia Ampere架构
      • 支持MIG(Multi-Instance GPU)功能、加速功能(基于第二代Tensor core加速),提供全能型业务支撑。
    • 处理器:2.9 GHz主频的Intel ® Xeon ® 可扩展处理器(Ice Lake),全核睿频3.5 GHz
    • 容量内存相比上一代实例规格族大幅提升
  • 存储:仅支持ESSD云盘
    说明 更多云盘性能信息,请参见块存储性能
  • 网络:
    • 支持IPv6
    • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:配备高性能CPU、内存、GPU,可以处理更多并发AI推理业务需求,适用于图像识别、语音识别、行为识别业务。
gn7s包括的实例规格及指标数据如下表所示:
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 单网卡支持的IPv6地址数 多队列 弹性网卡
ecs.gn7s-c8g1.2xlarge 8 60 NVIDIA A30 * 1 24GB * 1 16 600万 1 12 8
ecs.gn7s-c16g1.4xlarge 16 120 NVIDIA A30 * 1 24GB * 1 16 600万 1 12 8
ecs.gn7s-c32g1.8xlarge 32 250 NVIDIA A30 * 1 24GB * 1 16 600万 1 12 8
ecs.gn7s-c32g1.16xlarge 64 500 NVIDIA A30 * 2 24GB * 2 32 1200万 1 16 15
ecs.gn7s-c32g1.32xlarge 128 1000 NVIDIA A30 * 4 24GB * 4 64 2400万 1 32 15
ecs.gn7s-c48g1.12xlarge 48 380 NVIDIA A30 * 1 24GB * 1 16 600万 1 12 8
ecs.gn7s-c56g1.14xlarge 56 440 NVIDIA A30 * 1 24GB * 1 16 600万 1 12 8
说明

GPU计算型实例规格族gn7e

gn7e的特点如下:
  • 采用Intel Icelake处理器和以NVSwitch互联的NVIDIA A100 SXM4 80G GPU卡,您可以根据需要选择不同卡数和不同CPU资源的规格,灵活适应其不同的AI业务需求。
  • 依托第三代神龙架构,VPC和云盘网络带宽相比上一代平均提升一倍。
  • 计算:
    • 采用NVIDIA A100 GPU计算卡
      • 创新的NVIDIA Ampere架构
      • 多卡之间以NVLINK Switch互联
      • 支持混合精度计算,单GPU显存80 GB HBM2
    • 处理器:2.9 GHz主频的Intel ® Xeon ® Platinum 8369B(Ice Lake),全核睿频3.5 GHz
  • 存储:
    • I/O优化实例
    • 仅支持ESSD云盘
  • 网络:
    • 支持IPv6
    • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • 中小规模的AI训练业务
    • 使用CUDA进行加速的HPC业务
    • 对GPU处理能力或显存容量需求较高的AI推理业务
    • 深度学习,例如图像分类、无人驾驶、语音识别等人工智能算法的训练应用
    • 高GPU负载的科学计算,例如计算流体动力学、计算金融学、分子动力学、环境分析等
    注意 在使用高通信负载的AI训练业务如Transformer等模型时,务必启用NVLink进行GPU间的数据通信,否则可能由于PCIe链路大规模数据传输引起非预期的故障,导致数据受损。如不确定您使用的训练通信链路拓扑,请提交工单由阿里云技术专家为您提供技术支持。
gn7e包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡 单网卡私有IP
ecs.gn7e-c16g1.4xlarge 16 125 NVIDIA A100 * 1 80GB * 1 8 300万 8 8 10
ecs.gn7e-c16g1.16xlarge 64 500 NVIDIA A100 * 4 80GB * 4 32 1200万 32 8 10
ecs.gn7e-c16g1.32xlarge 128 1000 NVIDIA A100 * 8 80GB * 8 64 2400万 32 16 15
说明

在云服务器ECS控制台创建gn7e实例或重启gn7e实例后,系统默认该实例的MIG(Multi-Instance GPU)功能是关闭状态。

gn7e实例是否支持打开MIG(Multi-Instance GPU)功能的说明如下所示:

实例规格 是否支持打开MIG功能 说明
ecs.gn7e-c16g1.4xlarge 单卡实例支持打开MIG功能。
ecs.gn7e-c16g1.16xlarge 多卡实例因安全因素不支持打开MIG功能。
ecs.gn7e-c16g1.32xlarge

GPU计算型实例规格族gn7i

gn7i的特点如下:
  • 依托第三代神龙架构,提供稳定可预期的超高性能。同时通过芯片快速路径加速手段,完成存储、网络性能以及计算稳定性的数量级提升。
  • 计算:
    • 采用NVIDIA A10 GPU计算卡
      • 创新的Ampere架构
      • 支持RTX、TensorRT等常用加速功能
    • 处理器:2.9 GHz主频的Intel ® Xeon ® 可扩展处理器(Ice Lake),全核睿频3.5 GHz
    • 最大可提供752 GiB内存,相比gn6i大幅提升
  • 存储:
    • I/O优化实例
    • 仅支持ESSD云盘
  • 网络:
    • 支持IPv6
    • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • 配备高性能CPU、内存、GPU,可以处理更多并发AI推理任务,适用于图像识别、语音识别、行为识别业务
    • 支持RTX功能,搭配高主频CPU,提供高性能的3D图形虚拟化能力,适用于远程图形设计、云游戏等高强度图形处理业务
gn7i包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡 单网卡私有IP
ecs.gn7i-c8g1.2xlarge 8 30 NVIDIA A10 * 1 24GB * 1 16 160万 8 4 5
ecs.gn7i-c16g1.4xlarge 16 60 NVIDIA A10 * 1 24GB * 1 16 300万 8 8 5
ecs.gn7i-c32g1.8xlarge 32 188 NVIDIA A10 * 1 24GB * 1 16 600万 12 8 5
ecs.gn7i-c32g1.16xlarge 64 376 NVIDIA A10 * 2 24GB * 2 32 1200万 16 15 5
ecs.gn7i-c32g1.32xlarge 128 752 NVIDIA A10 * 4 24GB * 4 64 2400万 32 15 10
ecs.gn7i-c48g1.12xlarge 48 310 NVIDIA A10 * 1 24GB * 1 16 900万 16 8 8
ecs.gn7i-c56g1.14xlarge 56 346 NVIDIA A10 * 1 24GB * 1 16 1200万 16 12 8
说明

GPU计算型实例规格族gn7

gn7的特点如下:
  • 计算:
    • 采用NVIDIA A100 GPU计算卡,多卡之间以NVSwitch实现两两互联
      • 创新的Ampere架构
      • 单GPU显存40 GB HBM2
    • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8269CY(Cascade Lake)
  • 存储:
    • I/O优化实例
    • 仅支持ESSD云盘
  • 网络:
    • 支持IPv6
    • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • 深度学习,例如图像分类、无人驾驶、语音识别等人工智能算法的训练应用
    • 高GPU负载的科学计算,例如计算流体动力学、计算金融学、分子动力学、环境分析等
gn7包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡
ecs.gn7-c12g1.3xlarge 12 95 NVIDIA A100 * 1 40GB * 1 4 250万 4 8
ecs.gn7-c13g1.13xlarge 52 380 NVIDIA A100 * 4 40GB * 4 15 900万 16 8
ecs.gn7-c13g1.26xlarge 104 760 NVIDIA A100 * 8 40GB * 8 30 1800万 16 16
说明

在云服务器ECS控制台创建gn7实例或重启gn7实例后,系统默认该实例的MIG(Multi-Instance GPU)功能是关闭状态。

gn7实例是否支持打开MIG(Multi-Instance GPU)功能的说明如下所示:

实例规格 是否支持打开MIG功能 说明
ecs.gn7-c12g1.3xlarge 单卡实例支持打开MIG功能。
ecs.gn7-c13g1.13xlarge 多卡实例因安全因素不支持打开MIG功能。
ecs.gn7-c13g1.26xlarge

GPU计算型实例规格族gn6i

gn6i的特点如下:
  • 计算:
    • GPU加速器:T4
      • 创新的Turing架构
      • 单GPU显存16 GB(GPU显存带宽320 GB/s)
      • 单GPU 2560个CUDA Cores
      • 单GPU多达320个Turing Tensor Cores
      • 可变精度Tensor Cores支持65 TFlops FP16、130 INT8 TOPS、260 INT4 TOPS
    • 处理器与内存配比约为1:4
    • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake)
  • 存储:
    • I/O优化实例
    • 支持ESSD云盘(百万IOPS)、SSD云盘和高效云盘
  • 网络:
    • 支持IPv6
    • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • AI(DL和ML)推理,适合计算机视觉、语音识别、语音合成、NLP、机器翻译、推荐系统
    • 云游戏云端实时渲染
    • AR和VR的云端实时渲染
    • 重载图形计算或图形工作站
    • GPU加速数据库
    • 高性能计算
gn6i包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 存储IOPS基准 多队列 弹性网卡 单网卡私有IP
ecs.gn6i-c4g1.xlarge 4 15 NVIDIA T4 * 1 16GB * 1 4 50万 2 2 10
ecs.gn6i-c8g1.2xlarge 8 31 NVIDIA T4 * 1 16GB * 1 5 80万 2 2 10
ecs.gn6i-c16g1.4xlarge 16 62 NVIDIA T4 * 1 16GB * 1 6 100万 4 3 10
ecs.gn6i-c24g1.6xlarge 24 93 NVIDIA T4 * 1 16GB * 1 7.5 120万 6 4 10
ecs.gn6i-c40g1.10xlarge 40 155 NVIDIA T4 * 1 16GB * 1 10 160万 16 10 10
ecs.gn6i-c24g1.12xlarge 48 186 NVIDIA T4 * 2 16GB * 2 15 240万 12 6 10
ecs.gn6i-c24g1.24xlarge 96 372 NVIDIA T4 * 4 16GB * 4 30 480万 25万 24 8 10
说明

GPU计算型实例规格族gn6e

gn6e的特点如下:
  • 计算:
    • 采用NVIDIA V100(32 GB NVLink)GPU计算卡
    • GPU加速器:V100(SXM2封装)
      • 创新的Volta架构
      • 单GPU显存32 GB HBM2(GPU显存带宽900 GB/s)
      • 单GPU 5120个CUDA Cores
      • 单GPU 640个Tensor Cores
      • 单GPU支持6个NVLink链路(NVLink属于双向链路),单向链路的带宽为25 Git/s,总带宽为6×25×2=300 Git/s
    • 处理器与内存配比约为1:8
    • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake)
  • 存储:
    • I/O优化实例
    • 支持ESSD云盘、SSD云盘和高效云盘
  • 网络:
    • 支持IPv6
    • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • 深度学习,例如图像分类、无人驾驶、语音识别等人工智能算法的训练、推理应用
    • 科学计算,例如计算流体动力学、计算金融学、分子动力学、环境分析等
gn6e包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡 单网卡私有IP
ecs.gn6e-c12g1.3xlarge 12 92 NVIDIA V100 * 1 32GB * 1 5 80万 8 6 10
ecs.gn6e-c12g1.12xlarge 48 368 NVIDIA V100 * 4 32GB * 4 16 240万 8 8 20
ecs.gn6e-c12g1.24xlarge 96 736 NVIDIA V100 * 8 32GB * 8 32 480万 16 8 20
说明

GPU计算型实例规格族gn6v

gn6v的特点如下:
  • 计算:
    • 采用NVIDIA V100 GPU计算卡
    • GPU加速器:V100(SXM2封装)
      • 创新的Volta架构
      • 单GPU显存16 GB HBM2(GPU显存带宽900 GB/s)
      • 单GPU 5120个CUDA Cores
      • 单GPU 640个Tensor Cores
      • 单GPU支持6个NVLink链路(NVLink属于双向链路),单向链路的带宽为25 Git/s,总带宽为6×25×2=300 Git/s
    • 处理器与内存配比约为1:4
    • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake)
  • 存储:
    • I/O优化实例
    • 支持ESSD云盘、SSD云盘和高效云盘
  • 网络:
    • 支持IPv6
    • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • 深度学习,例如图像分类、无人驾驶、语音识别等人工智能算法的训练、推理应用
    • 科学计算,例如计算流体动力学、计算金融学、分子动力学、环境分析等
gn6v包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 存储IOPS基准 多队列 弹性网卡 单网卡私有IP
ecs.gn6v-c8g1.2xlarge 8 32 NVIDIA V100 * 1 16GB * 1 2.5 80万 4 4 10
ecs.gn6v-c8g1.8xlarge 32 128 NVIDIA V100 * 4 16GB * 4 10 200万 8 8 20
ecs.gn6v-c8g1.16xlarge 64 256 NVIDIA V100 * 8 16GB * 8 20 250万 16 8 20
ecs.gn6v-c10g1.20xlarge 82 336 NVIDIA V100 * 8 16GB * 8 32 450万 25万 16 8 20
说明

GPU计算型弹性裸金属服务器实例规格族ebmgn7e

ebmgn7e的特点如下:
  • 基于神龙架构,实现软件定义硬件计算,灵活弹性与强悍性能兼备
  • 采用NVIDIA A100 SXM4 80GB GPU计算卡,支持NVSwitch,算力高达312T(TF32)
  • 处理器:基于Intel ® Xeon ®Scalable计算平台,2.9 GHz主频,全核睿频3.5 GHz,支持PCIe 4.0接口
  • I/O优化实例
  • 仅支持ESSD云盘,PL3级别的ESSD云盘最高可提供1,000,000 IOPS和4,000 MB/s吞吐量,满足训练过程中的缓存要求,无需使用本地盘
    说明 更多的ESSD云盘性能说明,请参见ESSD云盘
  • 支持IPv6
  • 超高网络性能,2400万PPS网络收发包能力
  • 适用场景:
    • 各类深度学习训练开发业务
    • HPC加速计算和仿真
    注意 在使用高通信负载的AI训练业务如Transformer等模型时,务必启用NVLink进行GPU间的数据通信,否则可能由于PCIe链路大规模数据传输引起非预期的故障,导致数据受损。如不确定您使用的训练通信链路拓扑,请提交工单由阿里云技术专家为您提供技术支持。
ebmgn7e包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列(主网卡/辅助网卡) 弹性网卡
ecs.ebmgn7e.32xlarge 128 1024 NVIDIA A100 * 8 80GB * 8 64 2400万 32/12 32
说明

MIG(Multi-Instance GPU)功能需要您在ebmgn7e实例启动后自己检查并决定是否开启或关闭,系统无法保证MIG(Multi-Instance GPU)功能是开启或关闭状态。

ebmgn7e实例是否支持打开MIG(Multi-Instance GPU)功能的说明如下所示:

实例规格 是否支持打开MIG功能 说明
ecs.ebmgn7e.32xlarge ebmgn7e裸金属实例支持开启MIG功能。

GPU计算型弹性裸金属服务器实例规格族ebmgn7i

ebmgn7i的特点如下:
  • 基于神龙架构,实现软件定义硬件计算,灵活弹性与强悍性能兼备
  • 采用NVIDIA A10 GPU计算卡
    • 创新的Ampere架构
    • 支持vGPU、RTX、TensorRT等常用加速功能
  • 处理器:2.9 GHz主频的Intel ® Xeon ®可扩展处理器(Ice Lake),全核睿频3.5 GHz
  • I/O优化实例
  • 仅支持ESSD云盘
  • 支持IPv6
  • 超高网络性能,2400万PPS网络收发包能力
  • 适用场景:
    • 配备高性能CPU、内存、GPU,可以处理更多并发AI推理任务,适用于图像识别、语音识别、行为识别业务
    • 支持RTX功能,搭配高主频CPU,提供高性能的3D图形虚拟化能力,适用于远程图形设计、云游戏等高强度图形处理业务
    • 支持RTX功能,搭配高网络带宽和云盘带宽,适用于搭建高性能渲染农场
    • 配备多个GPU,搭配高网络带宽,适用于小规模深度学习训练业务
ebmgn7i包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡
ecs.ebmgn7i.32xlarge 128 768 NVIDIA A10 * 4 24GB * 4 64 2400万 32 32
说明

GPU计算型弹性裸金属服务器实例规格族ebmgn7

ebmgn7的特点如下:
  • 基于神龙架构,实现软件定义硬件计算,灵活弹性与强悍性能兼备
  • 采用NVIDIA A100 GPU计算卡,多卡之间以NVSwitch实现两两互联
    • 创新的Ampere架构
    • 单GPU显存40 GB HBM2
  • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8269CY(Cascade Lake)
  • I/O优化实例
  • 仅支持ESSD云盘
  • 支持IPv6
  • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • 深度学习,例如图像分类、无人驾驶、语音识别等人工智能算法的训练应用
    • 高GPU负载的科学计算,例如计算流体动力学、计算金融学、分子动力学、环境分析等
ebmgn7包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡 单网卡私有IP
ecs.ebmgn7.26xlarge 104 768 NVIDIA A100 * 8 30 1800万 16 15 10
说明

MIG(Multi-Instance GPU)功能需要您在ebmgn7实例启动后自己检查并决定是否开启或关闭,系统无法保证MIG(Multi-Instance GPU)功能是开启还是关闭状态。

ebmgn7实例是否支持打开MIG(Multi-Instance GPU)功能的说明如下所示:

实例规格 是否支持打开MIG功能 说明
ecs.ebmgn7.26xlarge ebmgn7裸金属实例支持开启MIG功能。

GPU计算型弹性裸金属服务器实例规格族ebmgn6ia

该实例规格族正在邀测中,如需使用,提交工单

ebmgn6ia的特点如下:
  • 依托第三代神龙架构,通过芯片快速路径加速手段,提供稳定可预期的超高计算、存储和网络性能
  • 采用NVIDIA T4 GPU计算加速器提供GPU加速能力,助力图形和AI业务,搭配容器技术可以提供60路以上虚拟Android终端,并对每路终端显示进行硬件视频转码加速
  • 处理器与内存配比约为1:3
  • 处理器:2.8 GHz主频的Ampere® Altra®处理器,睿频3.0 GHz,原生ARM计算平台为Android服务器提供高效的性能和优秀的App兼容性
  • I/O优化实例
  • 仅支持ESSD云盘
  • 支持IPv6
  • 适用场景:基于Android提供App远端服务,例如云业务在线待机、云手游和云手机、Android业务爬虫
ebmgn6ia包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡 单网卡私有IP
ecs.ebmgn6ia.20xlarge 80 256 NVIDIA T4 * 2 16GB * 2 32 2400万 32 15 10
说明
  • 您可以前往ECS实例可购买地域,查看实例在各地域的可购情况。
  • 指标的含义请参见实例规格指标说明
  • Ampere® Altra®处理器对操作系统内核版本有一定要求。当您使用该实例规格创建ECS实例时,可以直接选用Alibaba Cloud Linux 3和CentOS 8.4及以上版本的操作系统镜像(建议您使用Alibaba Cloud Linux 3镜像)。如果您需要使用其他操作系统版本,请参见Ampere Altra (TM) Linux Kernel Porting Guide,在指定操作系统的ECS实例中为内核打上相应的补丁,完成之后基于该ECS实例创建自定义镜像,然后再通过自定义镜像创建新的ECS实例时选择该实例规格。

GPU计算型弹性裸金属服务器实例规格族ebmgn6e

ebmgn6e的特点如下:
  • 基于神龙架构,实现软件定义硬件计算,灵活弹性与强悍性能兼备
  • 采用NVIDIA V100(32 GB NVLink) GPU计算卡
  • GPU加速器:V100(SXM2封装)
    • 创新的Volta架构
    • 单GPU显存32 GB HBM2(GPU显存带宽900 GB/s)
    • 单GPU 5120个CUDA Cores
    • 单GPU 640个Tensor Cores
    • 单GPU支持6个NVLink链路(NVLink属于双向链路),单向链路的带宽为25 GB/s,总带宽为6×25×2=300 GB/s
  • 处理器与内存配比为1:8
  • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake)
  • I/O优化实例
  • 支持ESSD云盘、SSD云盘和高效云盘
  • 支持IPv6
  • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • 深度学习,例如图像分类、无人驾驶、语音识别等人工智能算法的训练以及推理应用
    • 科学计算,例如计算流体动力学、计算金融学、分子动力学、环境分析等
ebmgn6e包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡 单网卡私有IP
ecs.ebmgn6e.24xlarge 96 768 NVIDIA V100 * 8 32GB * 8 32 480万 16 15 10
说明

GPU计算型弹性裸金属服务器实例规格族ebmgn6v

ebmgn6v的特点如下:
  • 基于神龙架构,实现软件定义硬件计算,灵活弹性与强悍性能兼备
  • 采用NVIDIA V100 GPU计算卡
  • GPU加速器:V100(SXM2封装)
    • 创新的Volta架构
    • 单GPU显存16 GB HBM2(GPU显存带宽900 GB/s)
    • 单GPU 5120个CUDA Cores
    • 单GPU 640个Tensor Cores
    • 单GPU支持6个NVLink链路(NVLink属于双向链路),单向链路的带宽为25 GB/s,总带宽为6×25×2=300 GB/s
  • 处理器与内存配比为1:4
  • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake)
  • I/O优化实例
  • 支持ESSD云盘、SSD云盘和高效云盘
  • 支持IPv6
  • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • 深度学习,例如图像分类、无人驾驶、语音识别等人工智能算法的训练以及推理应用
    • 科学计算,例如计算流体动力学、计算金融学、分子动力学、环境分析等
ebmgn6v包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡 单网卡私有IP
ecs.ebmgn6v.24xlarge 96 384 NVIDIA V100 * 8 16GB * 8 30 450万 8 32 10
说明

GPU计算型弹性裸金属服务器实例规格族ebmgn6i

ebmgn6i的特点如下:
  • 基于神龙架构,实现软件定义硬件计算,灵活弹性与强悍性能兼备
  • GPU加速器:T4
    • 创新的Turing架构
    • 单GPU显存16 GB(GPU显存带宽320 GB/s)
    • 单GPU 2560个CUDA Cores
    • 单GPU多达320个Turing Tensor Cores
    • 可变精度Tensor Cores支持65 TFlops FP16、130 INT8 TOPS、260 INT4 TOPS
  • 处理器与内存配比为1:4
  • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake)
  • I/O优化实例
  • 支持ESSD(百万IOPS)、SSD云盘和高效云盘
  • 支持IPv6
  • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • AI(DL/ML)推理,适合计算机视觉、语音识别、语音合成、NLP、机器翻译、推荐系统
    • 云游戏云端实时渲染
    • AR/VR的云端实时渲染
    • 重载图形计算或图形工作站
    • GPU加速数据库
    • 高性能计算
ebmgn6i包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡 单网卡私有IP
ecs.ebmgn6i.24xlarge 96 384 NVIDIA T4 * 4 16GB * 4 30 450万 8 32 10
说明

GPU计算型超级计算集群实例规格族sccgn7ex

sccgn7ex的特点如下:
  • 具备弹性裸金属服务器的所有特性。更多信息,请参见弹性裸金属服务器概述
  • 计算:
    • 采用NVIDIA A100 GPU计算卡(8颗GPU),支持NVSwitch,算力高达312T(TF32)
    • 处理器与内存配比为1:8
    • 处理器:采用第三代Intel ® Xeon ® 可扩展处理器(Ice lake),基频2.9 GHz,全核睿频3.5 GHz,支持PCIe 4.0接口
  • 存储:
    • I/O优化实例
    • 仅支持ESSD云盘,PL3级别的ESSD云盘最高可提供1,000,000 IOPS和4,000 MB/s吞吐量,满足训练过程中的缓存要求,无需使用本地盘
  • 网络:
    • 支持IPv6
    • 仅支持专有网络VPC
    • sccgn7ex实例间支持800 Gbit/s的互联带宽(4 * 双口100 Gbit/s RDMA),支持GPUDirect,每颗GPU直连一个100 Gbit/s网口
  • 适用场景:超大规模AI训练场景
    注意 在使用高通信负载的AI训练业务如Transformer等模型时,务必启用NVLink进行GPU间的数据通信,否则可能由于PCIe链路大规模数据传输引起非预期的故障,导致数据受损。如不确定您使用的训练通信链路拓扑,请提交工单由阿里云技术专家为您提供技术支持。
sccgn7ex包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存(GB) 网络带宽(Gbit/s) 网络收发包PPS RoCE网络(Gbit/s) 多队列(主网卡/辅助网卡) 弹性网卡 单网卡私有IPv4地址数 单网卡IPv6地址数
ecs.sccgn7ex.32xlarge 128 1024 NVIDIA A100 * 8 80GB * 8 64 2400万 800 32/12 32 15 15
说明

GPU计算型超级计算集群实例规格族sccgn6e

如需使用,请提交工单

sccgn6e的特点如下:
  • 具备弹性裸金属服务器的所有特性。更多信息,请参见弹性裸金属服务器概述
  • 计算:
    • GPU加速器:V100(SXM2封装)
      • 创新的Volta架构
      • GPU显存32 GB HBM2
      • CUDA Cores 5120
      • Tensor Cores 640
      • GPU显存带宽900 GB/s
      • 单GPU支持6个NVLink链路(NVLink属于双向链路),单向链路的带宽为25 Git/s,总带宽为6×25×2=300 Git/s
    • 处理器与内存配比为1:8
    • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake),计算性能稳定
  • 存储:
    • I/O优化实例
    • 支持ESSD云盘、SSD云盘和高效云盘
    • 支持高性能并行文件系统CPFS
  • 网络:
    • 支持IPv6
    • 支持专有网络VPC
    • 支持RoCE V2网络,用于低延迟的RDMA通信
  • 适用场景:
    • 超大规模机器学习集群训练场景
    • 大规模高性能科学计算和仿真计算
    • 大规模数据分析、批量计算、视频编码
sccgn6e包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU GPU显存(GB) 网络带宽(Gbit/s) 网络收发包PPS RoCE网络(Gbit/s) 多队列 弹性网卡 单网卡私有IP
ecs.sccgn6e.24xlarge 96 768.0 NVIDIA V100 * 8 32GB * 8 32 480万 50 8 32 10
说明

GPU计算型超级计算集群实例规格族sccgn6

sccgn6的特点如下:
  • 具备弹性裸金属服务器的所有特性。更多信息,请参见弹性裸金属服务器概述
  • 计算:
    • GPU加速器:V100(SXM2封装)
      • 创新的Volta架构
      • GPU显存16 GB HBM2
      • CUDA Cores 5120
      • Tensor Cores 640
      • GPU显存带宽900 GB/s
      • GPU支持6个NVLink链路(NVLink属于双向链路),单向链路的带宽为25 Git/s,总带宽为6×25×2=300 Git/s
    • 处理器与内存配比为1:4
    • 处理器:2.5 GHz主频的Intel ® Xeon ® Platinum 8163(Skylake),计算性能稳定
  • 存储:
    • I/O优化实例
    • 支持ESSD云盘、SSD云盘和高效云盘
    • 支持高性能并行文件系统CPFS
  • 网络:
    • 支持IPv6
    • 支持专有网络VPC
    • 支持RoCE V2网络,用于低延迟的RDMA通信
  • 适用场景:
    • 超大规模机器学习集群训练场景
    • 大规模高性能科学计算和仿真计算
    • 大规模数据分析、批量计算、视频编码
sccgn6包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) GPU 网络带宽(Gbit/s) 网络收发包PPS RoCE网络(Gbit/s) 多队列 弹性网卡 单网卡私有IP
ecs.sccgn6.24xlarge 96 384.0 NVIDIA V100 * 8 30 450万 50 8 32 10
说明

GPU计算型实例规格族gn5

gn5的特点如下:
  • 计算:
    • 采用NVIDIA P100 GPU计算卡
    • 多种处理器与内存配比
    • 处理器:2.5 GHz主频的Intel ® Xeon ® E5-2682 v4(Broadwell)
  • 存储:
    • 配备高性能NVMe SSD本地盘
    • I/O优化实例
    • 仅支持SSD云盘和高效云盘
  • 网络:
    • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • 深度学习
    • 科学计算,例如计算流体动力学、计算金融学、基因组学研究、环境分析
    • 高性能计算、渲染、多媒体编解码及其他服务器端GPU计算工作负载
gn5包括的实例规格及指标数据如下表所示。
实例规格 vCPU 内存(GiB) 本地存储(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡 单网卡私有IP
ecs.gn5-c4g1.xlarge 4 30 440 NVIDIA P100 * 1 16GB * 1 3 30万 1 3 10
ecs.gn5-c8g1.2xlarge 8 60 440 NVIDIA P100 * 1 16GB * 1 3 40万 1 4 10
ecs.gn5-c4g1.2xlarge 8 60 880 NVIDIA P100 * 2 16GB * 2 5 100万 2 4 10
ecs.gn5-c8g1.4xlarge 16 120 880 NVIDIA P100 * 2 16GB * 2 5 100万 4 8 20
ecs.gn5-c28g1.7xlarge 28 112 440 NVIDIA P100 * 1 16GB * 1 5 100万 8 8 20
ecs.gn5-c8g1.8xlarge 32 240 1760 NVIDIA P100 * 4 16GB * 4 10 200万 8 8 20
ecs.gn5-c28g1.14xlarge 56 224 880 NVIDIA P100 * 2 16GB * 2 10 200万 14 8 20
ecs.gn5-c8g1.14xlarge 54 480 3520 NVIDIA P100 * 8 16GB * 8 25 400万 14 8 20
说明

GPU计算型实例规格族gn5i

gn5i的特点如下:
  • 计算:
    • 采用NVIDIA P4 GPU计算卡
    • 处理器与内存配比为1:4
    • 处理器:2.5 GHz主频的Intel ® Xeon ® E5-2682 v4(Broadwell)
  • 存储:
    • I/O优化实例
    • 仅支持SSD云盘和高效云盘
  • 网络:
    • 支持IPv6
    • 实例网络性能与计算规格对应(规格越高网络性能越强)
  • 适用场景:
    • 深度学习推理
    • 多媒体编解码等服务器端GPU计算工作负载
gn5i包括的实例规格及指标数据如下:
实例规格 vCPU 内存(GiB) GPU GPU显存 网络带宽(Gbit/s) 网络收发包PPS 多队列 弹性网卡 单网卡私有IP
ecs.gn5i-c2g1.large 2 8 NVIDIA P4 * 1 8GB * 1 1 10万 2 2 6
ecs.gn5i-c4g1.xlarge 4 16 NVIDIA P4 * 1 8GB * 1 1.5 20万 2 3 10
ecs.gn5i-c8g1.2xlarge 8 32 NVIDIA P4 * 1 8GB * 1 2 40万 4 4 10
ecs.gn5i-c16g1.4xlarge 16 64 NVIDIA P4 * 1 8GB * 1 3 80万 4 8 20
ecs.gn5i-c16g1.8xlarge 32 128 NVIDIA P4 * 2 8GB * 2 6 120万 8 8 20
ecs.gn5i-c28g1.14xlarge 56 224 NVIDIA P4 * 2 8GB * 2 10 200万 14 8 20
说明