PAI推出全新的General Unit(简称GU)系列规格,首发GU30系列机型。与PAI传统的实例规格相比,同等性能的实例规格价格优惠近45%,并适配不同复杂程度的模型。可支撑AIGC文图生成、大语言模型、多模态模型、NLP、CV、ASR等多种模型的训练和推理需求。本文为您介绍GU系列机型的相关说明。
GU系列机型定价及适用场景
目前PAI支持的GU系列机型、定价及适用场景如下表所示。
GU30系列机型的GPU卡为24 GB显存,FP32的算力为31TFLOPS,GPU与CPU间支持PCIE4.0连接。
GU30系列机型的性能与NVIDIA A10性能基本一致。同时相比于PAI上A10机型的价格,直降20%以上。
名称 | 实例规格 | 规格明细 | 适用场景 |
GU30单卡稠密型 | ml.gu7i.c8m30.1-gu30 | 8vCPU+30 GB RAM+1 * 24 GB显存 | 面向图像分类检测、AIGC图像生成等模型。 |
GU30单卡平衡型 | ml.gu7i.c16m60.1-gu30 | 16vCPU+60 GB RAM+1 * 24 GB显存 | 面向ASR、OCR类模型。 |
GU30单卡稀疏型 | ml.gu7i.c32m188.1-gu30 | 32vCPU+188 GB RAM+1 * 24 GB显存 | 面向个性化搜索、推荐搜索类模型。 |
GU30双卡 | ml.gu7i.c64m376.2-gu30 | 64vCPU+376 GB RAM+2 * 24 GB显存 | 面向AIGC LLM13.5B量级模型。 |
GU30四卡 | ml.gu7i.c128m752.4-gu30 | 80vCPU+256 GB RAM+4 * 24 GB显存 | 面向AIGC LLM30B量级模型。 |
PAI GU系列机型何以实现高性价比
PAI经过多年的积累,形成了超大规模的AI训练和推理性能集群。在弹性扩缩容和弹性资源池等极致的弹性能力加持下,降低了单一物理资源的使用成本,从而以更少的资源实现相同的性能。
PAI的AI极致优化加速,大幅提升了异构资源集群的整体利用率。在相同物理资源量的情况下,大幅提高计算资源的AI训练和推理性能,从而实现相同资源、更高性能。
如何购买PAI GU系列机型
目前PAI GU系列机型支持包年包月和按量计费两种购买方式。
预付费(包年包月)
您可以前往EAS专属机器预付费购买页,查看相应规格的定价信息,并按包年包月方式购买GU30系列机型。具体操作,请参见使用专属资源组。
后付费(按量计费)
您可以前往EAS专属机器后付费购买页,查看相应规格的定价信息,并按后付费方式购买GU30系列机型。具体操作,请参见使用专属资源组。
使用公共资源组部署服务时,无需单独购买GU30系列机型。部署服务时,公共资源组机器型号选择GU30系列机型,服务部署成功后即可按量计费使用该机型。关于公共资源组GU系列机型的计费说明,请参见模型在线服务(EAS)计费说明。