EAS GPU共享功能上线

模型部署支持根据GPU算力占比与显存大小进行切分使用,提升资源利用率。

适用客户

AIGC/AI推理/模型在线服务的客户群。

新增功能/规格

EAS模型部署的过程中,支持客户根据GPU算力占比与显存大小进行切分使用,降低客户资源成本,提升资源利用率。在部署页面支持实例按显存进行调度和按算力进行调度,实现单卡共享多实例功能。

产品文档

EAS模型服务概述