模型部署支持根据GPU算力占比与显存大小进行切分使用,提升资源利用率。
适用客户
AIGC/AI推理/模型在线服务的客户群。
新增功能/规格
EAS模型部署的过程中,支持客户根据GPU算力占比与显存大小进行切分使用,降低客户资源成本,提升资源利用率。在部署页面支持实例按显存进行调度和按算力进行调度,实现单卡共享多实例功能。
产品文档
文档内容是否对您有帮助?
模型部署支持根据GPU算力占比与显存大小进行切分使用,提升资源利用率。
AIGC/AI推理/模型在线服务的客户群。
EAS模型部署的过程中,支持客户根据GPU算力占比与显存大小进行切分使用,降低客户资源成本,提升资源利用率。在部署页面支持实例按显存进行调度和按算力进行调度,实现单卡共享多实例功能。