在MaxCompute中,若需要使用模型进行数据处理或离线推理且对计算效率要求较高时,可以选择购买并使用MaxCompute AI计算资源(GU Quota),以满足业务对于GPU算力的需求。本文介绍如何购买和使用该类计算资源。
适用范围
地域限制:目前开放售卖的地域为华北2(北京)、华东1(杭州)、华东2(上海)、华南1(深圳)和华北6(乌兰察布)。
使用限制:目前仅支持在MaxFrame中使用GPU AI计算资源。
计算资源限制:暂不支持对GPU AI计算资源Quota组的升降配操作,暂不支持将一个AI计算资源一级Quota拆分成多个二级Quota。
购买流程
登录MaxCompute控制台,在左上角选择地域。
在左侧导航栏选择。
在Quota管理页面单击新购Quota,跳转至购买页面,商品类型选择AI计算资源。
在MaxCompute-AI计算资源(预付费)页面,根据业务场景和界面提示,选择所需的资源规格、资源数量等参数,说明如下表:
参数名称
说明
规格
GU Quota的资源规格。
例如:
gu.a10.c30g186。计算资源单元
GU Quota的GU数量。
不同规格的Quota计算资源单元,允许调整的步长不同,可能为1、2、4或8GU,以购买页限制为准。
单击立即购买,根据界面提示勾选服务协议并支付费用,完成资源购买(当前GU资源拉起时间预计 10min)。
购买完成后返回控制台,在Quota管理页面将会出现一个Quota类型为“GPU AI计算资源”的Quota组。
使用指南
为支持AI与机器学习类工作负载的高效执行,MaxCompute提供专用的AI计算资源(GU Quota),可通过二级Quota机制在作业中按需使用。以下是使用AI计算资源的关键步骤与说明。
查看Quota状态
与MaxCompute通用计算资源(CU Quota)类似,AI计算资源(GU Quota)支持在作业级别指定。新购或新建的GPU资源组在投入使用前需要先完成底层环境初始化,可在控制台Quota管理页面查看二级Quota状态:
运行中:当状态显示为 “运行中” 时,表示环境已准备就绪,可正常提交任务;
创建中:若状态显示为“创建中”时,请等待资源完成配置后再使用。
建议在提交作业前确认Quota状态,以确保任务顺利调度。
在MaxFrame作业中使用AI计算资源
通过 @with_running_options 装饰器声明资源需求。即可在MaxFrame的AI函数或自定义函数中显式指定GU资源,示例如下:
@with_running_options(gu=1, gu_quota="your_gu_quotaname")
def your_ai_function():
"""
gu=1:表示申请1个GU(即1块 GPU 卡);
gu_quota:填写已开通且状态为“运行中”的GU Quota名称。
该函数通过 @with_running_options 装饰器,在执行时指定使用
1个GU(GPU Unit)的AI计算资源,并从名为 'your_gu_quotaname' 的Quota组中申请。
"""
# 函数体具体操作,这里用pass作为占位符
pass
该配置将确保函数在具备GPU能力的集群上执行,适用于多模态数据处理、模型推理及其他GPU加速场景。