本文介绍MaxFrame GU资源使用方式及开发实践。结合MaxFrame和GU Quota可以在MaxCompute上运行基于GPU的多模态数据处理、模型推理等任务。
功能介绍
MaxFrame是阿里云MaxCompute提供的一个基于Python编程接口的分布式计算框架,解决了传统Python数据处理中性能瓶颈和低效数据移动的两个难题。 MaxFrame可以直接在MaxCompute上实现TB/PB级大数据的分布式处理与分析,执行可视化数据探索分析、科学计算、机器学习及AI开发等工作,从而满足用户在Python生态中日益增长的高效大数据处理和AI开发需求。
GU:即GPU Unit。阿里云MaxCompute中用于运行 GPU 计算任务的计算单元,适合深度学习推理、图像/音频处理、大模型离线推理等场景。详情参考MaxCompute AI计算资源。
配置项
设置 MaxFrame 默认执行引擎优先级
DPE(Distributed Python Engine):分布式 Python 计算引擎,支持 GPU。必须将 "DPE" 放在 engine_order 首位,确保 GPU 任务调度到 DPE。
from maxframe.config import options
options.dag.settings = {
"engine_order": ["DPE", "MCSQL"]
}使用 GU 资源
方式一:全局会话级指定 GU Quota
全局会话级 GU Quota 仅对 MaxFrame AI Function 默认生效,普通 UDF 若需使用 GU Quota 需手动指定。
options.session.gu_quota_name = "xxxxxx" # GU Quota方式二:UDF 函数级指定 GU 参数
@with_running_options(engine="dpe", gu=8, gu_quota="xxxxx") def vad_call(batch, config_path: str): ...engine="dpe":指定使用 DPE 引擎。gu=8:每个实例分配 8GU(8 卡)。gu_quota="os_xxxx":指定具体可用的 GU Quota 组。
该文章对您有帮助吗?