MaxFrame GU资源使用

本文介绍MaxFrame GU资源使用方式及开发实践。结合MaxFrameGU Quota可以在MaxCompute上运行基于GPU的多模态数据处理、模型推理等任务。

功能介绍

  • MaxFrame是阿里云MaxCompute提供的一个基于Python编程接口的分布式计算框架,解决了传统Python数据处理中性能瓶颈低效数据移动的两个难题。 MaxFrame可以直接在MaxCompute上实现TB/PB级大数据的分布式处理与分析,执行可视化数据探索分析、科学计算、机器学习及AI开发等工作,从而满足用户在Python生态中日益增长的高效大数据处理和AI开发需求。

  • GU:即GPU Unit。阿里云MaxCompute中用于运行 GPU 计算任务的计算单元,适合深度学习推理、图像/音频处理、大模型离线推理等场景。详情参考MaxCompute AI计算资源

配置项

设置 MaxFrame 默认执行引擎优先级

DPE(Distributed Python Engine):分布式 Python 计算引擎,支持 GPU。必须将 "DPE" 放在 engine_order 首位,确保 GPU 任务调度到 DPE。

from maxframe.config import options
options.dag.settings = {
    "engine_order": ["DPE", "MCSQL"]
}

使用 GU 资源

  • 方式一:全局会话级指定 GU Quota

    全局会话级 GU Quota 仅对 MaxFrame AI Function 默认生效,普通 UDF 若需使用 GU Quota 需手动指定。

    options.session.gu_quota_name = "xxxxxx"  # GU Quota
  • 方式二:UDF 函数级指定 GU 参数

    @with_running_options(engine="dpe", gu=8, gu_quota="xxxxx")
    def vad_call(batch, config_path: str):
        ...
    • engine="dpe":指定使用 DPE 引擎。

    • gu=8:每个实例分配 8GU(8 卡)。

    • gu_quota="os_xxxx":指定具体可用的 GU Quota 组。