AI Function是MaxCompute提供的一组面向AI业务场景的预定义函数,将复杂的AI推理操作封装为简洁的SQL或Python算子。用户无需编写底层模型调用代码,即可通过标准SQL或MaxFrame(分布式Python引擎)直接调用大模型或机器学习模型,显著降低用户在数据处理、大数据分析等场景的AI使用门槛。
场景概述
随着大模型对于数据的理解能力显著增强,具备了从多模态数据(e.g.结构化,文本,非结构化)中提取较精确的语义信息,并基于大模型的指令遵循特性把语义信息转换成Normalized数据,从而进行关系代数运算的能力。基于这种能力,在大数据平台内进行结构化和非结构化数据查询和处理的一体化计算成为了可能。
同时,随着用户场景的不断拓展,用户对在大数据平台内进行一体化计算的需求逐步提升,MaxCompute提供了MaxFrame(Python)和SQL等多种计算引擎能力,结合AI Function提供了更便捷和更低门槛的使用方式,帮助用户利用AI来提升在多模态数据处理、内容生成、信息抽取、图文解析等数据分析与计算场景下的计算能力和质量。一些典型场景例如:
大模型预训练数据处理场景:大模型预训练的WebData Processing任务,需要使用微调后的小参数大语言模型进行文本质量分计算、文本过滤、文本分类等任务;
多模态内容理解场景:传统电商、新兴自动驾驶领域的视频和图片数据处理任务,需要使用多模态模型进行物体识别、图片打标和分类等任务;
智能风控场景:在智能风控场景下,需要使用微调后的小参数LLM模型进行用户行为分类和风险预警任务。

功能优势
低代码开发:简单易上手,无需部署模型服务或编写复杂推理逻辑,通过一行函数调用即可完成AI推理,大幅缩短开发周期,降低AI应用门槛。
无缝集成:AI Function与MaxCompute的模型对象、计算资源、权限体系无缝集成,对接简单;
多引擎统一支持:MaxCompute SQL和MaxFrame引擎都提供了统一的AI Function能力,从而支持数据分析师使用熟悉的SQL来调用强大的AI模型,也让数据科学家基于MaxFrame提供的分布式Python计算能力结合模型持续提升数据预处理的计算能力和质量。
AI Function概述
SQL AI Function
MaxCompute提供了基于SQL语言的SQL AI Function,支持指定MaxCompute模型对象进行推理调用,包括内置提供的公共大语言模型,及用户导入模型、或PAI-EAS远程模型。模型详情请参考模型类型。
MaxCompute支持 SQL AI Function如下表:
AI Function名称
描述
支持的模型类型
用于生成自然语言文本,支持复杂逻辑推理、多模态任务和非结构化数据处理。
LLM
MLLM
用于对结构化数据进行预测,常见于分类、回归等传统机器学习任务。
BOOSTED_TREE_REGRESSOR
BOOSTED_TREE_CLASSIFIER
计费说明(SQL类 AI Function)
当使用SQL AI Function调用模型时,模型部署和推理计算时需要消耗MC计算资源。当使用预付费计算时,会占用CU Quota资源;当使用后付费计算时,会按照SQL作业的数据扫描量计费,暂不产生独立的CU计算费用。
MaxFrame AI Function
MaxCompute同时基于MaxFrame提供了基于Python的AI Function,支持基于CPU和GPU的推理调用,更多详细使用方式请参考MaxFrame AI Function。
场景实践
更多关于MaxCompute模型及AI Funtion整体使用的场景实践请参考: