EMR Severless Spark 提供统一的外部模型服务注册能力,支持对接百炼、PAI-EAS及自建模型。无需编写代码,通过 SQL 即可实现批量情感分析、内容生成、智能标签提取与向量化嵌入,让 AI 推理无缝融入数据处理流程。
操作步骤
本文以阿里云PAI为例,演示Qwen3-0.6B模型在PAI-EAS的部署与EMR中的注册调用,完成AI推理的无缝集成。
步骤 | 目标 | 所属平台 |
部署服务 | 在PAI-EAS中发布服务 | 阿里云PAI控制台 |
获取凭证 | 获取 | 阿里云PAI控制台 |
注册服务 | 在 EMR Serverless Spark中注册外部模型 | EMR Serverless Spark 控制台 |
调用模型 | 使用 SQL 执行ai_query() | EMR Serverless Spark 控制台 |
如果您已成功在PAI控制台部署服务,请直接跳转至获取凭证。
部署服务
以部署公共模型中的Qwen3.5-Plus为例。
公共模型是指已预置部署模板的模型,可一键部署,无需准备模型文件。如选择自定义模型,需通过对象存储OSS等方式挂载模型文件。
登录PAI控制台,在页面上方选择目标地域,并在右侧选择目标工作空间,然后单击进入EAS。
在推理服务页签,单击部署服务,然后在场景化模型部署区域,单击LLM大语言模型部署。
在部署LLM大语言模型页面,配置以下关键参数。
模型配置:选择公共模型,在列表中搜索并选择Qwen3-0.6B。
推理引擎:推荐使用SGLang/vLLM(高度兼容OpenAI API标准)。本文以vLLM为例,更多说明,请参见选择合适的推理引擎。
部署模板:选择单机。系统将根据模板自动填充推荐的实例规格、镜像等参数。
单击部署,服务部署耗时约5分钟。当服务状态变为运行中,表示部署成功。
说明若服务部署失败,请参考服务部署与状态异常解决。
获取凭证
服务部署成功后,您需要获取其VPC调用地址和Token,用于后续在 EMR Serverless Spark 中注册该服务。
在推理服务页签,单击您的服务名称进入概览页面,在基本信息区域单击查看调用信息。
在调用信息面板,可获取VPC调用地址和Token。

注册服务
将 PAI-EAS 服务注册到 EMR Serverless Spark中,以便 Spark SQL 中的 ai_query() 函数能够识别并调用它。
进入模型服务页面。
在左侧导航栏,选择。
在Spark页面,单击目标工作空间名称。
在EMR Serverless Spark页面,单击左侧导航栏中的。
在模型服务页签,单击创建外部模型服务,并配置以下信息:
字段
值示例
说明
模型服务名称
my_qwen_service该名称用于后续
AI Function中endpointName入参的值,工作空间中唯一,不支持后续修改。Endpoint
http://12*******39.vpc.cn-hangzhou.pai-eas.aliyuncs.com/api/predict/<ServiceName>/v1填写上一步中获取的VPC调用地址,并在其末尾手动添加
/v1。模型名称
Qwen3.5-Plus实际调用时的model名称。
模型类型
Chat根据部署的模型类型选择
Chat还是Embedding。API KEY
nMzI**********************Zg==填写上一步中获取的
Token信息。描述
千问最新多模态模型服务
填写服务的简要描述,便于识别。
确认所有配置项无误后,单击创建完成模型服务注册。
调用模型
完成模型服务注册后,您即可在 EMR Serverless Spark 中使用内置的 ai_query() 函数,通过标准 SQL 语句调用大模型服务,实现无需编写代码的 AI 脱敏能力集成。
Gateway类型任务(Livy、Kyuubi)当前暂不支持。
创建 Spark SQL 作业并启用 AI 功能
在开发目录页签下,单击
(新建)图标。在弹出的对话框中,输入名称,类型选择SparkSQL,然后单击确定。
在右上角下拉列表中单击创建SQL会话,并配置以下信息:
配置项
设置说明
引擎版本
选择以下版本。
esr-4.x:esr-4.6.0及之后版本。
esr-3.x:esr-3.5.0及之后版本。
esr-2.x:esr-2.9.0及之后版本。
高级配置
在自定义配置中,添加
spark.emr.serverless.ai.function.enable trueSpark配置启用 AI 功能。
编写 SQL 调用模型
在数据开发页面,使用 ai_query() 函数编写 SQL 语句来调用模型。
-- 第二个参数 'my_qwen_service' 是注册模型服务时的模型服务名称 select ai_query('请对下面文本进行信息脱敏处理,规则如下: 1)中文姓名全部替换为“” 2)手机号保留前5位,其余替换为“*” 3)完整地址全部替换为“*****” 4)其他文本保持不变 5)仅输出脱敏后的文本,不要解释 原文:我的名字叫张三,电话号码是什么12345678900,导航去深圳市龙岗区智慧家园', 'my_qwen_service');查看脱敏结果
执行成功后,返回结果如下所示。
我的名字叫,电话号码是什么12345*****,导航去*****
相关文档
更多PAI-EAS模型自定义部署相关信息,请参见模型在线服务 EAS 快速入门。
PAI-EAS提供了一站式LLM部署解决方案,请参见LLM大语言模型部署。