在传统的数据工作流中,处理像用户评论、产品描述、客服日志等非结构化文本数据一直是一项挑战。您现在可以直接在DataWorks的工作流中,利用强大的大语言模型(LLM)能力,通过自然语言指令,轻松完成文本摘要、情感分析、内容分类、信息提取等复杂的AI任务。这极大地简化数据处理流程,让数据工程师和分析师无需编写复杂的算法,即可将AI能力无缝集成到现有的ETL(数据抽取、转换、加载)链路中。
准备工作
在DataWorks中部署大模型服务,详情请参见部署模型。
大模型节点配置
只需简单配置即可实现大模型节点运行。
| 配置项 | 说明 | 
| 模型服务 | 在准备工作中部署的大模型服务。 | 
| 模型名称 | 默认选择大模型服务中的模型。 | 
| 系统Prompt | 定义大模型的系统行为,包含角色、能力和行为准则等。 支持通过${param}格式获取参数。 | 
| 用户Prompt | 输入具体问题或需求。DataWorks默认提供4种模板,可快速选择。 支持通过${param}格式获取参数。 例如,Prompt写成:请挑选出符合 | 

简单示例
通过一个简单例子,演示大模型在工作流中的使用以及上下游参数传递。
- 登录DataWorks大模型服务,创建一个基于Qwen3-1.7B的大模型服务。资源组,选择已绑定到当前工作空间的资源组。 
- 进入新版数据开发,创建如下工作流和相应节点。  
- 配置赋值节点的语言模式为Shell(右下角工具栏),并编写如下代码。 - 若找不到,可参见赋值节点的详细说明。 - echo 'DataWorks';
- 配置大模型节点。 - 选择上述配置好的大模型服务以及模型名称。 
- 配置用户Prompt如下: - 写一篇关于${title}的介绍,字数限制为${length}。
- 在右侧配置面板的,修改资源组为创建大模型服务时选中的资源组。 
- 在右侧配置面板的,添加参数title为上游节点的输出和length为固定值300。 - 在参数值输入框右侧点击  进行上游参数的绑定。 进行上游参数的绑定。 
 
- 配置MaxCompute SQL节点,输出大模型结果。 重要- 配置MaxCompute SQL节点需要绑定MaxCompute计算资源。若无,可选择Shell节点代替,仅演示输出结果。 - 配置代码如下: - select '${content}';
- 在右侧配置面板的,修改资源组为创建大模型服务时选中的资源组。 
- 在右侧,添加参数content为上游节点的输出。 - 在参数值输入框右侧点击  进行上游参数的绑定。 进行上游参数的绑定。 
 
- 回到工作流,点击上方运行按钮,在弹窗中填写本次运行参数。 
- 运行成功后,最终MaxCompute SQL节点输出类似如下大语言模型结果。 