在传统的数据工作流中,处理像用户评论、产品描述、客服日志等非结构化文本数据一直是一项挑战。您现在可以直接在DataWorks的工作流中,利用强大的大语言模型(LLM)能力,通过自然语言指令,轻松完成文本摘要、情感分析、内容分类、信息提取等复杂的AI任务。这极大地简化数据处理流程,让数据工程师和分析师无需编写复杂的算法,即可将AI能力无缝集成到现有的ETL(数据抽取、转换、加载)链路中。
准备工作
在DataWorks中部署大模型服务,详情请参见部署模型。
大模型节点配置
只需简单配置即可实现大模型节点运行。
配置项 | 说明 |
模型服务 | 在准备工作中部署的大模型服务。 |
模型名称 | 默认选择大模型服务中的模型。 |
系统Prompt | 定义大模型的系统行为,包含角色、能力和行为准则等。 支持通过${param}格式获取参数。 |
用户Prompt | 输入具体问题或需求。DataWorks默认提供4种模板,可快速选择。 支持通过${param}格式获取参数。 例如,Prompt写成:请挑选出符合 |

简单示例
通过一个简单例子,演示大模型在工作流中的使用以及上下游参数传递。
登录DataWorks大模型服务,创建一个基于Qwen3-1.7B的大模型服务。资源组,选择已绑定到当前工作空间的资源组。
进入新版数据开发,创建如下工作流和相应节点。

配置赋值节点的语言模式为Shell(右下角工具栏),并编写如下代码。
若找不到,可参见赋值节点的详细说明。
echo 'DataWorks';配置大模型节点。
选择上述配置好的大模型服务以及模型名称。
配置用户Prompt如下:
写一篇关于${title}的介绍,字数限制为${length}。在右侧配置面板的,修改资源组为创建大模型服务时选中的资源组。
在右侧配置面板的,添加参数title为上游节点的输出和length为固定值300。
在参数值输入框右侧点击
进行上游参数的绑定。
配置MaxCompute SQL节点,输出大模型结果。
重要配置MaxCompute SQL节点需要绑定MaxCompute计算资源。若无,可选择Shell节点代替,仅演示输出结果。
配置代码如下:
select '${content}';在右侧配置面板的,修改资源组为创建大模型服务时选中的资源组。
在右侧,添加参数content为上游节点的输出。
在参数值输入框右侧点击
进行上游参数的绑定。
回到工作流,点击上方运行按钮,在弹窗中填写本次运行参数。
运行成功后,最终MaxCompute SQL节点输出类似如下大语言模型结果。
