在传统的数据工作流中,处理像用户评论、产品描述、客服日志等非结构化文本数据一直是一项挑战。您现在可以直接在DataWorks的工作流中,利用强大的大语言模型(LLM)能力,通过自然语言指令,轻松完成文本摘要、情感分析、内容分类、信息提取等复杂的AI任务。这极大地简化数据处理流程,让数据工程师和分析师无需编写复杂的算法,即可将AI能力无缝集成到现有的ETL(数据抽取、转换、加载)链路中。
准备工作
在DataWorks中部署大模型服务,详情请参见部署模型。
大模型节点配置
只需简单配置即可实现大模型节点运行。
|
配置项 |
说明 |
|
模型服务 |
在准备工作中部署的大模型服务。 |
|
模型名称 |
默认选择大模型服务中的模型。 |
|
系统Prompt |
定义大模型的系统行为,包含角色、能力和行为准则等。 支持通过${param}格式获取参数。 |
|
用户Prompt |
输入具体问题或需求。DataWorks默认提供4种模板,可快速选择。 支持通过 ${param} 格式获取参数。
例如,Prompt写成:请挑选出符合 |
简单示例
通过一个简单例子,演示大模型在工作流中的使用以及上下游参数传递。
-
登录DataWorks大模型服务,创建一个基于Qwen3-1.7B的大模型服务。资源组,选择已绑定到当前工作空间的资源组。
-
进入新版数据开发,创建如下工作流和相应节点。

-
配置 赋值节点 的语言模式为 Shell (右下角工具栏),并编写如下代码。
若找不到,可参见赋值节点的详细说明。
echo 'DataWorks'; -
配置大模型节点。
-
选择上述配置好的大模型服务以及模型名称。
-
配置用户Prompt如下:
写一篇关于${title}的介绍,字数限制为${length}。 -
在右侧配置面板的,修改资源组为创建大模型服务时选中的资源组。
-
在右侧配置面板的,添加参数title为上游节点的输出和length为固定值300。
在参数值输入框右侧点击
进行上游参数的绑定。

-
-
配置MaxCompute SQL节点,输出大模型结果。
重要配置MaxCompute SQL节点需要绑定MaxCompute计算资源。若无,可选择Shell节点代替,仅演示输出结果。
-
配置代码如下:
select '${content}'; -
在右侧配置面板的,修改资源组为创建大模型服务时选中的资源组。
-
在右侧,添加参数 content 为 上游节点的输出 。
在参数值输入框右侧点击
进行上游参数的绑定。

-
-
回到工作流,点击上方运行按钮,在弹窗中填写本次运行参数。
-
运行成功后,最终MaxCompute SQL节点输出类似如下大语言模型结果。