DataWorks大模型服务为您提供高效部署、安全通信与便捷调用的一站式能力,您可以基于DataWorks的Serverless资源组轻松完成模型部署,并直接在数据开发任务中调用模型,所有流量均通过PrivateLink建立的私网通道传输,确保数据全程不出域,从而有效保障数据安全性。
使用限制
仅华东1(杭州)、华东2(上海)、华北2(北京)、华北6(乌兰察布)、华南1(深圳)、中国香港、日本(东京)、新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)、德国(法兰克福)、美国(硅谷)和美国(弗吉尼亚)地域支持使用大模型服务功能。
支持的模型列表
下表列出了当前可在DataWorks的Serverless资源组上部署的模型。
类别 | 模型 | 说明 |
大语言模型 | Qwen3-32B | Qwen3是Qwen系列的最新一代大型语言模型,提供了一整套密集型和专家混合型(MoE)模型。基于广泛的训练,Qwen3在推理、指令遵循、代理能力及多语言支持方面实现了突破性的进展。更多模型介绍信息可参见Qwen3。 重要
|
Qwen3-14B | ||
Qwen3-8B | ||
Qwen3-4B | ||
Qwen3-1.7B | ||
Qwen3-0.6B | ||
Qwen3-Embedding-8B | ||
Qwen3-Embedding-4B | ||
Qwen3-Embedding-0.6B | ||
DeepSeek-R1-0528-Qwen3-8B | DeepSeek在训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。更多模型介绍信息可参见DeepSeek。 | |
DeepSeek-R1-Distill-Qwen-1.5B | ||
DeepSeek-R1-Distill-Qwen-7B | ||
DeepSeek-R1-Distill-Qwen-14B | ||
向量模型 | BGE-M3 | BGE-M3是一个通用向量模型,支持密集检索、多向量检索和稀疏检索,可处理从短文本到最长8192 tokens的输入,并支持100多种自然语言。 |
bge-large-zh-v1.5 | BGE Embedding是一个通用向量模型。 使用retromae对模型进行预训练,再用对比学习在大规模成对数据上训练模型。 |
大模型服务特性
快速部署:简化上线流程
通过可视化界面引导,实现预训练模型的低代码部署。 您无需编写基础设施代码,只需几步简单配置,即可完成模型服务的创建与发布,降低模型上线门槛。
安全内网通信:保障服务隔离
DataWorks大模型服务将以全托管模式部署在DataWorks资源组中,基于私网连接(PrivateLink)与内网域名解析(Private Hosted Zone)构建跨VPC内网通信,实现网络隔离。用户可通过 VPC 内网访问该全托管模型,确保模型服务的安全性。
网络隔离通信:通过PrivateLink在用户VPC与DataWorks资源组VPC之间建立专用连接通道,确保流量不暴露于公网,实现安全隔离。
私有域名解析:通过Private Hosted Zone部署内网DNS解析服务,自动配置私有域名转发规则,支持用户在VPC内通过域名直接访问模型服务。
自动化连接:实现无缝调用
当您在DataWorks资源组中部署模型服务或为其配置专有网络时,系统将自动执行以下操作:
建立跨VPC连接。 在您的VPC(DataWorks资源组可连通的用户账号下的VPC)中,系统会自动创建PrivateLink终端节点,并与DataWorks资源组VPC的PrivateLink服务端建立加密通信通道。
配置域名解析服务。 在模型服务配置的VPC中自动配置域名解析规则,使得VPC内部域名请求流量自动转发至DataWorks模型服务。
模型调用流程
当您通过域名发起模型服务调用时:
请求解析:用户VPC内的DNS请求由Private Hosted Zone解析,定位到DataWorks资源组VPC的私有IP。
流量转发:请求通过PrivateLink建立的专用通道,从用户VPC安全传输至DataWorks资源组VPC。
服务响应:请求到达DataWorks资源组VPC内的模型实例,完成推理计算并返回结果。
整个调用过程运行于内网环境,无需暴露公网IP,从而保障了模型服务的安全性与可控性。
模型部署与使用
在DataWorks中,您可以通过选择并部署相关模型来进行任务开发。