Dataphin系统内置了丰富的大模型,如阿里云(百炼)、DeepSeek等,以迎合市场多样化需求。本文为您介绍模型的相关信息。
部分模型支持深度思考模式,若不可关闭思考模式,会在表格中进行说明。
模型服务商 | 模型展示名 | 模型ID | 模型说明 | 是否支持深度思考 |
阿里云(百炼) | 通义千问-Max | qwen-max | 通义千问系列效果最好的模型,适合复杂、多步骤的任务。 | 否 |
通义千问-Max-Latest | qwen-max-latest | 通义千问系列效果最好的模型,适合复杂、多步骤的任务。始终与最新快照版能力相同。 | 否 | |
通义千问-Plus | qwen-plus | 能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务。 | 是 | |
通义千问-Plus-Latest | qwen-plus-latest | 能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务。始终与最新快照版能力相同。 | 是 | |
通义千问-Long | qwen-long | 通义千问系列上下文窗口最长,能力均衡且成本较低的模型,适合长文本分析、信息抽取、总结摘要和分类打标等任务。 | 否 | |
通义千问-Long-Latest | qwen-long-latest | 通义千问系列上下文窗口最长,能力均衡且成本较低的模型,适合长文本分析、信息抽取、总结摘要和分类打标等任务。始终与最新快照版能力相同。 | 否 | |
Qwen3-32b | qwen3-32b | 通义千问开源版模型,在推理能力、人类偏好能力、Agent能力、多语言能力等方面表现优越。参数规模为32B(32亿)。 | 是 | |
Qwen3-235b-a22b | qwen3-235b-a22b | 通义千问开源版模型,在推理能力、人类偏好能力、Agent能力、多语言能力等方面表现优越。参数规模为235B(235亿)。 | 是 | |
通义千问Coder | qwen-coder-plus | 通义千问代码模型。 | 否 | |
DeepSeek-R1 | deepseek-r1 | 【满血版】具备强大的推理能力,在数学、代码、自然语言推理等任务上,性能较高,能力较强。 | 是(思考模式不可关闭) | |
DeepSeek-V3 | deepseek-v3 | 自研MoE模型,在长文本、代码、数学、百科、中文 能力上表现优秀。 | 否 | |
DeepSeek | DeepSeek-R1 | deepseek-reasoner | 【满血版】具备强大的推理能力,在数学、代码、自然语言推理等任务上,性能较高,能力较强。 | 是(思考模式不可关闭) |
DeepSeek-V3 | deepseek-chat | 自研MoE模型,在长文本、代码、数学、百科、中文 能力上表现优秀。 | 否 | |
阿里云(AI Stack) | Qwen3-32B | Qwen3-32B | 通义千问开源版模型,在推理能力、人类偏好能力、Agent能力、多语言能力等方面表现优越。参数规模为32B(32亿)。 | 否 |