Dataphin系统内置了丰富的大模型,如阿里云(百炼)、DeepSeek等,以迎合市场多样化需求。本文为您介绍模型的相关信息。
部分模型支持深度思考模式,若不可关闭思考模式,会在表格中进行说明。
模型服务商 | 模型展示名 | 模型ID | 模型说明 | 是否支持深度思考 |
阿里云(百炼) | 通义千问-Max | qwen-max | 通义千问系列效果最好的模型,适合复杂、多步骤的任务。 | 否 |
通义千问-Max-Latest | qwen-max-latest | 通义千问系列效果最好的模型,适合复杂、多步骤的任务。始终与最新快照版能力相同。 | 否 | |
通义千问-Plus | qwen-plus | 能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务。 | 是 | |
通义千问-Plus-Latest | qwen-plus-latest | 能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务。始终与最新快照版能力相同。 | 是 | |
通义千问-Long | qwen-long | 通义千问系列上下文窗口最长,能力均衡且成本较低的模型,适合长文本分析、信息抽取、总结摘要和分类打标等任务。 | 否 | |
通义千问-Long-Latest | qwen-long-latest | 通义千问系列上下文窗口最长,能力均衡且成本较低的模型,适合长文本分析、信息抽取、总结摘要和分类打标等任务。始终与最新快照版能力相同。 | 否 | |
Qwen3-32b | qwen3-32b | 通义千问开源版模型,在推理能力、人类偏好能力、Agent能力、多语言能力等方面表现优越。参数规模为32B(32亿)。 | 是 | |
Qwen3-235b-a22b | qwen3-235b-a22b | 通义千问开源版模型,在推理能力、人类偏好能力、Agent能力、多语言能力等方面表现优越。参数规模为235B(235亿)。 | 是 | |
通义千问Coder | qwen-coder-plus | 通义千问代码模型。 | 否 | |
DeepSeek-R1 | deepseek-r1 | 【满血版】具备强大的推理能力,在数学、代码、自然语言推理等任务上,性能较高,能力较强。 | 是(思考模式不可关闭) | |
DeepSeek-V3 | deepseek-v3 | 自研MoE模型,在长文本、代码、数学、百科、中文能力上表现优秀。 | 否 | |
DeepSeek-V3.1 | deepseek-v3.1 | 2025年8月20日发布的685B满血版模型;在长文本、代码、数学、百科、中文能力上表现优秀。 | 否 | |
Kimi-K2 | Moonshot-Kimi-K2-Instruct | Kimi系列模型是由月之暗面公司(Moonshot AI)推出的MoE语言模型,在前沿知识、推理和编码任务中表现出卓越性能。 | 否 | |
Qwen3-Next-80B-A3B(Thinking) | qwen3-next-80b-a3b-thinking | 基于Qwen3的新一代思考模式开源模型,相较上一版本(通义千问3-235B-A22B-Thinking-2507)指令遵循能力有提升、模型总结回复更加精简。 | 是(思考模式不可关闭) | |
Qwen3-Next-80B-A3B(Instruct) | qwen3-next-80b-a3b-instruct | 基于Qwen3的新一代非思考模式开源模型,相较上一版本(通义千问3-235B-A22B-Instruct-2507)中文文本理解能力更佳、逻辑推理能力有增强、文本生成类任务表现更好。 | 否 | |
Qwen3-235B-A22B(Thinking-2507) | qwen3-235b-a22b-thinking-2507 | 基于Qwen3的新一代思考模式开源模型,qwen3-235b-a22b(思考模式)的升级版。 | 是(思考模式不可关闭) | |
Qwen3-235B-A22B(Instruct-2507) | qwen3-235b-a22b-instruct-2507 | 基于Qwen3的新一代非思考模式开源模型,qwen3-235b-a22b(非思考模式)的升级版。 | 否 | |
DeepSeek | DeepSeek-思考模式 | deepseek-reasoner | 【满血版】具备强大的推理能力,在数学、代码、自然语言推理等任务上,性能较高,能力较强。 | 是(思考模式不可关闭) |
DeepSeek-非思考模式 | deepseek-chat | 自研MoE模型,在长文本、代码、数学、百科、中文能力上表现优秀。 | 否 | |
阿里云(AI Stack) | Qwen3-32B | Qwen3-32B | 通义千问开源版模型,在推理能力、人类偏好能力、Agent能力、多语言能力等方面表现优越。参数规模为32B(32亿)。 | 否 |
Qwen3-235B-A22B-Instruct-2507 | Qwen3-235B-A22B-Instruct-2507 | 通义千问系列的一个高性能语言模型,专为复杂任务设计。该模型于2025年7月发布,是Qwen3-235B-A22B的升级版本,支持“非思考模式”。它在推理能力、通用能力和工具调用方面表现出色,适用于需要高精度和复杂逻辑处理的场景。 | 否 |