模型大全规格参数与计费-大模型服务平台百炼-阿里云-大模型服务平台百炼(Model Studio)-阿里云帮助中心

阿里云百炼提供了丰富多样的模型选择，它集成了通义系列大模型和第三方大模型，涵盖文本、图像、音视频等不同模态。

旗舰模型

中国大陆（北京）

旗舰模型	通义千问Max 适合复杂任务，能力最强	通义千问Plus 效果、速度、成本均衡	通义千问Flash 适合简单任务，速度快、成本低	通义千问Coder 卓越的代码模型，擅长工具调用和环境交互
最大上下文长度 ^{（Token数）}	262,144	1,000,000	1,000,000	1,000,000
最低输入价格 ^{（每千Token）}	0.0032元	0.0008元	0.00015元	0.001元
最低输出价格 ^{（每千Token）}	0.0128元	0.002元	0.0015元	0.004元

国际（新加坡）

旗舰模型	通义千问Max 适合复杂任务，能力最强	通义千问Plus 效果、速度、成本均衡	通义千问Flash 适合简单任务，速度快、成本低	通义千问Coder 卓越的代码模型，擅长工具调用和环境交互
最大上下文长度 ^{（Token数）}	262,144	1,000,000	1,000,000	1,000,000
最低输入价格 ^{（每千Token）}	0.008807元	0.002936元	0.000367元	0.002202元
最低输出价格 ^{（每千Token）}	0.044035元	0.008807元	0.002936元	0.011009元

关于详细参数以及更多大模型，请查看下方的表格。

模型总览

中国大陆（北京）

类别	子类别	说明
文本生成	通用大语言模型	通义千问大语言模型：商业版（通义千问Max、通义千问Plus、通义千问Flash）、开源版（Qwen3、Qwen2.5）、超长文档模型通义千问Long 第三方模型：DeepSeek、Kimi、GLM等。
	多模态模型	视觉理解模型通义千问VL、视觉推理模型QVQ、音频理解模型通义千问Audio、全模态模型通义千问Omni、实时多模态模型通义千问Omni-Realtime
	领域模型	代码模型、数学模型、翻译模型、法律模型、数据挖掘模型、深入研究模型、意图理解模型、角色扮演模型
图像生成	文生图	通用模型：通义千问文生图：在复杂文本渲染方面表现突出，特别是中英文文本渲染。通义万相文生图：适用于生成证件照、电商主图、模特图、各种风格人像图（动漫、国风、二次元等）。通义-文生图-Z-Image：轻量级文生图模型，可快速生成高质量图像，支持中英双语渲染、复杂语义理解和多风格题材。第三方模型：Stable Diffusion和FLUX。更多模型：创意海报生成、创意文字生成-WordArt锦书
图像生成	图像编辑	通用模型：通义千问图像编辑：支持中英文提示词输入，可实现风格迁移、文字修改、物体编辑等复杂图文编辑操作。通义万相图像编辑：适用于扩图、去水印、风格迁移、背景生成、图像修复、图像美化等场景。更多模型：通义千问图像翻译、通义万相涂鸦作画、通义万相图像局部重绘、人像风格重绘、图像背景生成、图像画面扩展、图像画面扩展、人物实例分割、图像擦除补全、虚拟模特、鞋靴模特、人物写真生成-FaceChain、AI试衣
语音合成与识别	语音合成	通义千问实时语音合成、通义千问语音合成、CosyVoice语音合成和Sambert语音合成可实现文本转语音，适用于智能语音客服、有声读物、车载导航、教育辅导等场景。
语音合成与识别	语音识别/翻译	通义千问实时语音识别、通义千问录音文件识别、Fun-ASR语音识别、Gummy语音识别/翻译、Paraformer语音识别和SenseVoice语音识别可实现语音转文本，适用于实时会议记录、实时直播字幕、电话客服等场景。此外，Gummy语音识别/翻译还支持语音翻译。
视频编辑与生成	文生视频	文生视频：一句话生成视频，视频风格丰富，画质细腻。
	图生视频	首帧生视频：以输入图像作为视频首帧，结合提示词生成完整视频。首尾帧生视频：提供首帧与尾帧图像，结合提示词生成过渡自然的视频。多图生视频：支持输入一张或多张图片，参考图片中的主体或背景，并结合提示词生成视频。图+动作模板生成舞蹈视频：舞动人像AnimateAnyone基于人物图片和动作视频生成舞蹈视频。图+音频生成对口型视频通义万相-数字人基于人物图片和音频，动作幅度大且自然，支持全身、半身、肖像等多种画幅，适合唱歌、表演等场景。悦动人像EMO基于人物图片和音频，口型与表情表现力强，支持肖像、半身，适合人物特写场景。灵动人像LivePortrait基于人物图片和音频，适合语音播报场景。图+表情模板生成表情包视频：表情包Emoji基于人脸图片和预设的人脸动态模板，生成人脸表情包视频。
	视频编辑	通用视频编辑：基于输入的文本提示词、图片和视频，可执行多种视频编辑任务。例如，通过提取输入视频的运动特征，并结合提示词生成新的视频。视频口型替换：声动人像VideoRetalk基于人物视频和音频，适合短视频制作、视频翻译等场景。视频风格转换：视频风格重绘可将视频转换为日式漫画、美式漫画等风格。
向量	文本向量	将文本转换成一组可以代表文字的数字，用于搜索、聚类、推荐、分类等。
向量	多模态向量	将文本、图像、语音转换成一组数字，用于音视频分类、图像分类、图文检索等。
行业	通义法睿	适用于法律咨询、案例分析和法规解读等。
行业	意图理解	意图理解模型能够在毫秒级时间内解析用户意图，并选择合适工具来解决用户问题。

国际（新加坡）

类别	子类别	说明
文本生成	通用大语言模型	通义千问大语言模型：商业版（通义千问Max、通义千问Plus、通义千问Flash）、开源版（Qwen3、Qwen2.5）
	多模态模型	视觉理解模型通义千问VL、视觉推理模型QVQ、全模态模型通义千问Omni、实时多模态模型通义千问Omni-Realtime
	领域模型	代码模型、翻译模型、角色扮演模型
图像生成	文生图	通义千问文生图：在复杂文本渲染方面表现突出，特别是中英文文本渲染。通义万相文生图：一句话生成精美图像。
图像生成	图像编辑	通义千问图像编辑：支持中英文提示词输入，可实现风格迁移、文字修改、物体编辑等复杂图文编辑操作。
视频生成	文生视频	文生视频：一句话生成视频，视频风格丰富，画质细腻。
	图生视频	首帧生视频：以输入图像作为视频首帧，结合提示词生成完整视频。首尾帧生视频：提供首帧与尾帧图像，结合提示词生成过渡自然的视频。多图生视频：支持输入一张或多张图片，参考图片中的主体或背景，并结合提示词生成视频。
	视频编辑	通用视频编辑：基于输入的文本提示词、图片和视频，可执行多种视频编辑任务。例如，通过提取输入视频的运动特征，并结合提示词生成新的视频。
向量	文本向量	将文本转换成一组可以代表文字的数字，用于搜索、聚类、推荐、分类等。

文本生成-通义千问

以下为通义千问商业版模型。相比开源版，商业版具有更新的能力和优化。

商业版暂不透出参数规模。

若有高并发需求，建议优先使用稳定版或最新版，限流条件更宽松。

稳定版模型会不定期更新升级。若需使用固定版本，请选择快照版本。

通义千问Max

通义千问系列效果最好的模型，适合复杂、多步骤的任务。使用方法 | API参考 | 在线体验

中国大陆（北京）

模型名称	版本	模式	上下文长度	最大输入	最长思维链	最大输出	输入成本	输出成本	免费额度（注）
			（Token数）				（每千Token）
qwen3-max 当前与qwen3-max-2025-09-23能力相同 Batch调用半价	稳定版	仅非思考	262,144	258,048	-	65,536	阶梯计价，请参见表格下方说明。		各100万Token 有效期：百炼开通后90天内
qwen3-max-2025-09-23	快照版	仅非思考
qwen3-max-preview	预览版	思考			81,920	32,768
		非思考			-	65,536

以上模型根据本次请求的输入 Token数，采取阶梯计费。

模型名称	单次请求的输入Token数	输入单价（每千Token）	输出单价（每千Token）思维链+回答
qwen3-max Batch调用半价上下文缓存享有折扣	0<Token≤32K	0.0032元	0.0128元
	32K<Token≤128K	0.0064元	0.0256元
	128K<Token≤252K	0.0096元	0.0384元
qwen3-max-2025-09-23	0<Token≤32K	0.006元	0.024元
	32K<Token≤128K	0.01元	0.04元
	128K<Token≤252K	0.015元	0.06元
qwen3-max-preview 上下文缓存享有折扣	0<Token≤32K	0.006元	0.024元
	32K<Token≤128K	0.01元	0.04元
	128K<Token≤252K	0.015元	0.06元

更多模型

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-max 当前与qwen-max-2024-09-19能力相同 Batch调用半价	稳定版	32,768	30,720	8,192	0.0024元	0.0096元	各100万Token 有效期：百炼开通后90天内
qwen-max-latest 始终与最新快照版能力相同 Batch调用半价	最新版	131,072	129,024
qwen-max-2025-01-25 又称qwen-max-0125、Qwen2.5-Max	快照版
qwen-max-2024-09-19 又称qwen-max-0919		32,768	30,720		0.02元	0.06元
qwen-max-2024-04-28 又称qwen-max-0428	快照版	8,000	6,000	2,000	0.04元	0.12元
qwen-max-2024-04-03 又称qwen-max-0403

国际（新加坡）

模型名称	版本	模式	上下文长度	最大输入	最长思维链	最大输出	输入成本	输出成本
			（Token数）				（每千Token）
qwen3-max 当前与qwen3-max-2025-09-23能力相同 Batch调用半价	稳定版	仅非思考	262,144	258,048	-	65,536	阶梯计价，请参见表格下方说明。
qwen3-max-2025-09-23	快照版	仅非思考
qwen3-max-preview	预览版	思考			81,920	32,768
		非思考			-	65,536

以上模型根据本次请求的输入 Token数，采取阶梯计费。

单次请求的输入Token数	输入价格（每千Token） qwen3-max、qwen3-max-preview 支持上下文缓存。	输出价格（每千Token）
0<Token≤32K	0.008807元	0.044035元
32K<Token≤128K	0.017614元	0.088071元
128K<Token≤252K	0.022018元	0.110089元

更多模型

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-max 当前与qwen-max-2025-01-25能力相同	稳定版	32,768	30,720	8,192	0.011743 Batch调用半价	0.046971 Batch调用半价	无免费额度
qwen-max-latest 始终与最新快照版能力相同	最新版				0.011743	0.046971
qwen-max-2025-01-25 又称qwen-max-0125、Qwen2.5-Max	快照版

金融云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

（Token数）

（每千Token）

qwen-max

稳定版

8,000

6,000

2,000

0.038元

Batch调用：0.019元

0.114元

Batch调用：0.057元

100万Token

有效期：百炼开通后90天内

qwen3-max-preview 模型的思考模式：在整体推理能力上显著提升，尤其在智能体编程、常识推理，以及数学、科学和通用任务方面表现更优。

qwen3-max与qwen3-max-2025-09-23模型原生支持search agent，请参见联网搜索。

通义千问Plus

能力均衡，推理效果、成本和速度介于通义千问Max和通义千问Flash之间，适合中等复杂任务。

使用方法 | API参考 | 在线体验｜思考模式

中国大陆（北京）

模型名称	版本	模式	上下文长度	最大输入	最长思维链	最大输出	输入成本	输出成本思维链+输出	免费额度（注）
			（Token数）				（每千Token）
qwen-plus 当前与qwen-plus-2025-07-28能力相同属于Qwen3系列 Batch调用半价	稳定版	思考	1,000,000	995,904 默认131,072，可通过max_input_tokens 参数调整	81,920	32,768	阶梯计价，请参见表格下方说明。		各100万Token 有效期：百炼开通后90天内
		非思考		997,952 默认131,072，可通过max_input_tokens 参数调整	-
qwen-plus-latest 当前与qwen-plus-2025-12-01能力相同属于Qwen3系列 Batch调用半价	最新版	思考		995,904	81,920
		非思考		997,952	-
qwen-plus-2025-12-01 属于Qwen3系列	快照版	思考		995,904	81,920
		非思考		997,952	-
qwen-plus-2025-09-11 属于Qwen3系列		思考		995,904	81,920
		非思考		997,952	-
qwen-plus-2025-07-28 又称qwen-plus-0728 属于Qwen3系列		思考		995,904	81,920
		非思考		997,952	-
qwen-plus-2025-07-14 又称qwen-plus-0714 属于Qwen3系列		思考	131,072	98,304	38,912	16,384	0.0008元	0.008元
		非思考		129,024	-			0.002元
qwen-plus-2025-04-28 又称qwen-plus-0428 属于Qwen3系列		思考		98,304	38,912			0.008元
		非思考		129,024	-			0.002元

qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11和qwen-plus-2025-07-28 根据本次请求输入的 Token数，采取阶梯计费。

单次请求的输入Token数	输入价格（每千Token）	模式	输出价格（每千Token）
0<Token≤128K	0.0008元	非思考模式	0.002元
0<Token≤128K	0.0008元	思考模式	0.008元
128K<Token≤256K	0.0024元	非思考模式	0.02元
128K<Token≤256K	0.0024元	思考模式	0.024元
256K<Token≤1M	0.0048元	非思考模式	0.048元
256K<Token≤1M	0.0048元	思考模式	0.064元

上述模型支持思考模式和非思考模式，您可以通过 enable_thinking 参数实现两种模式的切换。除此之外，模型的能力得到了大幅提升：

推理能力：在数学、代码和逻辑推理等评测中，显著超过 QwQ 和同尺寸的非推理模型，达到同规模业界顶尖水平。
人类偏好能力：创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升，通用能力显著超过同尺寸模型。
Agent 能力：在思考、非思考两种模式下都达到业界领先水平，能精准调用外部工具。
多语言能力：支持100多种语言和方言，多语言翻译、指令理解、常识推理能力都明显提升。
回复格式：修复了之前版本存在的回复格式的问题，如异常 Markdown、中间截断、错误输出 boxed 等问题。

对于上述模型，开启思考模式时如果没有输出思考过程，按非思考模式价格进行收费。

更多模型

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-plus-2025-01-25 又称qwen-plus-0125	快照版	131,072	129,024	8,192	0.0008元	0.002元	各100万Token 有效期：百炼开通后90天内
qwen-plus-2025-01-12 又称qwen-plus-0112
qwen-plus-2024-12-20 又称qwen-plus-1220
qwen-plus-2024-11-27 又称qwen-plus-1127
qwen-plus-2024-11-25 又称qwen-plus-1125
qwen-plus-2024-09-19 又称qwen-plus-0919
qwen-plus-2024-08-06 又称qwen-plus-0806			128,000		0.004元	0.012元
qwen-plus-2024-07-23 又称qwen-plus-0723		32,000	30,000	8,000

国际（新加坡）

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-plus 当前与qwen-plus-2025-07-28能力相同属于Qwen3系列	稳定版	1,000,000	思考模式 995,904 非思考模式 997,952 默认262,144，可通过max_input_tokens 参数调整	32,768 思维链最长81,920	阶梯计价，请参见表格下方说明。		无免费额度
qwen-plus-latest 当前与qwen-plus-2025-12-01能力相同属于Qwen3系列	最新版		思考模式 995,904 非思考模式 997,952
qwen-plus-2025-12-01 属于Qwen3系列	快照版		思考模式 995,904 非思考模式 997,952

qwen-plus-2025-09-11 属于Qwen3系列
qwen-plus-2025-07-28 又称qwen-plus-0728 属于Qwen3系列
qwen-plus-2025-07-14 又称qwen-plus-0714 属于Qwen3系列		131,072	思考模式 98,304 非思考模式 129,024	16,384 思维链最长38,912	0.002936元	思考模式 0.029357元非思考模式 0.008807元
qwen-plus-2025-04-28 又称qwen-plus-0428 属于Qwen3系列
qwen-plus-2025-01-25 又称qwen-plus-0125			129,024	8,192		0.008807元

qwen-plus、qwen-plus-latest、qwen-plus-2025-12-01、qwen-plus-2025-09-11和qwen-plus-2025-07-28 根据本次请求输入的 Token数，采取阶梯计费。

单次请求的输入Token数	输入价格（每千Token）	模式	输出价格（每千Token）
0<Token≤256K	0.002936	非思考模式	0.008807元
0<Token≤256K	0.002936	思考模式	0.029357元
256K<Token≤1M	0.008807	非思考模式	0.026421元
256K<Token≤1M	0.008807	思考模式	0.088071元

金融云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

（Token数）

（每千Token）

qwen-plus

稳定版

131,072

128,000

8,192

0.00152元

Batch调用：0.00076元

0.0038元

Batch调用：0.0019元

100万Token

有效期：百炼开通后90天内

通义千问Flash

通义千问系列速度最快、成本极低的模型，适合简单任务。通义千问Flash采用灵活的阶梯定价，相比通义千问Turbo计费更合理。使用方法 | API参考 | 在线体验 | 思考模式

中国大陆（北京）

模型名称	版本	模式	上下文长度	最大输入	最长思维链	最大输出	输入成本	输出成本思维链+输出	免费额度（注）
			（Token数）				（每千Token）
qwen-flash 当前与 qwen-flash-2025-07-28能力相同属于Qwen3系列 Batch调用半价	稳定版	思考	1,000,000	995,904	81,920	32,768	阶梯计价，请参见表格下方说明。		各100万Token 有效期：百炼开通后90天内
		非思考		997,952	-
qwen-flash-2025-07-28 属于Qwen3系列	快照版	思考		995,904	81,920
		非思考		997,952	-

以上模型根据本次请求输入的 Token数采取阶梯计费，其中qwen-flash支持缓存和 Batch调用。

单次请求的输入Token数	输入价格（每千Token）	输出价格（每千Token）
0<Token≤128K	0.00015元	0.0015元
128K<Token≤256K	0.0006元	0.006元
256K<Token≤1M	0.0012元	0.012元

上述模型均支持思考模式和非思考模式，可通过 enable_thinking 参数实现两种模式的切换。

国际（新加坡）

模型名称	版本	模式	上下文长度	最大输入	最长思维链	最大输出	输入成本	输出成本思维链+输出	免费额度（注）
			（Token数）				（每千Token）
qwen-flash 当前与 qwen-flash-2025-07-28能力相同属于Qwen3系列 Batch调用半价	稳定版	思考	1,000,000	995,904	81,920	32,768	阶梯计价，请参见表格下方说明。		各100万Token 有效期：百炼开通后90天内
		非思考		997,952	-
qwen-flash-2025-07-28 属于Qwen3系列	快照版	思考		995,904	81,920
		非思考		997,952	-

以上模型根据本次请求输入的 Token数采取阶梯计费，其中qwen-flash支持缓存和 Batch调用。

单次请求的输入Token数	输入价格（每千Token）	输出价格（每千Token）
0<Token≤256K	0.000367元	0.002936元
256K<Token≤1M	0.001835元	0.014678元

上述模型均支持思考模式和非思考模式，可通过 enable_thinking 参数实现两种模式的切换。

通义千问Turbo

通义千问Turbo 后续不再更新，建议替换为通义千问Flash。通义千问Flash采用灵活的阶梯定价，计费更合理。使用方法 | API参考 | 在线体验｜思考模式

中国大陆（北京）

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-turbo 当前与 qwen-turbo-2025-04-28能力相同属于Qwen3系列 Batch调用半价	稳定版	思考模式 131,072 非思考模式 1,000,000	思考模式 98,304 非思考模式 1,000,000	16,384 思维链最长38,912	0.0003元	思考模式 0.003元非思考模式 0.0006元	各100万Token 有效期：百炼开通后90天内
qwen-turbo-latest 始终与最新快照版能力相同属于Qwen3系列 Batch调用半价	最新版
qwen-turbo-2025-07-15 又称qwen-turbo-0715 属于Qwen3系列	快照版
qwen-turbo-2025-04-28 又称qwen-turbo-0428 属于Qwen3系列

国际（新加坡）

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-turbo 当前与qwen-turbo-2025-04-28能力相同属于Qwen3系列	稳定版	思考模式 131,072 非思考模式 1,000,000	思考模式 98,304 非思考模式 1,000,000	16,384 思维链最长38,912	0.000367元 Batch调用半价	思考模式：0.00367元非思考模式：0.001468元 Batch调用半价	无免费额度
qwen-turbo-latest 始终与最新快照版能力相同属于Qwen3系列	最新版				0.000367元	思考模式：0.00367元非思考模式：0.001468元
qwen-turbo-2025-04-28 又称qwen-turbo-0428 属于Qwen3系列	快照版
qwen-turbo-2024-11-01 又称qwen-turbo-1101		1,000,000	1,000,000	8,192		0.001468元

上述模型均支持思考模式和非思考模式，可通过 enable_thinking 参数实现两种模式的切换。开启思考模式时如果没有输出思考过程，按非思考模式价格进行收费。

更多模型

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-turbo-2025-02-11 又称qwen-turbo-0211	快照版	1,000,000	1,000,000	8,192	0.0003元	0.0006元	各100万Token 有效期：百炼开通后90天内
qwen-turbo-2024-11-01 又称qwen-turbo-1101							1000万Token 有效期：百炼开通后90天内
qwen-turbo-2024-09-19 又称qwen-turbo-0919		131,072	129,024				各100万Token 有效期：百炼开通后90天内
qwen-turbo-2024-06-24 又称qwen-turbo-0624		8,000	6,000	2,000	0.002元	0.006元

QwQ

基于 Qwen2.5 模型训练的 QwQ 推理模型，通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标（AIME 24/25、LiveCodeBench）以及部分通用指标（IFEval、LiveBench等）达到DeepSeek-R1 满血版水平。使用方法

中国大陆（北京）

模型名称	版本	上下文长度	最大输入	最大思维链长度	最大回复长度	输入成本	输出成本思维链+输出	免费额度（注）
		（Token数）				（每千Token）
qwq-plus 当前与qwq-plus-2025-03-05能力相同 Batch调用半价	稳定版	131,072	98,304	32,768	8,192	0.0016元	0.004元	各100万 Token 有效期：百炼开通后90天内
qwq-plus-latest 始终与最新快照版能力相同	最新版					0.0016元	0.004元
qwq-plus-2025-03-05 又称qwq-plus-0305	快照版

国际（新加坡）

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

（注）

（Token数）

（每千Token）

qwq-plus

稳定版

131,072

98,304

32,768

8,192

0.005871元

0.017614元

无免费额度

通义千问Long

通义千问系列上下文窗口最长，能力均衡且成本较低的模型，适合长文本分析、信息抽取、总结摘要和分类打标等任务。使用方法 | 在线体验

中国大陆（北京）

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-long	稳定版	10,000,000	10,000,000	32,768	0.0005元 Batch调用半价	0.002元 Batch调用半价	各100万Token 有效期：百炼开通后90天内
qwen-long-latest 始终与最新快照版能力相同	最新版
qwen-long-2025-01-25 又称qwen-long-0125	快照版				0.0005元	0.002元

通义千问Omni

Qwen-Omni 模型能够接收文本、图片、音频、视频等多种模态的组合输入，并生成文本或语音形式的回复，提供多种拟人音色，支持多语言和方言的语音输出，可应用于文本创作、视觉识别、语音助手等场景。使用方法｜API 参考

中国大陆（北京）

模型名称	版本	模式	上下文长度	最大输入	最长思维链	最大输出	免费额度（注）
			（Token数）
qwen3-omni-flash 当前与qwen3-omni-flash-2025-09-15能力相同	稳定版	思考模式	65,536	16,384	32,768	16,384	各100万Token（不区分模态）有效期：百炼开通后90天内
		非思考模式		49,152	-
qwen3-omni-flash-2025-12-01	快照版	思考模式	65,536	16,384	32,768	16,384
		非思考模式		49,152	-
qwen3-omni-flash-2025-09-15 又称qwen3-omni-flash-0915		思考模式	65,536	16,384	32,768	16,384
		非思考模式		49,152	-

免费额度用完后，输入与输出的计费规则如下，思考与非思考模式的计费相同，且思考模式下不支持输出音频。

输入计费项	单价（每千 Token）
输入：文本	0.0018元
输入：音频	0.0158元
输入：图片/视频	0.0033元

输出计费项

单价（每千 Token）

输出：文本

0.0069元（输入仅包含文本时）

0.0127元（输入包含图片/视频/音频时）

输出：文本+音频

思考模式下无此项计费

0.0626元（音频）

输出的文本不计费。

更多模型

模型名称	版本	上下文长度	最大输入	最大输出	免费额度（注）
		（Token数）
qwen-omni-turbo 当前与qwen-omni-turbo-2025-03-26能力相同	稳定版	32,768	30,720	2,048	各100万Token（不区分模态）有效期：百炼开通后90天内
qwen-omni-turbo-latest 始终与最新快照版能力相同	最新版
qwen-omni-turbo-2025-03-26 又称qwen-omni-turbo-0326	快照版
qwen-omni-turbo-2025-01-19 又称qwen-omni-turbo-0119

免费额度用完后，输入与输出的计费规则如下，思考与非思考模式的计费相同，且思考模式下不支持输出音频。

输入计费项	单价（每千 Token）
输入：文本	0.0004元
输入：音频	0.025元
输入：图片/视频	0.0015元

输出计费项

单价（每千 Token）

输出：文本

0.0016元（输入仅包含文本时）

0.0045元（输入包含图片/视频/音频时）

输出：文本+音频

思考模式下无此项计费

0.05元（音频）

输出的文本不计费。

国际（新加坡）

模型名称	版本	模式	上下文长度	最大输入	最长思维链	最大输出	免费额度（注）
			（Token数）
qwen3-omni-flash 当前与qwen3-omni-flash-2025-09-15能力相同	稳定版	思考模式	65,536	16,384	32,768	16,384	无免费额度
		非思考模式		49,152	-
qwen3-omni-flash-2025-12-01	快照版	思考模式	65,536	16,384	32,768	16,384
		非思考模式		49,152	-
qwen3-omni-flash-2025-09-15 又称qwen3-omni-flash-0915	快照版	思考模式	65,536	16,384	32,768	16,384
		非思考模式		49,152	-

免费额度用完后，输入与输出的计费规则如下，思考与非思考模式的计费相同，且思考模式下不支持输出音频。

输入计费项	单价（每千 Token）
输入：文本	0.003156元
输入：音频	0.027962元
输入：图片/视频	0.005725元

输出计费项

单价（每千 Token）

输出：文本

0.012183元（输入仅包含文本时）

0.022458元（输入包含图片/视频/音频时）

输出：文本+音频

0.110896元（音频）

输出的文本不计费。

更多模型

模型名称	版本	上下文长度	最大输入	最大输出	免费额度（注）
		（Token数）
qwen-omni-turbo 当前与qwen-omni-turbo-2025-03-26能力相同	稳定版	32,768	30,720	2,048	无免费额度
qwen-omni-turbo-latest 始终与最新快照版能力相同	最新版
qwen-omni-turbo-2025-03-26 又称qwen-omni-turbo-0326	快照版

商业版模型的免费额度用完后，输入与输出的计费规则如下：

输入计费项	单价（每千 Token）
输入：文本	0.000514元
输入：音频	0.032586元
输入：图片/视频	0.001541元

输出计费项

单价（每千 Token）

输出：文本

0.001982元（输入仅包含文本时）

0.004624元（输入包含图片/视频/音频时）

输出：文本+音频

0.065246元（音频）

输出的文本不计费。

建议优先使用Qwen3-Omni-Flash模型，相较于Qwen-Omni-Turbo（后续不再更新），模型的能力得到大幅提升：

属于混合思考模型，支持思考模式和非思考模式，可通过 enable_thinking 参数实现两种模式的切换，默认不开启思考模式。
思考模式下不支持输出音频；在非思考模式下，对于模型输出的音频：
- qwen3-omni-flash-2025-12-01支持的音色增加至49种，qwen3-omni-flash-2025-09-15、qwen3-omni-flash支持的音色增加至 17 种，Qwen-Omni-Turbo 仅支持 4 种；
- 支持语言增加至 10 种，Qwen-Omni-Turbo 仅支持 2 种。

通义千问Omni-Realtime

相比于通义千问Omni，支持音频的流式输入，且内置 VAD（Voice Activity Detection，语音活动检测）功能，可自动检测用户语音的开始和结束。使用方法｜客户端事件｜服务端事件｜在线体验

中国大陆（北京）

模型名称	版本	上下文长度	最大输入	最大输出	免费额度（注）
		（Token数）
qwen3-omni-flash-realtime 当前能力等同 qwen3-omni-flash-realtime-2025-09-15	稳定版	65,536	49,152	16,384	各100万Token（不区分模态）有效期：百炼开通后90天内
qwen3-omni-flash-realtime-2025-12-01	快照版
qwen3-omni-flash-realtime-2025-09-15

免费额度用完后，输入与输出的计费规则如下：

输入计费项	单价（每千 Token）
输入：文本	0.0022元
输入：音频	0.0189元
输入：图片	0.0039元

输出计费项

单价（每千 Token）

输出：文本

0.0083元（输入仅包含文本时）

0.0152元（输入包含图片/音频时）

输出：文本+音频

0.0751元（音频）

输出的文本不计费。

更多模型

模型名称	版本	上下文长度	最大输入	最大输出	免费额度（注）
		（Token数）
qwen-omni-turbo-realtime 当前能力等同 qwen-omni-turbo-realtime-2025-05-08	稳定版	32,768	30,720	2,048	各100万Token（不区分模态）有效期：百炼开通后90天内
qwen-omni-turbo-realtime-latest 能力始终等同最新快照版	最新版
qwen-omni-turbo-realtime-2025-05-08	快照版

免费额度用完后，输入与输出的计费规则如下：

输入计费项	单价（每千 Token）
输入：文本	0.0016元
输入：音频	0.025元
输入：图片	0.006元

输出计费项

单价（每千 Token）

输出：文本

0.0064元（输入仅包含文本时）

0.018元（输入包含图片/音频时）

输出：文本+音频

0.05元（音频）

输出的文本不计费。

国际（新加坡）

模型名称	版本	上下文长度	最大输入	最大输出	免费额度（注）
		（Token数）
qwen3-omni-flash-realtime 当前能力等同 qwen3-omni-flash-realtime-2025-09-15	稳定版	65,536	49,152	16,384	无免费额度
qwen3-omni-flash-realtime-2025-12-01	快照版
qwen3-omni-flash-realtime-2025-09-15

免费额度用完后，输入与输出的计费规则如下：

输入计费项	单价（每千 Token）
输入：文本	0.003816元
输入：音频	0.03354元
输入：图片	0.006899元

输出计费项

单价（每千 Token）

输出：文本

0.014605元（输入仅包含文本时）

0.026935元（输入包含图片/音频时）

输出：文本+音频

0.13306元（音频）

输出的文本不计费。

更多模型

模型名称	版本	上下文长度	最大输入	最大输出	免费额度（注）
		（Token数）
qwen-omni-turbo-realtime 当前能力等同 qwen-omni-turbo-realtime-2025-05-08	稳定版	32,768	30,720	2,048	无免费额度
qwen-omni-turbo-realtime-latest 能力始终等同最新快照版	最新版
qwen-omni-turbo-realtime-2025-05-08	快照版

输入与输出的计费规则如下：

输入计费项	单价（每千 Token）
输入：文本	0.001982元
输入：音频	0.032586元
输入：图片	0.006165元

输出计费项

单价（每千 Token）

输出：文本

0.007853元（输入仅包含文本时）

0.018495元（输入包含图片/音频时）

输出：文本+音频

0.065246元（音频）

输出的文本不计费。

建议优先使用Qwen3-Omni-Flash-Realtime 模型，相较于Qwen-Omni-Turbo-Realtime（后续不再更新），模型的能力得到大幅提升。对于模型输出的音频：

qwen3-omni-flash-realtime-2025-12-01支持的音色增加至49种，qwen3-omni-flash-realtime-2025-09-15、qwen3-omni-realtime-flash支持的音色增加至 17 种，Qwen-Omni-Turbo-Realtime 仅支持 4 种
支持的语言增加至 10 种，Qwen-Omni-Turbo-Realtime 仅支持 2 种

QVQ

QVQ是视觉推理模型，支持视觉输入及思维链输出，在数学、编程、视觉分析、创作以及通用任务上都表现了更强的能力。使用方法 | 在线体验

中国大陆（北京）

模型名称	版本	上下文长度	最大输入	最大思维链长度	最大回复长度	输入成本	输出成本	免费额度（注）
		（Token数）				（每千Token）
qvq-max 相比 qvq-plus 具有更强的视觉推理和指令遵循能力，在更多复杂任务中提供最佳性能。当前与qvq-max-2025-03-25能力相同	稳定版	131,072	106,496 单图最大16384	16,384	8,192	0.008元	0.032元	各100万 Token 有效期：百炼开通后90天内
qvq-max-latest 始终与最新快照版能力相同	最新版
qvq-max-2025-05-15 又称qvq-max-0515	快照版
qvq-max-2025-03-25 又称qvq-max-0325
qvq-plus 当前与qvq-plus-2025-05-15能力相同	稳定版					0.002元	0.005元
qvq-plus-latest 始终与最新快照版能力相同	最新版
qvq-plus-2025-05-15 又称qvq-plus-0515	快照版

国际（新加坡）

模型名称	版本	上下文长度	最大输入	最大思维链长度	最大回复长度	输入成本	输出成本	免费额度（注）
		（Token数）				（每千Token）
qvq-max 当前与 qvq-max-2025-03-25能力相同	稳定版	131,072	106,496 单图最大16384	16,384	8,192	0.008807元	0.035228元	无免费额度
qvq-max-latest 始终与最新快照版能力相同	最新版
qvq-max-2025-03-25 又称qvq-max-0325	快照版

通义千问VL

通义千问VL是具有视觉（图像）理解能力的文本生成模型，不仅能进行OCR（图片文字识别），还能进一步总结和推理，例如从商品照片中提取属性，根据习题图进行解题等。使用方法 | API参考 | 在线体验

通义千问VL模型按输入和输出的总Token数进行计费。图像Token的计算规则视觉理解。

中国大陆（北京）

模型名称	版本	模式	上下文长度	最大输入	最长思维链	最大输出	输入成本	输出成本思维链+输出	免费额度（注）
			（Token数）				（每千Token）
qwen3-vl-plus 当前与qwen3-vl-plus-2025-09-23能力相同 Batch调用半价	稳定版	思考	262,144	258,048 单图最大16384	81,920	32,768	阶梯计价，请参见表格下方说明。		各100万Token 有效期：百炼开通后90天内
		非思考		260,096 单图最大16384	-
qwen3-vl-plus-2025-12-19	快照版	思考		258,048 单图最大16384	81,920
		非思考		260,096 单图最大16384	-
qwen3-vl-plus-2025-09-23	快照版	思考		258,048 单图最大16384	81,920
		非思考		260,096 单图最大16384	-
qwen3-vl-flash 当前与qwen3-vl-flash-2025-10-15能力相同 Batch调用半价	稳定版	思考		258,048 单图最大16384	81,920
		非思考		260,096 单图最大16384	-
qwen3-vl-flash-2025-10-15	快照版	思考		258,048 单图最大16384	81,920
		非思考		260,096 单图最大16384	-

以上模型根据本次请求输入的 Token数，采取阶梯计费。思考模式与非思考模式的输入输出价格相同。

qwen3-vl-plus系列

单次请求的输入Token数	输入价格（每千Token）	输出价格（每千Token）
0<Token≤32K	0.001元	0.01元
32K<Token≤128K	0.0015元	0.015元
128K<Token≤256K	0.003元	0.03元

qwen3-vl-flash系列

单次请求的输入Token数	输入价格（每千Token）	输出价格（每千Token）
0<Token≤32K	0.00015元	0.0015元
32K<Token≤128K	0.0003元	0.003元
128K<Token≤256K	0.0006元	0.006元

更多模型

通义千问VL-Max系列

qwen-vl-max-2025-01-25及以后更新的模型均属于Qwen2.5-VL系列。

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-vl-max 相比qwen-vl-plus再次提升视觉推理和指令遵循能力，在更多复杂任务中提供最佳性能。当前与qwen-vl-max-2025-08-13能力相同	稳定版	131,072	129,024 单图最大16384	8,192	0.0016元 Batch调用半价	0.004元 Batch调用半价	各100万Token 有效期：百炼开通后90天内
qwen-vl-max-latest 始终与最新快照版能力相同	最新版
qwen-vl-max-2025-08-13 又称qwen-vl-max-0813 视觉理解指标全面提升，数学、推理、物体识别、多语言处理能力显著增强。	快照版				0.0016元	0.004元
qwen-vl-max-2025-04-08 又称qwen-vl-max-0408 增强数学和推理能力					0.003元	0.009元
qwen-vl-max-2025-04-02 又称qwen-vl-max-0402 显著提高解决复杂数学问题的准确性
qwen-vl-max-2025-01-25 又称qwen-vl-max-0125 升级至Qwen2.5-VL系列，扩展上下文至128k，显著增强图像和视频的理解能力
qwen-vl-max-2024-12-30 又称qwen-vl-max-1230		32,768	30,720 单图最大16384	2,048	0.003元	0.009元
qwen-vl-max-2024-11-19 又称qwen-vl-max-1119
qwen-vl-max-2024-10-30 又称qwen-vl-max-1030					0.02元
qwen-vl-max-2024-08-09 又称qwen-vl-max-0809

通义千问VL-Plus系列

qwen-vl-plus-2025-01-25及以后更新的模型均属于Qwen2.5-VL系列。

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-vl-plus 当前与qwen-vl-plus-2025-08-15能力相同	稳定版	131,072	129,024 单图最大16384	8,192	0.0008元 Batch调用半价	0.002元 Batch调用半价	各100万Token 有效期：百炼开通后90天内
qwen-vl-plus-latest 始终与最新快照版能力相同	最新版
qwen-vl-plus-2025-08-15 又称qwen-vl-plus-0815 在物体识别与定位、多语言处理的能力上有显著提升	快照版				0.0008元	0.002元
qwen-vl-plus-2025-07-10 又称qwen-vl-plus-0710 进一步提升监控视频内容的理解能力		32,768	30,720 单图最大16384		0.00015元	0.0015元
qwen-vl-plus-2025-05-07 又称qwen-vl-plus-0507 显著提升数学、推理、监控视频内容的理解能力		131,072	129,024 单图最大16384		0.0015元	0.0045元
qwen-vl-plus-2025-01-25 又称qwen-vl-plus-0125 升级至Qwen2.5-VL系列，扩展上下文至128k，显著增强图像和视频理解能力
qwen-vl-plus-2025-01-02 又称qwen-vl-plus-0102		32,768	30,720 单图最大16384	2,048	0.0015元	0.0045元
qwen-vl-plus-2024-08-09 又称qwen-vl-plus-0809

国际（新加坡）

模型名称	版本	模式	上下文长度	最大输入	最长思维链	最大输出	输入成本	输出成本思维链+输出	免费额度（注）
			（Token数）				（每千Token）
qwen3-vl-plus 当前与qwen3-vl-plus-2025-09-23能力相同	稳定版	思考	262,144	258,048 单图最大16384	81,920	32,768	阶梯计价，请参见表格下方说明。		无免费额度
		非思考		260,096 单图最大16384	-
qwen3-vl-plus-2025-12-19	快照版	思考		258,048 单图最大16384	81,920
		非思考		260,096 单图最大16384	-
qwen3-vl-plus-2025-09-23	快照版	思考		258,048 单图最大16384	81,920
		非思考		260,096 单图最大16384	-
qwen3-vl-flash 当前与qwen3-vl-flash-2025-10-15能力相同	稳定版	思考		258,048 单图最大16384	81,920
		非思考		260,096 单图最大16384	-
qwen3-vl-flash-2025-10-15	快照版	思考		258,048 单图最大16384	81,920
		非思考		260,096 单图最大16384	-

以上模型根据本次请求输入的 Token数，采取阶梯计费。思考模式与非思考模式的输入输出价格相同。

qwen3-vl-plus系列

单次请求的输入Token数	输入价格（每千Token）	输出价格（每千Token）
0<Token≤32K	0.001468元	0.011743元
32K<Token≤128K	0.002202元	0.017614 元
128K<Token≤256K	0.004404元	0.035228元

qwen3-vl-flash系列

单次请求的输入Token数	输入价格（每千Token）	输出价格（每千Token）
0<Token≤32K	0.000367元	0.002936元
32K<Token≤128K	0.00055元	0.004404元
128K<Token≤256K	0.000881元	0.007046元

更多模型

通义千问VL-Max系列

以下模型均属于Qwen2.5-VL系列。

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-vl-max 相比qwen-vl-plus再次提升视觉推理和指令遵循能力，在更多复杂任务中提供最佳性能。当前与qwen-vl-max-2025-08-13能力相同	稳定版	131,072	129,024 单图最大16384	8,192	0.005871元 Batch调用半价	0.023486 Batch调用半价	无免费额度
qwen-vl-max-latest 始终与最新快照版能力相同	最新版				0.005871元	0.023486元
qwen-vl-max-2025-08-13 又称qwen-vl-max-0813 视觉理解指标全面提升，数学、推理、物体识别、多语言处理能力显著增强。	快照版
qwen-vl-max-2025-04-08 又称qwen-vl-max-0408 属于Qwen2.5-VL系列模型，扩展上下文至128k，显著增强数学和推理能力。

通义千问VL-Plus系列

以下模型均属于Qwen2.5-VL系列。

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-vl-plus 当前与qwen-vl-plus-2025-08-15能力相同	稳定版	131,072	129,024 单图最大16384	8,192	0.001541元 Batch调用半价	0.004624元 Batch调用半价	无免费额度
qwen-vl-plus-latest 始终与最新快照版能力相同	最新版				0.001541元	0.004624元
qwen-vl-plus-2025-08-15 又称qwen-vl-plus-0815 在物体识别与定位、多语言处理的能力上有显著提升	快照版
qwen-vl-plus-2025-05-07 又称qwen-vl-plus-0507 显著提升数学、推理、监控视频内容的理解能力
qwen-vl-plus-2025-01-25 又称qwen-vl-plus-0125 属于Qwen2.5-VL系列模型，扩展上下文至128k，显著增强图像和视频的理解能力。

通义千问OCR

通义千问OCR模型是专用于文字提取的模型。相较于通义千问VL模型，它更专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种语言，包括英语、法语、日语、韩语、德语、俄语和意大利语等。使用方法 | API参考｜在线体验

中国大陆（北京）

模型名称	版本	上下文长度	最大输入	最大输出	输入单价	输出单价	免费额度（注）
		（Token数）			（每千Token）
qwen-vl-ocr 当前与qwen-vl-ocr-2025-08-28能力相同 Batch 调用半价	稳定版	34,096	30,000 单图最大30000	4,096	0.005元	0.005元	各100万Token 有效期：百炼开通后90天内
qwen-vl-ocr-latest 始终与最新版能力相同 Batch 调用半价	最新版	38,192		8,192	0.0003元	0.0005元
qwen-vl-ocr-2025-11-20 基于Qwen3-VL架构，大幅提升文档解析、文字定位能力。	快照版
qwen-vl-ocr-2025-08-28 又称qwen-vl-ocr-0828		34,096		4,096	0.005元	0.005元
qwen-vl-ocr-2025-04-13 又称qwen-vl-ocr-0413
qwen-vl-ocr-2024-10-28 又称qwen-vl-ocr-1028

国际（新加坡）

模型名称	版本	上下文长度	最大输入	最大输出	输入单价	输出单价	免费额度（注）
模型名称	版本	（Token数）			（每千Token）		免费额度（注）
qwen-vl-ocr	稳定版	34,096	30,000 单图最大30000	4,096	0.005284元	0.005284元	无免费额度
qwen-vl-ocr-2025-11-20 又称qwen-vl-ocr-1120 基于Qwen3-VL架构，大幅提升文档解析、文字定位能力。	快照版	38,192	30,000 单图最大30000	8,192	0.000514元	0.001174元	无免费额度

通义千问Audio

通义千问Audio是音频理解模型，支持输入多种音频（人类语音、自然音、音乐、歌声）和文本，并输出文本。该模型不仅能对输入的音频进行转录，还具备更深层次的语义理解、情感分析、音频事件检测、语音聊天等能力。使用方法

通义千问Audio模型按输入和输出的总Token数进行计费。

音频转换为Token的规则：每一秒钟的音频对应25个Token。若音频时长不足1秒，则按25个Token计算。

说明

仅支持中国大陆（北京）地域。

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-audio-turbo 当前等同qwen-audio-turbo-2024-08-07	稳定版	8,000	6,000	1,500	目前仅供免费体验。免费额度用完后不可调用，推荐使用Qwen-Omni作为替代模型		10万Token 有效期：阿里云百炼开通后90天内
qwen-audio-turbo-latest 始终等同最新快照版	最新版	8,192	6,144	2,048
qwen-audio-turbo-2024-12-04 又称qwen-audio-turbo-1204 较上个快照版本大幅提升语音识别准确率，且新增了语音聊天能力。	快照版
qwen-audio-turbo-2024-08-07 又称qwen-audio-turbo-0807		8,000	6,000	1,500

通义千问数学模型

通义千问数学模型是专门用于数学解题的语言模型。使用方法 | API参考 | 在线体验

说明

仅支持中国大陆（北京）地域。

模型名称	输入价格	输出价格	上下文长度	最大输入	最大输出	免费额度（注）
	（每千Token）		（Token数）
qwen-math-plus	0.004元	0.012元	4,096	3,072	3,072	各100万Token 有效期：百炼开通后90天内
qwen-math-turbo	0.002元	0.006元

通义千问Coder

通义千问代码模型。最新的 Qwen3-Coder-Plus 系列模型是基于 Qwen3 的代码生成模型，具有强大的Coding Agent能力，擅长工具调用和环境交互，能够实现自主编程，代码能力卓越的同时兼具通用能力。使用方法 | API参考 | 在线体验

中国大陆（北京）

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen3-coder-plus 当前与qwen3-coder-plus-2025-07-22能力相同	稳定版	1,000,000	997,952	65,536	阶梯计价，请参见表格下方说明。		各100万Token 有效期：百炼开通后90天内
qwen3-coder-plus-2025-09-23	快照版
qwen3-coder-plus-2025-07-22	快照版
qwen3-coder-flash 当前与qwen3-coder-flash-2025-07-28能力相同	稳定版
qwen3-coder-flash-2025-07-28	快照版

上述模型根据本次请求输入的Token数，采取阶梯计费。

qwen3-coder-plus系列

qwen3-coder-plus、qwen3-coder-plus-2025-09-23和qwen3-coder-plus-2025-07-22价格如下，其中 qwen3-coder-plus 支持上下文缓存，命中隐式缓存的输入文本按单价的 20% 计费，命中显式缓存的输入文本按单价的 10% 计费。

单次请求的输入Token数	输入成本（每千Token）	输出成本（每千Token）
0<Token≤32K	0.004元	0.016元
32K<Token≤128K	0.006元	0.024元
128K<Token≤256K	0.01元	0.04元
256K<Token≤1M	0.02元	0.2元

qwen3-coder-flash系列

qwen3-coder-flash 和 qwen3-coder-flash-2025-07-28 价格如下，其中 qwen3-coder-flash 支持上下文缓存，命中隐式缓存的输入文本按单价的 20% 计费，命中显式缓存的输入文本按单价的 10% 计费。

单次请求的输入Token数	输入成本（每千Token）	输出成本（每千Token）
0<Token≤32K	0.001元	0.004元
32K<Token≤128K	0.0015元	0.006元
128K<Token≤256K	0.0025元	0.01元
256K<Token≤1M	0.005元	0.025元

更多模型

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-coder-plus 当前与qwen-coder-plus-2024-11-06能力相同	稳定版	131,072	129,024	8,192	0.0035元	0.007元	各100万Token 有效期：百炼开通后90天内
qwen-coder-plus-latest 与qwen-coder-plus的最新快照版能力相同	最新版
qwen-coder-plus-2024-11-06 又称qwen-coder-plus-1106	快照版
qwen-coder-turbo 当前与qwen-coder-turbo-2024-09-19能力相同	稳定版	131,072	129,024	8,192	0.002元	0.006元
qwen-coder-turbo-latest 与qwen-coder-turbo的最新快照版能力相同	最新版
qwen-coder-turbo-2024-09-19 又称qwen-coder-turbo-0919	快照版

国际（新加坡）

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen3-coder-plus 当前与qwen3-coder-plus-2025-07-22能力相同	稳定版	1,000,000	997,952	65,536	阶梯计价，请参见表格下方说明。		无免费额度
qwen3-coder-plus-2025-09-23	快照版
qwen3-coder-plus-2025-07-22	快照版
qwen3-coder-flash 当前与qwen3-coder-flash-2025-07-28能力相同	稳定版
qwen3-coder-flash-2025-07-28	快照版

上述模型根据本次请求输入的Token数，采取阶梯计费。

qwen3-coder-plus系列

qwen3-coder-plus、qwen3-coder-plus-2025-09-23 和 qwen3-coder-plus-2025-07-22 价格如下，其中 qwen3-coder-plus 支持上下文缓存，命中隐式缓存的输入文本按单价的 20% 计费，命中显式缓存的输入文本按单价的 10% 计费。

单次请求的输入Token数	输入成本（每千Token）	输出成本（每千Token）
0<Token≤32K	0.007339元	0.036696元
32K<Token≤128K	0.013211元	0.066053元
128K<Token≤256K	0.022018元	0.110089元
256K<Token≤1M	0.044035元	0.440354元

qwen3-coder-flash系列

单次请求的输入Token数	输入成本（每千Token）	输出成本（每千Token）
0<Token≤32K	0.002202元	0.011009元
32K<Token≤128K	0.00367元	0.018348元
128K<Token≤256K	0.005871元	0.029357元
256K<Token≤1M	0.011743元	0.070457元

通义千问翻译模型

基于 Qwen 3全面升级的旗舰级翻译大模型，支持92个语种（包括中、英、日、韩、法、西、德、泰、印尼、越、阿等）互译，模型性能和翻译效果全面升级，提供更稳定的术语定制、格式还原度、领域提示能力，让译文更精准、自然。使用方法 | 在线体验

中国大陆（北京）

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen-mt-plus 属于Qwen3-MT	16,384	8,192	8,192	0.0018元	0.0054元	各100万Token 有效期：百炼开通后90天内
qwen-mt-flash 属于Qwen3-MT				0.0007元	0.00195元
qwen-mt-lite 属于Qwen3-MT				0.0006元	0.0016元
qwen-mt-turbo 属于Qwen3-MT				0.0007元	0.00195元

国际（新加坡）

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen-mt-plus 属于Qwen3-MT	16,384	8,192	8,192	0.018055元	0.05409元	无免费额度
qwen-mt-flash 属于Qwen3-MT				0.001174元	0.003596元
qwen-mt-lite 属于Qwen3-MT				0.000881元	0.002642元
qwen-mt-turbo 属于Qwen3-MT				0.001174元	0.003596元

通义千问数据挖掘模型

通义千问数据挖掘模型可以提取文档中的结构化信息并用于数据标注和内容审核等领域。使用方法 | API参考

说明

仅支持中国大陆（北京）地域。

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度
模型名称	（Token数）			（每千Token）		免费额度
qwen-doc-turbo	262,144	253,952	32,768	0.0006元	0.001元	无免费额度

通义千问深入研究模型

通义千问深入研究模型可以拆解复杂问题，结合互联网搜索进行推理分析并生成研究报告。使用方法 | API参考

说明

仅支持中国大陆（北京）地域。

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度
模型名称	（Token数）			（每千Token）		免费额度
qwen-deep-research	1,000,000	997,952	32,768	0.054元	0.163元	无免费额度

文本生成-通义千问-开源版

模型名称中，xxb表示参数规模，例如qwen2-72b-instruct表示参数规模为72B，即720亿。
百炼支持调用通义千问的开源版，您无需本地部署模型。对于开源版，建议使用Qwen3模型。

Qwen3

2025 年 9月发布的 qwen3-next-80b-a3b-thinking 仅支持思考模式，相较于qwen3-235b-a22b-thinking-2507提升了指令遵循能力，总结回复更加精简。

2025 年 9月发布的 qwen3-next-80b-a3b-instruct 仅支持非思考模式，相较于qwen3-235b-a22b-instruct-2507增强了中文理解、逻辑推理及文本生成能力。

2025 年 7月发布的 qwen3-235b-a22b-thinking-2507、qwen3-30b-a3b-thinking-2507 模型仅支持思考模式，是qwen3-235b-a22b（思考模式）与qwen3-30b-a3b （思考模式）的升级版。

2025 年 7月发布的 qwen3-235b-a22b-instruct-2507、qwen3-30b-a3b-instruct-2507 模型仅支持非思考模式，是qwen3-235b-a22b（非思考模式）与qwen3-30b-a3b （非思考模式）的升级版。

2025 年 4月发布的 Qwen3 模型支持思考模式和非思考模式，您可以通过 enable_thinking 参数实现两种模式的切换。除此之外，Qwen3 模型的能力得到了大幅提升：

推理能力：在数学、代码和逻辑推理等评测中，显著超过 QwQ 和同尺寸的非推理模型，达到同规模业界顶尖水平。
人类偏好能力：创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升，通用能力显著超过同尺寸模型。
Agent 能力：在推理、非推理两种模式下都达到业界领先水平，能精准调用外部工具。

多语言能力：支持100多种语言和方言，多语言翻译、指令理解、常识推理能力都明显提升。

支持的语言

英语（English）

简体中文（Simplified Chinese）

繁体中文（Traditional Chinese）

法语（French）

西班牙语（Spanish）

阿拉伯语（Arabic），使用阿拉伯字母。是众多阿拉伯国家的官方语言。

俄语（Russian），使用西里尔字母。在俄罗斯及其他一些国家是官方语言。

葡萄牙语（Portuguese），使用拉丁字母。在葡萄牙、巴西和其他葡萄牙语国家是官方语言。

德语（German），使用拉丁字母。在德国和奥地利等地是官方语言。

意大利语（Italian），使用拉丁字母。在意大利、圣马力诺以及瑞士的部分地区是官方语言。

荷兰语（Dutch），使用拉丁字母。在荷兰、比利时部分地区（弗拉芒地区）和苏里南是官方语言。

丹麦语（Danish），使用拉丁字母。在丹麦是官方语言。

爱尔兰语（Irish），使用拉丁字母。在爱尔兰是官方语言之一。

威尔士语（Welsh），使用拉丁字母。在威尔士使用，是官方语言之一。

芬兰语（Finnish），使用拉丁字母。在芬兰是官方语言。

冰岛语（Icelandic），使用拉丁字母。在冰岛是官方语言。

瑞典语（Swedish），使用拉丁字母。是瑞典的官方语言。

新挪威语（Norwegian Nynorsk），使用拉丁字母。在挪威与书面挪威语共同使用，属主流语言的一部分。

书面挪威语（Norwegian Bokmål），使用拉丁字母。在挪威使用，是主流语言的一部分。

日语（Japanese），使用日文字母。在日本是官方语言。

朝鲜语/韩语（Korean），使用韩字（Hangul）。在韩国和朝鲜是官方语言。

越南语（Vietnamese），使用拉丁字母。在越南是官方语言。

泰语（Thai），使用泰文字母。在泰国是官方语言。

印度尼西亚语（Indonesian），使用拉丁字母。是印度尼西亚的官方语言。

马来语（Malay），使用拉丁字母。是马来西亚等地的主要语言。

缅甸语（Burmese），使用缅甸字母。在缅甸是官方语言。

他加禄语（Tagalog），使用拉丁字母。菲律宾的主要语言之一。

高棉语（Khmer），使用高棉字母。在柬埔寨是官方语言。

老挝语（Lao），使用老挝字母。在老挝是官方语言。

印地语（Hindi），使用天城文（Devanagari）。是印度的官方语言之一。

孟加拉语（Bengali），使用孟加拉字母。在孟加拉国和印度西孟加拉邦是官方语言。

乌尔都语（Urdu），使用阿拉伯字母。在巴基斯坦是官方语言之一，也在印度使用。

尼泊尔语（Nepali），使用天城字母。在尼泊尔是官方语言。

希伯来语（Hebrew），使用希伯来字母。在以色列是官方语言。

土耳其语（Turkish），使用拉丁字母。在土耳其和塞浦路斯北部是官方语言。

波斯语（Persian），使用阿拉伯字母。在伊朗和塔吉克斯坦等地是官方语言。

波兰语（Polish），使用拉丁字母。在波兰是官方语言。

乌克兰语（Ukrainian），使用西里尔字母。在乌克兰是官方语言。

捷克语（Czech），使用拉丁字母。在捷克是官方语言。

罗马尼亚语（Romanian），使用拉丁字母。在罗马尼亚和摩尔多瓦是官方语言。

保加利亚语（Bulgarian），使用西里尔字母。在保加利亚是官方语言。

斯洛伐克语（Slovak），使用拉丁字母。在斯洛伐克是官方语言。

匈牙利语（Hungarian），使用拉丁字母。在匈牙利是官方语言。

斯洛文尼亚语（Slovenian），使用拉丁字母。在斯洛文尼亚是官方语言。

拉脱维亚语（Latvian），使用拉丁字母。在拉脱维亚是官方语言。

爱沙尼亚语（Estonian），使用拉丁字母。在爱沙尼亚是官方语言。

立陶宛语（Lithuanian），使用拉丁字母。在立陶宛是官方语言。

白俄罗斯语（Belarusian），使用西里尔字母。在白俄罗斯是官方语言之一。

希腊语（Greek），使用希腊字母。在希腊和塞浦路斯是官方语言。

克罗地亚语（Croatian），使用拉丁字母。在克罗地亚是官方语言。

马其顿语（Macedonian），使用西里尔字母。是北马其顿的官方语言。

马耳他语（Maltese），使用拉丁字母。在马耳他是官方语言。

塞尔维亚语（Serbian），使用西里尔字母。在塞尔维亚是官方语言。

波斯尼亚语（Bosnian），使用拉丁字母。在波斯尼亚和黑塞哥维那是官方语言之一。

格鲁吉亚语（Georgian），使用格鲁吉亚字母（Georgian script）。在格鲁吉亚是官方语言。

亚美尼亚语（Armenian），使用亚美尼亚字母。在亚美尼亚是官方语言。

北阿塞拜疆语（North Azerbaijani），使用拉丁字母。在阿塞拜疆是官方语言。

哈萨克语（Kazakh），使用西里尔字母。在哈萨克斯坦是官方语言。

北乌兹别克语（Northern Uzbek），使用拉丁字母。在乌兹别克斯坦是官方语言。

塔吉克语（Tajik），使用西里尔字母。在塔吉克斯坦是官方语言。

斯瓦西里语（Swahili），使用拉丁字母。在东非许多国家是通用语或官方语言。

南非语（Afrikaans），使用拉丁字母。主要在南非和纳米比亚使用。

粤语（Cantonese），使用繁体字。主要在中国广东省、香港和澳门使用，是这些地区的主要语言之一。

卢森堡语（Luxembourgish），使用拉丁字母。在卢森堡和德国部分地区使用，是官方语言之一。

林堡语（Limburgish），使用拉丁字母。主要在荷兰、比利时和德国部分地区使用。

加泰罗尼亚语（Catalan），使用拉丁字母。在加泰罗尼亚和其他部分西班牙地区使用。

加利西亚语（Galician），使用拉丁字母。主要在西班牙加利西亚地区使用。

阿斯图里亚斯语（Asturian），使用拉丁字母。主要在西班牙阿斯图里亚斯地区使用。

巴斯克语（Basque），使用拉丁字母。主要在西班牙和法国的巴斯克地区使用，是西班牙巴斯克自治区的官方语言之一。

奥克语（Occitan），使用拉丁字母。主要在法国南部地区使用。

威尼斯语（Venetian），使用拉丁字母。主要在意大利威尼斯地区使用。

撒丁语（Sardinian），使用拉丁字母。主要在意大利撒丁岛使用。

西西里语（Sicilian），使用拉丁字母。主要在意大利西西里岛使用。

弗留利语（Friulian），使用拉丁字母。主要在意大利弗留利-威尼斯朱利亚使用。

隆巴底语（Lombard），使用拉丁字母。主要在意大利伦巴第地区使用。

利古里亚语（Ligurian），使用拉丁字母。主要在意大利利古里亚地区使用。

法罗语（Faroese），使用拉丁字母。主要在法罗群岛使用，是法罗群岛的官方语言之一。

托斯克阿尔巴尼亚语（Tosk Albanian），使用拉丁字母。主要是阿尔巴尼亚南部方言。

西里西亚语（Silesian），使用拉丁字母。主要在波兰使用。

巴什基尔语（Bashkir），使用西里尔字母。主要在俄罗斯巴什科尔托斯坦使用。

鞑靼语（Tatar），使用西里尔字母。主要在俄罗斯塔塔尔斯坦使用。

美索不达米亚阿拉伯语（Mesopotamian Arabic），使用阿拉伯字母。主要在伊拉克使用。

内志阿拉伯语（Najdi Arabic），使用阿拉伯字母。主要在沙特阿拉伯的内志地区使用。

埃及阿拉伯语（Egyptian Arabic），使用阿拉伯字母。主要在埃及使用。

黎凡特阿拉伯语（Levantine Arabic），使用阿拉伯字母。主要在叙利亚和黎巴嫩使用。

闪米特阿拉伯语（Ta'izzi-Adeni Arabic），使用阿拉伯字母。主要在也门和沙特阿拉伯的哈德拉莫区域使用。

达里语（Dari），使用阿拉伯字母。在阿富汗是官方语言之一。

突尼斯阿拉伯语（Tunisian Arabic），使用阿拉伯字母。主要在突尼斯使用。

摩洛哥阿拉伯语（Moroccan Arabic），使用阿拉伯字母。主要在摩洛哥使用。

克里奥尔语（Kabuverdianu），使用拉丁字母。主要在佛得角使用。

托克皮辛语（Tok Pisin），使用拉丁字母。在巴布亚新几内亚是主要的通用语之一。

意第绪（Eastern Yiddish），使用希伯来字母。主要在犹太社区中使用。

信德阿拉伯语（Sindhi），使用阿拉伯字母。在巴基斯坦信德省是官方语言之一。

僧伽罗语（Sinhala），使用僧伽罗字母。在斯里兰卡是官方语言之一。

泰卢固语（Telugu），使用泰卢固字母。在印度安得拉邦和特伦甘纳邦是官方语言之一。

旁遮普语（Punjabi），使用古尔穆奇字母。在印度旁遮普邦使用，是印度的官方语言之一。

泰米尔语（Tamil），使用泰米尔字母。在印度泰米尔纳德邦和斯里兰卡是官方语言之一。

古吉拉特语（Gujarati），使用古吉拉特字母。在印度古吉拉特邦是官方语言之一。

马拉雅拉姆语（Malayalam），使用马拉雅拉姆字母。在印度喀拉拉邦是官方语言之一。

马拉地语（Marathi），使用天城字母。在印度马哈拉施特拉邦是官方语言之一。

卡纳达语（Kannada），使用卡纳达字母。在印度卡纳塔克邦是官方语言之一。

马加拉语（Magahi），使用天城文本。主要在印度比哈尔邦使用。

奥里亚语（Oriya），使用乌尔都语字母。在印度奥迪沙邦是官方语言之一。

阿瓦德语（Awadhi），使用天城字母。主要在印度北方邦使用。

迈蒂利语（Maithili），使用天城字母。在印度比哈尔邦和尼泊尔特莱平原使用，是印度的官方语言之一。

阿萨姆语（Assamese），使用孟加拉字母。在印度阿萨姆邦是官方语言之一。

切蒂斯格尔语（Chhattisgarhi），使用天城字母。主要在印度切蒂斯格尔邦使用。

比哈尔语（Bhojpuri），使用天城字母。在印度和尼泊尔部分地区使用。

米南加保语（Minangkabau），使用拉丁字母。主要在印度尼西亚苏门答腊岛使用。

巴厘语（Balinese），使用拉丁字母。主要在印度尼西亚巴厘岛使用。

爪哇语（Javanese），使用拉丁字母（也惯用爪哇文字）。在印度尼西亚爪哇岛广泛使用。

班章语（Banjar），使用拉丁字母。主要在印度尼西亚加里曼丹岛使用。

巽他语（Sundanese），使用拉丁字母（虽然传统上使用巽他文字）。主要在印度尼西亚爪哇岛的西部使用。

宿务语（Cebuano），使用拉丁字母。主要在菲律宾宿务地区使用。

邦阿西楠语（Pangasinan），使用拉丁字母。主要在菲律宾邦阿西楠语省使用。

伊洛卡诺语（Iloko），使用拉丁字母。主要在菲律宾使用。

瓦莱语（Waray (Philippines)），使用拉丁字母。主要在菲律宾使用。

海地语（Haitian），使用拉丁字母。在海地是官方语言之一。

帕皮阿门托语（Papiamento），使用拉丁字母。主要在加勒比地区如阿鲁巴岛和库拉索岛使用。

回复格式：修复了之前版本存在的回复格式的问题，如异常 Markdown、中间截断、错误输出 boxed 等问题。

2025 年 4月发布的Qwen3 开源模型在思考模式下不支持非流式输出方式。

思考模式 | 非思考模式 | API 参考

中国大陆（北京）

模型名称	模式	上下文长度	最大输入	最大思维链长度	最大回复长度	输入成本	输出成本思维链+输出	免费额度（注）
模型名称	模式	（Token数）				（每千Token）		免费额度（注）
qwen3-next-80b-a3b-thinking	仅思考模式	131,072	126,976	81,920	32,768	0.001元	0.01元	各100万 Token 有效期：百炼开通后90天内
qwen3-next-80b-a3b-instruct	仅非思考模式		129,024	-		0.001元	0.004元
qwen3-235b-a22b-thinking-2507	仅思考模式		126,976	81,920		0.002元	0.02元
qwen3-235b-a22b-instruct-2507	仅非思考模式		129,024	-		0.002元	0.008元
qwen3-30b-a3b-thinking-2507	仅思考模式		126,976	81,920		0.00075元	0.0075元
qwen3-30b-a3b-instruct-2507	仅非思考模式		129,024	-		0.00075元	0.003元
qwen3-235b-a22b 本模型与以下模型均于2025 年 4月发布	非思考		129,024	-	16,384	0.002元	0.008元
qwen3-235b-a22b 本模型与以下模型均于2025 年 4月发布	思考		98,304	38,912		0.002元	0.02元
qwen3-32b	非思考		129,024	-		0.002元	0.008元
qwen3-32b	思考		98,304	38,912		0.002元	0.02元
qwen3-30b-a3b	非思考		129,024	-		0.00075元	0.003元
qwen3-30b-a3b	思考		98,304	38,912		0.00075元	0.0075元
qwen3-14b	非思考		129,024	-	8,192	0.001元	0.004元
qwen3-14b	思考		98,304	38,912		0.001元	0.01元
qwen3-8b	非思考		129,024	-		0.0005元	0.002元
qwen3-8b	思考		98,304	38,912		0.0005元	0.005元
qwen3-4b	非思考		129,024	-		0.0003元	0.0012元
qwen3-4b	思考		98,304	38,912			0.003元
qwen3-1.7b	非思考	32,768	30,720	-			0.0012元
qwen3-1.7b	思考		28,672	与输入相加不超过30,720			0.003元
qwen3-0.6b	非思考		30,720	-			0.0012元
qwen3-0.6b	思考		28,672	与输入相加不超过30,720			0.003元

国际（新加坡）

模型名称	模式	上下文长度	最大输入	最大思维链长度	最大回复长度	输入成本	输出成本思维链+输出	免费额度（注）
模型名称	模式	（Token数）				（每千Token）		免费额度（注）
qwen3-next-80b-a3b-thinking	仅支持思考模式	131,072	126,976	81,920	32,768	0.003670元	0.044035元	无免费额度
qwen3-next-80b-a3b-instruct	仅非思考模式		129,024	-		0.003670元	0.014678元
qwen3-235b-a22b-thinking-2507	仅支持思考模式		126,976	81,920		0.005137元	0.06165元
qwen3-235b-a22b-instruct-2507	仅非思考模式		129,024	-		0.005137元	0.02055元
qwen3-30b-a3b-thinking-2507	仅支持思考模式		126,976	81,920		0.001468元	0.017614元
qwen3-30b-a3b-instruct-2507	仅非思考模式		129,024	-		0.001468元	0.005871元
qwen3-235b-a22b 本模型与以下模型均于2025 年 4月发布	非思考		129,024	-	16,384	0.005137元	0.02055元
qwen3-235b-a22b 本模型与以下模型均于2025 年 4月发布	思考		98,304	38,912			0.06165元
qwen3-32b	非思考		129,024	-			0.02055元
qwen3-32b	思考		98,304	38,912			0.06165元
qwen3-30b-a3b	非思考		129,024	-		0.001468元	0.005871元
qwen3-30b-a3b	思考		98,304	38,912		0.001468元	0.017614元
qwen3-14b	非思考		129,024	-	8,192	0.002569元	0.010275元
qwen3-14b	思考		98,304	38,912		0.002569元	0.030825元
qwen3-8b	非思考		129,024	-		0.001321元	0.005137元
qwen3-8b	思考		98,304	38,912		0.001321元	0.015412元
qwen3-4b	非思考		129,024	-		0.000807元	0.003082元
qwen3-4b	思考		98,304	38,912			0.009247元
qwen3-1.7b	非思考	32,768	30,720	-			0.003082元
qwen3-1.7b	思考		28,672	与输入相加不超过30,720			0.009247元
qwen3-0.6b	非思考		30,720	-			0.003082元
qwen3-0.6b	思考		28,672	与输入相加不超过30,720			0.009247元

对于 Qwen3 模型，开启思考模式时如果没有输出思考过程，按非思考模式价格进行收费。

QwQ-开源版

基于 Qwen2.5-32B 模型训练的 QwQ 推理模型，通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标（AIME 24/25、LiveCodeBench）以及部分通用指标（IFEval、LiveBench等）达到DeepSeek-R1 满血版水平，各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。使用方法｜API 参考

说明

仅支持中国大陆（北京）地域。

模型名称

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

（注）

（Token数）

（每千Token）

qwq-32b

131,072

98,304

32,768

8,192

0.002元

0.006元

100万 Token

有效期：百炼开通后90天内

QwQ-Preview

qwq-32b-preview 模型是由 Qwen 团队于2024年开发的实验性研究模型，专注于增强 AI 推理能力，尤其是数学和编程领域。qwq-32b-preview 模型的局限性请参见QwQ官方博客。使用方法 | API参考｜在线体验

说明

仅支持中国大陆（北京）地域。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

（注）

（Token数）

（每千Token）

qwq-32b-preview

32,768

30,720

16,384

0.002元

Batch调用半价

0.006元

Batch调用半价

100万Token

有效期：百炼开通后90天内

Qwen2.5

Qwen2.5是Qwen大型语言模型系列。针对Qwen2.5，我们发布了一系列基础语言模型和指令调优语言模型，参数规模从5亿到720亿不等。Qwen2.5在Qwen2基础上进行了以下改进：

在我们最新的大规模数据集上进行预训练，包含多达18万亿个Token。
由于我们在这些领域的专业专家模型，模型的知识显著增多，编码和数学能力也大幅提高。
在遵循指令、生成长文本（超过8K个标记）、理解结构化数据（例如表格）和生成结构化输出（尤其是JSON）方面有显著改进。对系统提示的多样性更具弹性，增强了聊天机器人的角色扮演实现和条件设置。
支持超过29种语言，包括中文、英语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、阿拉伯语等。

使用方法 | API参考 | 在线体验

中国大陆（北京）

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen2.5-14b-instruct-1m	1,000,000	1,000,000	8,192	0.001元	0.003元	各100万Token 有效期：百炼开通后90天内
qwen2.5-7b-instruct-1m				0.0005元	0.001元
qwen2.5-72b-instruct	131,072	129,024		0.004元	0.012元
qwen2.5-32b-instruct				0.002元	0.006元
qwen2.5-14b-instruct				0.001元	0.003元
qwen2.5-7b-instruct				0.0005元	0.001元
qwen2.5-3b-instruct	32,768	30,720		0.0003元	0.0009元
qwen2.5-1.5b-instruct				目前仅供免费体验免费额度用完后不可调用，推荐使用Qwen3、DeepSeek、Kimi作为替代模型
qwen2.5-0.5b-instruct

国际（新加坡）

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen2.5-14b-instruct-1m	1,008,192	1,000,000	8,192	0.005908元	0.023632元	无免费额度
qwen2.5-7b-instruct-1m				0.002701元	0.010789元
qwen2.5-72b-instruct	131,072	129,024		0.010275元	0.0411元
qwen2.5-32b-instruct				0.005137元	0.02055元
qwen2.5-14b-instruct				0.002569元	0.010275元
qwen2.5-7b-instruct				0.001284元	0.005137元

Qwen2

阿里云的通义千问2-开源版。使用方法 | API参考 | 在线体验

说明

仅支持中国大陆（北京）地域。

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
模型名称	（Token数）			（每千Token）		免费额度（注）
qwen2-72b-instruct	131,072	128,000	6,144	0.004元	0.012元	各100万Token 有效期：百炼开通后90天内
qwen2-57b-a14b-instruct	65,536	63,488		0.0035元	0.007元
qwen2-7b-instruct	131,072	128,000		0.001元	0.002元
qwen2-1.5b-instruct	32,768	30,720		限时免费
qwen2-0.5b-instruct	32,768	30,720		限时免费

Qwen1.5

阿里云的通义千问1.5-开源版。使用方法 | API参考 | 在线体验

说明

仅支持中国大陆（北京）地域。

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen1.5-110b-chat	32,000	30,000	8,000	0.007元	0.014元	各100万Token 有效期：百炼开通后90天内
qwen1.5-72b-chat			2,000	0.005元	0.01元
qwen1.5-32b-chat				0.0035元	0.007元
qwen1.5-14b-chat	8,000	6,000		0.002元	0.004元
qwen1.5-7b-chat				0.001元	0.002元
qwen1.5-1.8b-chat	32,000	30,000		限时免费
qwen1.5-0.5b-chat

QVQ

qvq-72b-preview模型是由 Qwen 团队开发的实验性研究模型，专注于提升视觉推理能力，尤其在数学推理领域。qvq-72b-preview模型的局限性请参见QVQ官方博客。使用方法 | API参考

如果希望模型先输出思考过程再输出回答内容，请使用商业版模型QVQ。

说明

仅支持中国大陆（北京）地域。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

（注）

（Token数）

（每千Token）

qvq-72b-preview

32,768

16,384

单图最大16384

16,384

0.012元

0.036元

10万Token

有效期：百炼开通后90天内

Qwen-Omni

基于Qwen2.5训练的全新多模态理解生成大模型，支持文本、图像、语音、视频输入理解，具备文本和语音同时流式生成的能力，多模态内容理解速度显著提升。使用方法｜API 参考

中国大陆（北京）

模型名称

上下文长度

最大输入

最大输出

免费额度

（注）

（Token数）

qwen2.5-omni-7b

32,768

30,720

2,048

100万Token（不区分模态）

有效期：百炼开通后90天

开源版模型的免费额度用完后，输入与输出的计费规则如下：

输入计费项	单价（每千 Token）
输入：文本	0.0006元
输入：音频	0.038元
输入：图片/视频	0.002元

输出计费项

单价（每千 Token）

输出：文本

0.0024元（输入仅包含文本时）

0.006元（输入包含图片/音频/视频时）

输出：文本+音频

0.076元（音频）

输出的文本不计费。

计费示例：某次请求输入了1000 Token 的文本和1000 Token 的图片，输出了1000 Token 的文本和1000 Token 的音频，则该请求花费：0.0006元（文本输入）+ 0.002元（图片输入）+ 0.076元（音频输出）= 0.0786元。

国际（新加坡）

模型名称

上下文长度

最大输入

最大输出

免费额度

（注）

（Token数）

qwen2.5-omni-7b

32,768

30,720

2,048

无免费额度

输入与输出的计费规则如下：

输入计费项	单价（每千 Token）
输入：文本	0.000734元
输入：音频	0.049613元
输入：图片/视频	0.002055元

输出计费项

单价（每千 Token）

输出：文本

0.002936元（输入仅包含文本时）

0.006165元（输入包含图片/音频/视频时）

输出：文本+音频

0.099153元（音频）

输出的文本不计费。

Qwen3-Omni-Captioner

Qwen3-Omni-Captioner以通义千问3-Omni为基座的开源模型，无需任何提示，自动为复杂语音、环境声、音乐、影视声效等生成精准、全面的描述，能识别说话人情绪、音乐元素（如风格、乐器）、敏感信息等，适用于音频内容分析、安全审核、意图识别、音频剪辑等多个领域。使用方法｜API 参考

中国大陆（北京）

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

（注）

（Token数）

（每千Token）

qwen3-omni-30b-a3b-captioner

65,536

32,768

0.0158元

0.0127元

100万Token

有效期：阿里云百炼开通后90天内

国际（新加坡）

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

（注）

（Token数）

（每千Token）

qwen3-omni-30b-a3b-captioner

65,536

32,768

0.027962元

0.022458元

无免费额度

Qwen-VL

阿里云的通义千问VL开源版。使用方法 | API参考

相较于Qwen2.5-VL，Qwen3-VL模型能力有极大提升：

智能体交互：可操作电脑或手机界面，识别 GUI 元素、理解功能、调用工具执行任务，在 OS World 等评测中达到顶尖水平。
视觉编码：可通过图像或视频生成代码，用于将设计图、网站截图等生成HTML、CSS、JS 代码。
空间感知：支持二维和三维定位，精准判断物体方位、视角变化、遮挡关系。
长视频理解：支持长达20分钟的视频内容理解，并能精确定位到秒级时刻。
深度思考：具有深度思考能力，擅长捕捉细节、分析因果，在 MathVista、MMMU 等评测中达到顶尖水平。
文字识别：支持语言扩展至 33种，在复杂光线、模糊、倾斜等场景下表现更稳定；显著提升生僻字、古籍字、专业术语的识别准确率。
支持的语言
支持的语言共33种，分别为中文、日语、韩语、印尼语、越南语、泰语、英语、法语、德语、俄语、葡萄牙语、西班牙语、意大利语、瑞典语、丹麦语、捷克语、挪威语、荷兰语、芬兰语、土耳其语、波兰语、斯瓦希里语、罗马尼亚语、塞尔维亚语、希腊语、哈萨克语、乌兹别克语、宿务语、阿拉伯语、乌尔都语、波斯语、印地语 / 天城语、希伯来语。

中国大陆（北京）

模型名称	模式	上下文长度	最大输入	最大思维链长度	最大回复长度	输入成本	输出成本思维链+输出	免费额度（注）
模型名称	模式	（Token数）				（每千Token）		免费额度（注）
qwen3-vl-235b-a22b-thinking	仅思考模式	131,072	126,976	81,920	32,768	0.002元	0.02元	各100万 Token 有效期：百炼开通后90天内
qwen3-vl-235b-a22b-instruct	仅非思考模式		129,024	-		0.002元	0.008元
qwen3-vl-32b-thinking	仅思考模式		126,976	81,920		0.002元	0.02元
qwen3-vl-32b-instruct	仅非思考模式		129,024	-		0.002元	0.008元
qwen3-vl-30b-a3b-thinking	仅思考模式		126,976	81,920		0.00075元	0.0075元
qwen3-vl-30b-a3b-instruct	仅非思考模式		129,024	-		0.00075元	0.003元
qwen3-vl-8b-thinking	仅思考模式		126,976	81,920		0.0005元	0.005元
qwen3-vl-8b-instruct	仅非思考模式		129,024	-		0.0005元	0.002元

更多模型

Qwen2.5-VL是视觉理解系列大模型，在Qwen2-VL的基础上做了如下改进：

感知更丰富的世界：Qwen2.5-VL不仅擅长识别常见物体，如花、鸟、鱼和昆虫等，还能分析图像中的文本、图表、图标、图形和布局等。
长视频理解能力：支持对长视频文件（最长10分钟）进行理解，具备通过精准定位相关视频片段来捕捉事件的新能力
视觉定位：Qwen2.5-VL可通过生成bounding box（矩形框的左上角和右下角坐标）或者point（矩形框的中心点坐标）来准确定位图像中的物体，并能够为坐标和属性提供稳定的JSON输出。
结构化输出：可支持对发票、表单、表格等数据进行结构化输出，惠及金融、商业等领域的应用。

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen2.5-vl-72b-instruct	131,072	129,024 单图最大16384	8,192	0.016元	0.048元	各100万Token 有效期：百炼开通后90天内
qwen2.5-vl-32b-instruct				0.008元	0.024元
qwen2.5-vl-7b-instruct				0.002元	0.005元
qwen2.5-vl-3b-instruct				0.0012元	0.0036元
qwen2-vl-72b-instruct	32,768	30,720 单图最大16384	2,048	0.016元	0.048元
qwen2-vl-7b-instruct	32,000	30,000 单图最大16384	2,000	目前仅供免费体验。免费额度用完后不可调用，建议改用qwen-vl-max、qwen-vl-plus模型。		各10万Token 有效期：百炼开通后90天内
qwen2-vl-2b-instruct				限时免费
qwen-vl-v1	8,000	6,000 单图最大1280	1,500	目前仅供免费体验。免费额度用完后不可调用，建议改用qwen-vl-max、qwen-vl-plus模型。
qwen-vl-chat-v1

国际（新加坡）

模型名称	模式	上下文长度	最大输入	最大思维链长度	最大回复长度	输入成本	输出成本思维链+输出	免费额度（注）
模型名称	模式	（Token数）				（每千Token）		免费额度（注）
qwen3-vl-235b-a22b-thinking	仅思考模式		126,976	81,920		0.005137元	0.061650元	无免费额度
qwen3-vl-235b-a22b-instruct	仅非思考模式		129,024	-		0.005137元	0.020550元
qwen3-vl-32b-thinking	仅思考模式	131,072	126,976	81,920	32,768	0.005137元	0.06165元
qwen3-vl-32b-instruct	仅非思考模式		129,024	-		0.005137元	0.02055元
qwen3-vl-30b-a3b-thinking	仅思考模式		126,976	81,920		0.001468元	0.017614元
qwen3-vl-30b-a3b-instruct	仅非思考模式		129,024	-		0.001468元	0.005871元
qwen3-vl-8b-thinking	仅思考模式		126,976	81,920		0.001321元	0.015412元
qwen3-vl-8b-instruct	仅非思考模式		129,024	-		0.001321元	0.005137元

更多模型

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen2.5-vl-72b-instruct	131,072	129,024 单图最大16384	8,192	0.02055元	0.06165元	无免费额度
qwen2.5-vl-32b-instruct				0.010275元	0.030825元
qwen2.5-vl-7b-instruct				0.002569元	0.007706元
qwen2.5-vl-3b-instruct				0.001541元	0.004624元

Qwen-Audio

阿里云的通义千问Audio开源版。使用方法

说明

仅支持中国大陆（北京）地域。

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen2-audio-instruct 相比qwen-audio-chat提升了音频理解能力，且新增了语音聊天能力。	8,000	6,000	1,500	目前仅供免费体验。免费额度用完后不可调用，推荐使用Qwen-Omni作为替代模型		10万Token 有效期：阿里云百炼开通后90天内
qwen-audio-chat

Qwen-Math

基于Qwen模型构建的专门用于数学解题的语言模型。Qwen2.5-Math支持中文和英文，并整合了多种推理方法，包括CoT（Chain of Thought）、PoT（Program of Thought）和 TIR（Tool-Integrated Reasoning）。使用方法 | API参考 | 在线体验

说明

仅支持中国大陆（北京）地域。

模型名称	输入价格	输出价格	上下文长度	最大输入	最大输出	免费额度（注）
	（每千Token）		（Token数）
qwen2.5-math-72b-instruct	0.004元	0.012元	4,096	3,072	3,072	各100万Token 有效期：百炼开通后90天内
qwen2.5-math-7b-instruct	0.001元	0.002元
qwen2.5-math-1.5b-instruct	限时免费					限时免费

Qwen-Coder

通义千问代码模型开源版。最新的 Qwen3-Coder系列具有强大的Coding Agent能力，擅长工具调用和环境交互，能够实现自主编程、代码能力卓越的同时兼具通用能力。使用方法 | API参考 | 在线体验

中国大陆（北京）

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen3-coder-480b-a35b-instruct	262,144	204,800	65,536	阶梯计价，请参见表格下方说明。		各100万Token 有效期：百炼开通后90天内
qwen3-coder-30b-a3b-instruct

qwen3-coder-480b-a35b-instruct 与 qwen3-coder-30b-a3b-instruct 根据本次请求输入的 Token数，采取阶梯计费。

模型名称	单次请求的输入 Token 数	输入成本（每千Token）	输出成本（每千Token）
qwen3-coder-480b-a35b-instruct	0<Token≤32K	0.006元	0.024元
	32K<Token≤128K	0.009元	0.036元
	128K<Token≤200K	0.015元	0.06元
qwen3-coder-30b-a3b-instruct	0<Token≤32K	0.0015元	0.006元
	32K<Token≤128K	0.00225元	0.009元
	128K<Token≤200K	0.00375元	0.015元

更多模型

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen2.5-coder-32b-instruct	131,072	129,024	8,192	0.002元	0.006元	各100万Token 有效期：百炼开通后90天内
qwen2.5-coder-14b-instruct
qwen2.5-coder-7b-instruct				0.001元	0.002元
qwen2.5-coder-3b-instruct	32,768	30,720		限时免费体验
qwen2.5-coder-1.5b-instruct
qwen2.5-coder-0.5b-instruct

国际（新加坡）

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
	（Token数）			（每千Token）
qwen3-coder-480b-a35b-instruct	262,144	204,800	65,536	阶梯计价，请参见表格下方说明。		无免费额度
qwen3-coder-30b-a3b-instruct

qwen3-coder-480b-a35b-instruct 与 qwen3-coder-30b-a3b-instruct 根据本次请求输入的 Token数，采取阶梯计费。

模型名称	单次请求的输入 Token 数	输入成本（每千Token）	输出成本（每千Token）
qwen3-coder-480b-a35b-instruct	0<Token≤32K	0.011009元	0.055044元
	32K<Token≤128K	0.019816元	0.09908元
	128K<Token≤200K	0.033027元	0.165133元
qwen3-coder-30b-a3b-instruct	0<Token≤32K	0.003303元	0.016513元
	32K<Token≤128K	0.005504元	0.027522元
	128K<Token≤200K	0.008807元	0.044035元

文本生成-第三方模型

DeepSeek

DeepSeek 是由深度求索公司推出的大语言模型。API参考｜在线体验

说明

仅支持中国大陆（北京）地域。

模型名称	上下文长度	最大输入	最大思维链长度	最大回复长度	输入成本	输出成本	免费额度查看剩余额度
模型名称	（Token数）				（每千Token）		免费额度查看剩余额度
deepseek-v3.2 685B 满血版	131,072	98,304	32,768	65,536	0.002元	0.003元	各100万Token 有效期：百炼开通后90天内
deepseek-v3.2-exp 685B 满血版	131,072	98,304	32,768	65,536	0.002元	0.003元
deepseek-v3.1 685B 满血版				65,536	0.004元	0.012元
deepseek-r1 685B 满血版				16,384	0.004元 Batch调用：0.002元	0.016元 Batch调用：0.008元
deepseek-r1-0528 685B 满血版					0.004元	0.016元
deepseek-v3 671B 满血版		131,072	不涉及		0.002元 Batch调用：0.001元	0.008元 Batch调用：0.004元
deepseek-r1-distill-qwen-1.5b 基于 Qwen2.5-Math-1.5B	32,768	32,768	16,384	16,384	限时免费体验
deepseek-r1-distill-qwen-7b 基于 Qwen2.5-Math-7B					0.0005元	0.001元	各100万Token 有效期：百炼开通后90天内
deepseek-r1-distill-qwen-14b 基于 Qwen2.5-14B					0.001元	0.003元
deepseek-r1-distill-qwen-32b 基于 Qwen2.5-32B					0.002元	0.006元
deepseek-r1-distill-llama-8b 基于 Llama-3.1-8B					限时免费体验
deepseek-r1-distill-llama-70b 基于 Llama-3.3-70B					目前仅供免费体验免费额度用完后不可调用，推荐使用Qwen3、deepseek-v3.1、Kimi作为替代模型		各100万Token 有效期：百炼开通后90天内

Kimi

Kimi-K2 是由月之暗面公司推出的大语言模型，具有卓越的编码和工具调用能力。使用方法｜在线体验

说明

仅支持中国大陆（北京）地域。

模型名称	上下文长度	最大输入	最大思维链长度	最大回复长度	输入成本	输出成本	免费额度查看剩余额度
模型名称	（Token数）				（每千Token）		免费额度查看剩余额度
kimi-k2-thinking	262,144	229,376	32,768	16,384	0.004元	0.016元	各100万Token 有效期：百炼开通后90天内
Moonshot-Kimi-K2-Instruct	131,072	131,072	-	8,192	0.004元	0.016元	各100万Token 有效期：百炼开通后90天内

GLM

GLM系列模型是智谱AI专为智能体设计的混合推理模型，提供思考与非思考两种模式。

说明

仅支持中国大陆（北京）地域。

模型名称	上下文长度	最大输入	最大思维链长度	最大回复长度	输入成本	输出成本	免费额度查看剩余额度
	（Token数）				（每千Token）
glm-4.6	202,752	169,984	32,768	16,384	阶梯计费，请参见下方表格		各100万Token 有效期：百炼开通后90天内
glm-4.5	131,072	98,304
glm-4.5-air

以上模型根据请求输入的 Token数，采取阶梯计费。

模型名称	单次请求的输入 Token 数	输入成本（每千Token）	输出成本（每千Token）
glm-4.6	0<Token<=32K	0.003元	0.014元
glm-4.6	32K<Token<=166K	0.004元	0.016元
glm-4.5	0<Token<=32K	0.003元	0.014元
glm-4.5	32K<Token<=96K	0.004元	0.016元
glm-4.5-air	0<Token<=32K	0.0008元	0.006元
glm-4.5-air	32K<Token<=96K	0.0012元	0.008元

以上模型非集成第三方服务，均部署在阿里云百炼服务器上。

GLM 模型思考与非思考模式同价。

MiniMax

MiniMax推出的大语言模型。API参考 | 在线体验（需申请）

说明

仅支持中国大陆（北京）地域。

模型名称	说明	上下文长度	最大输入	输入输出成本	免费额度（注）
		（Token数）
abab6.5g-chat	适合英文场景	8,000	8,000	目前仅供免费体验。免费额度用完后不可调用，推荐使用Qwen3、DeepSeek、Kimi 等作为替代模型	各100万Token（需申请）有效期：申请通过后90天内
abab6.5t-chat	适合中文场景
abab6.5s-chat	适合超长文本场景	245,000	245,000

图像生成

通义千问文生图

通义千问文生图模型在文本渲染方面表现突出，特别是中文文本渲染。当前qwen-image-plus与qwen-image能力相同，但qwen-image-plus价格更优惠。API参考

中国大陆（北京）

模型名称	单价	免费额度（注）

qwen-image-plus	0.2元/张	各100张有效期：阿里云百炼开通后90天内
qwen-image	0.25元/张

国际（新加坡）

模型名称	单价	免费额度

qwen-image-plus	0.220177元/张	无免费额度
qwen-image	0.256873元/张

输入提示词	输出图像
一副典雅庄重的对联悬挂于厅堂之中，房间是个安静古典的中式布置，桌子上放着一些青花瓷，对联上左书“义本生知人机同道善思新”，右书“通云赋智乾坤启数高志远”，横批“智启通义”，字体飘逸，在中间挂着一幅中国风的画作，内容是岳阳楼。

通义千问图像编辑

通义千问图像编辑模型支持精准的中英双语文字编辑、调色、细节增强、风格迁移、增删物体等操作，可实现复杂的图文编辑。使用方法｜ API参考

计费规则：按成功生成的图片张数计费，失败不计费也不占用免费额度。

中国大陆（北京）

模型名称	单价	免费额度（注）

qwen-image-edit-plus 当前与qwen-image-edit-plus-2025-10-30能力相同	0.2元/张	各100张有效期：阿里云百炼开通后90天内
qwen-image-edit-plus-2025-10-30	0.2元/张
qwen-image-edit	0.3元/张

国际（新加坡）

模型名称	单价	免费额度
qwen-image-edit-plus 当前与qwen-image-edit-plus-2025-10-30能力相同	0.220177元/张	无免费额度
qwen-image-edit-plus-2025-10-30	0.220177元/张
qwen-image-edit	0.330266元/张

dog_and_girl (1)

原图

狗修改图

将图中的人物改为站立姿势，弯腰握住狗的前爪

原图

将字母块上的单词'HEALTH INSURANCE’ 替换为'明天会更好'

原图

5out

用浅蓝色衬衫替换圆点衬衫

原图

6out

将图中背景改为南极

原图

7out

生成人物的卡通头像

原图

删除餐盘上的头发

通义千问图像翻译

通义千问图像翻译模型支持将11种语言图片的文字翻译成中文或英文，能精准保留原始排版与内容信息，并提供术语定义、敏感词过滤、图像主体检测等自定义功能。API参考

计费规则：按成功生成的图片张数计费，失败不计费也不占用免费额度。

说明

仅支持中国大陆（北京）地域。

模型名称

单价

免费额度（注）

_{有效期：阿里云百炼开通后90天内}

qwen-mt-image

0.003元/张

100张

原图

日语

葡语

阿拉伯语

通义-文生图-Z-Image

通义-文生图-Z-Image 是一款轻量级文生图模型，可快速生成高质量图像，支持中英双语渲染、复杂语义理解和多风格题材，并可灵活适配多种分辨率与宽高比。API参考

计费规则：按成功生成的图片张数计费，失败不计费也不占用免费额度。

中国大陆（北京）

模型名称

单价

免费额度（注）

_{有效期：阿里云百炼开通后90天内}

z-image-turbo

关闭提示词改写（prompt_extend=false）：0.1元/张

开启提示词改写（prompt_extend=true）：0.2元/张

100张

国际（新加坡）

模型名称

单价

免费额度（注）

_{有效期：阿里云百炼开通后90天内}

z-image-turbo

关闭提示词改写（prompt_extend=false）：0.110089元/张

开启提示词改写（prompt_extend=true）：0.220177元/张

无免费额度

输入提示词

输出图像

film grain, analog film texture, soft film lighting, Kodak Portra 400 style, cinematic grainy texture, photorealistic details, subtle noise, (film grain:1.2)。采用近景特写镜头拍摄的东亚年轻女性，呈现户外雪地场景。她体型纤瘦，呈站立姿势，身体微微向右侧倾斜，头部抬起看向画面上方，姿态自然放松。她的面部是典型东亚长相，肤色白皙，脸颊带有自然的红润感，五官清秀：眼睛是深棕色，眼型偏圆，眼神略带惊讶地望向上方，眼白部分可见；眉毛是深黑色，形状自然弯长；鼻子小巧挺直，嘴唇涂有红色口红，唇瓣微张，表情带着轻微的惊讶或好奇。她的头发是深黑色长直发，发丝被风吹得略显凌乱，部分垂在脸颊两侧，头顶佩戴一顶深灰色的头盔，头盔边缘露出少量发丝。服装是蓝白拼接的厚重外套，外套材质看起来是毛绒与布料结合，显得温暖厚实，适合雪地环境。背景是被白雪覆盖的户外场景，远处可见模糊的树木轮廓，天空是明亮的浅蓝色，带有少量白云，光线是强烈的自然日光，照亮人物面部与头发，形成清晰的光影，色调以蓝、白、黑为主，整体风格清新自然。画面顶部有黑色提示框，内有“Press esc to exit full screen”的白色文字。镜头的近景视角放大了人物的表情与细节，营造出户外雪地的真实氛围。

通义万相文生图

文生图V2版

通义万相文生图模型根据文本生成精美的图片。推荐选择最新版的模型开启文生图创作。使用方法｜ API参考｜在线体验

计费规则：按成功生成的图片张数计费，失败不计费也不占用免费额度。

中国大陆（北京）

模型名称	说明	单价	免费额度（注） _{有效期：阿里云百炼开通后90天内}
wan2.6-t2i `推荐`	万相2.6。支持新增的同步接口，同时支持在总像素面积与宽高比约束内，自由选尺寸。	0.20元/张	50张
wan2.5-t2i-preview `推荐`	万相2.5 preview。取消单边限制，在总像素面积与宽高比约束内，自由选尺寸。	0.20元/张	50张
wan2.2-t2i-plus	万相2.2专业版。在创意性、稳定性、写实质感上全面升级。	0.20元/张	100张
wan2.2-t2i-flash	万相2.2极速版。在创意性、稳定性、写实质感上全面升级。	0.14元/张	100张
wanx2.1-t2i-plus	万相2.1专业版。支持多种风格，生成图像细节丰富。	0.20元/张	500张
wanx2.1-t2i-turbo	万相2.1极速版。支持多种风格，生成速度快。	0.14元/张	500张
wanx2.0-t2i-turbo	万相2.0极速版。擅长质感人像与创意设计，性价比高。	0.04元/张	500张

国际（新加坡）

模型名称	说明	单价	免费额度
wan2.6-t2i `推荐`	万相2.6。支持新增的同步接口，同时支持在总像素面积与宽高比约束内，自由选尺寸。	0.220177元/张	无免费额度
wan2.5-t2i-preview `推荐`	万相2.5 preview。取消单边限制，在总像素面积与宽高比约束内，自由选尺寸。	0.220177元/张	无免费额度
wan2.2-t2i-plus	万相2.2专业版。在创意性、稳定性、写实质感上全面升级。	0.366962元/张	无免费额度
wan2.2-t2i-flash	万相2.2极速版。在创意性、稳定性、写实质感上全面升级。	0.183481元/张	无免费额度
wan2.1-t2i-plus	万相2.1专业版。支持多种风格，生成图像细节丰富。	0.366962元/张	无免费额度
wan2.1-t2i-turbo	万相2.1极速版。支持多种风格，生成速度快。	0.183481元/张	无免费额度

文生图V1版

说明

推荐使用全面升级的文生图V2版模型。
仅支持中国大陆（北京）地域。

可以基于输入的文本生成图片。此外，还支持输入参考图片，并参考图片内容或者图片风格进行图片生成。API参考 | 在线体验

模型名称

示例输入

示例输出

单价

免费额度（注）

wanx-v1

参考图

提示词：一只小狗在笑

小狗在笑

0.16元/张

500张

有效期：百炼开通后90天内

通义万相图像生成与编辑2.6

通义万相图像生成模型支持图像编辑、图文混合输出，满足多样化生成与集成需求。API参考

计费规则：按成功生成的图片张数计费，失败不计费也不占用免费额度。

中国大陆（北京）

模型名称

单价

免费额度（注）

_{有效期：阿里云百炼开通后90天内}

wan2.6-image

0.20元/张

50张

国际（新加坡）

模型名称	单价	免费额度

wan2.6-image	0.220177元/张	无免费额度

通义万相通用图像编辑2.5

通义万相-通用图像编辑2.5模型支持输入文本、单图或多图实现基于主体一致性的图像编辑、多图融合创作等能力。API参考

计费规则：按成功生成的图片张数计费，失败不计费也不占用免费额度。

中国大陆（北京）

模型名称

单价

免费额度（注）

_{有效期：阿里云百炼开通后90天内}

wan2.5-i2i-preview

0.20元/张

50张

国际（新加坡）

模型名称	单价	免费额度

wan2.5-i2i-preview	0.220177元/张	无免费额度

模型功能

输入示例

输出图像

单图编辑

damotest2023_Portrait_photography_outdoors_fashionable_beauty_409ae3c1-19e8-4515-8e50-b3c9072e1282_2-转换自-png

a26b226d-f044-4e95-a41c-d1c0d301c30b-转换自-png

将花卉连衣裙换成一件复古风格的蕾丝长裙，领口和袖口有精致的刺绣细节。

多图融合

p1028883

将图1中的闹钟放置到图2的餐桌的花瓶旁边位置

通义万相通用图像编辑2.1

通义万相-通用图像编辑模型通过简单的指令即可实现多样化的图像编辑，适用于扩图、去水印、风格迁移、图像修复、图像美化等场景。使用方法| API参考

说明

仅支持中国大陆（北京）地域。

模型名称

计费单价

免费额度

wanx2.1-imageedit

0.14元/张

新人免费额度：500张

有效期：百炼开通后90天内

目前通用图像编辑支持以下功能：

模型功能	输入图像	输入提示词	输出图像
全局风格化		转换成法国绘本风格
局部风格化		把房子变成木板风格。
指令编辑		把女孩的头发修改为红色。
局部重绘	输入图像涂抹区域图像（白色为涂抹区域）	一只陶瓷兔子抱着一朵陶瓷花。	输出图像
去文字水印		去除图像中的文字。
扩图		一位绿色仙子。
图像超分	模糊图像	图像超分。	清晰图像
图像上色		蓝色背景，黄色的叶子。
线稿生图		北欧极简风格的客厅。
垫图		卡通形象小心翼翼地探出头，窥视着房间内一颗璀璨的蓝色宝石。

通义万相涂鸦作画

基于输入的手绘图加文字描述，即可生成精美的涂鸦绘画作品。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

示例输入

示例输出

单价

免费额度（注）

wanx-sketch-to-image-lite

提示词：一棵参天大树

0.06元/张

500张

有效期：百炼开通后90天内

通义万相图像局部重绘

根据用户输入的原始图片和局部涂抹图、prompt提示词文字内容，生成符合语义描述的多样化风格的局部重绘图像。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

示例输入

示例输出

单价

免费额度（注）

wanx-x-painting

output16

布局涂抹图：

output30

提示词：一只狗戴着红色眼镜

output17

目前仅供免费体验。

免费额度用完后不可调用，推荐参考图像编辑-通义千问或图像编辑-通义万相2.1获取替代方案。

500张

有效期：百炼开通后90天内

人像风格重绘

人像风格重绘可以将输入的人物图像进行多种风格化的重绘生成，使新生成的图像在兼顾原始人物相貌的同时，带来不同风格的绘画效果。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

示例输入

示例输出

单价

免费额度（注）

wanx-style-repaint-v1

风格：清雅国风

0.12元/张

500张

有效期：百炼开通后90天内

图像背景生成

图像背景生成可以基于输入的前景图像素材拓展生成背景信息，实现自然的光影融合效果，与细腻的写实画面生成。支持文本描述、图像引导等多种方式，同时支持对生成的图像智能添加文字内容。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

示例输入

示例输出

单价

免费额度（注）

wanx-background-generation-v2

output19

提示词：在桌面上，旁边有插着花朵的花瓶，背后是纯色高级的背景墙。

output20

0.08元/张

500张

有效期：百炼开通后90天内

图像画面扩展

图像画面大模型，对输入图像进行画面自由扩展，支持旋转画面，支持按照扩展系数和扩展像素数两种方式进行扩图。用户可以通过指定宽度、高度画面扩展比例或者左、右、上、下的扩展的像素值来控制画面扩展，可用于创意娱乐、辅助作图、画面设计、影视后期制作等场景。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

示例输入

示例输出

单价

免费额度（注）

image-out-painting

0.18元/张

500张

有效期：百炼开通后90天内

人物实例分割

输入人物图像，模型识别出图像中的不同人物对象并画出每个对象边界的像素级掩码。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

示例输入

示例输出

单价

免费额度

（注）

image-instance-segmentation

输出结果1：像素级掩码图像

输出结果2：可视化图像

目前仅供免费体验。

免费额度用完后不可调用，敬请关注后续动态。

500张

有效期：百炼开通后90天内

图像擦除补全

输入图像并指定待擦除区域掩码图像以及保留区域掩码图像，模型在保留原图背景的同时擦除指定图像区域。API参考

针对人物图像的擦除、补全，推荐通过人物实例分割得到图像中不同人物对象的图像掩码，选择完整的人物图像掩码擦除一个或多个人物。

说明

仅支持中国大陆（北京）地域。

模型名称

示例输入

示例输出

单价

免费额度

（注）

image-erase-completion

原图

图片擦除2-原图.png

待擦除区域

图片擦除2-擦除.png

保留区域

图片擦除2-保留.png

输出图像

目前仅供免费体验。

免费额度用完后不可调用，推荐参考图像编辑-通义千问或图像编辑-通义万相2.1获取替代方案。

500张

有效期：百炼开通后90天内

虚拟模特

可以对上传的真人实拍商品展示图进行智能生成，将其中的模特和背景替换为心仪的内容，在保持人物姿态不变的情况下，使用虚拟模特对商品进行更加精美、多样的展示。支持各种与模特产生互动的商品，如手持小商品、服装、鞋靴、配饰等。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

版本

模型简介

单价

免费额度（注）

wanx-virtualmodel

支持真人实拍图上传

图片短边：512像素或1024像素

目前仅供免费体验。

免费额度用完后不可调用，推荐参考图像编辑-通义千问或图像编辑-通义万相2.1获取替代方案。

500张

有效期：百炼开通后90天内

virtualmodel-v2

支持真人、人台实拍图上传
图片短边为：1024像素或2048像素
支持改变图片的长宽比
文本引导效果更准确

输入图

参数配置

输出图

v1 真人图

"prompt":"一位年轻男性站着摆拍，在空荡的卧室里，窗户旁边，阳光照射进来，highly detailed，8K，极简主义风格"

"face_prompt":"英俊的男性，脸好，脸美，质量上乘，杰作，（逼真度：1.4）"

"predefined_face_id":"boy3"

v1输出

v2人台图

"prompt":"A woman stands beside a luxurious swimming pool, her attire and posture suggesting leisure and relaxation. The pool's calm, crystal-clear waters reflect the surrounding opulent setting, with elegant lounge chairs inviting moments of repose under the sun. Perhaps it's a high-end resort or an upscale private villa, where the tiled pool deck and meticulously landscaped greenery speak of exclusivity and refinement."

"face_prompt":"good face, beautiful face, best quality."

"aspect_ratio":"4:3"

"realPerson":false

v2输出

鞋靴模特

鞋靴模特支持输入多视角鞋靴系列图片，同时对输入模特模板图的鞋子区域进行鞋靴AI试穿，实现模特鞋靴布局重绘生成，最终生成图片的效果，布局自然、细节丰富、画面细腻、试穿结果逼真。可用于模特商品图设计、新鞋AI试穿、模特穿戴布局重绘等场景。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

示例输入

示例输出

单价

免费额度

（注）

shoemodel-v1

目前仅供免费体验。

免费额度用完后不可调用，敬请关注后续动态。

500张

有效期：百炼开通后90天内

创意海报生成

根据您的要求自动生成海报的背景和文字排版，支持多种海报风格。无需设计基础，轻松制作出彩作品，让创意触手可及。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

示例输入

示例输出

单价

免费额度（注）

wanx-poster-generation-v1

"title":"元宵节",

"sub_title":"正月十五",

"body_text":"团圆时节，汤圆香甜，祝你幸福美满！",

"prompt_text_zh":"灯笼，小猫，梅花",

"wh_ratios":"竖版",

"lora_name":"童话油画",

目前仅供免费体验。

免费额度用完后不可调用，推荐参考图像编辑-通义千问或图像编辑-通义万相2.1获取替代方案。

500张

有效期：百炼开通后90天内

人物写真生成-FaceChain

人物图像检测：对用户上传的人物图像进行检测，判断其中所包含的人脸是否符合Facechain微调所需的标准，检测维度包括人脸数量、大小、角度、光照、清晰度等多维度，支持图像组输入，并返回每张图像对应的检测结果。API参考
人物形象训练：对上传的图像进行模型训练，从而获得该图像中对应人物的resource，基于该resource可以实现人物的写真生成。API参考
人物写真生成：基于人物形象训练已经得到的形象，可以继续通过人物生成写真模型完成该形象的写真生成，支持多种预设风格，包括证件照、商务写真等。API参考

说明

仅支持中国大陆（北京）地域。

模型名称	说明	示例输入	示例输出	单价	免费额度（注）
facechain-facedetect	人物图像检测	风格：商务写真		限时免费	限时免费
facechain-finetune	人物形象训练			2.5元/次	50次有效期：申请通过后90天内
facechain-generation	人物写真生成			0.18元/张	500张有效期：申请通过后90天内

创意文字生成-WordArt锦书

文字纹理生成：可以对输入的文字内容或文字图片进行创意设计，根据提示词内容对文字添加材质和纹理，实现立体凸显或场景融合的效果，生成效果精美、风格多样的艺术字，结合背景可以直接作为文字海报使用。API参考
文字变形：可以对输入的文字边缘轮廓进行创意变形，根据提示词内容进行边缘变化，实现一种字体的更多种创意用法，返回带有文字内容的黑底白色mask图。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

说明

示例输入

示例输出

单价

免费额度（注）

wordart-texture

文字纹理生成

output23

提示词：精美玉石

风格类型：立体材质

output24

0.08元/张

各500张

有效期：百炼开通后90天内

wordart-semantic

文字变形

文字：桂林山水

提示词：山峦叠嶂、漓江蜿蜒、岩石奇秀

output25

0.24元/张

AI试衣

AI试衣-基础版是一款虚拟试衣图片生成模型，基于人像照片及服装图生成穿着后的试衣图片。API参考 | 在线体验
AI试衣-Plus版相较于基础版模型，在图片清晰度、服饰纹理细节和logo还原效果等方面均有提升，但生成耗时较长，适用于对时效性要求不高的场景。API参考 | 在线体验
AI试衣-图片分割支持对模特图、服饰图进行分割，可用于AI试衣图片的前后处理。API参考
AI试衣-图片精修是对AI试衣生成的效果图进行二次生成，输出还原度更高的精修试衣效果图。API参考

说明

仅支持中国大陆（北京）地域。

模型名称	说明	示例输入	示例输出	免费额度（注）
aitryon	AI试衣-基础版			各400张有效期：百炼开通后90天内
aitryon-plus	AI试衣-Plus版
aitryon-parsing-v1	AI试衣-图片分割
aitryon-refiner	AI试衣-图片精修			100张有效期：百炼开通后90天内

AI试衣计费单价

模型服务	模型名称	计量单价	折扣	阶梯层级
AI试衣-基础版	aitryon	0.20元/张	无	无
AI试衣-Plus版	aitryon-plus	0.50元/张	无	无
AI试衣-图片分割	aitryon-parsing-v1	0.004元/张	无	无
AI试衣-图片精修	aitryon-refiner	0.30元/张	无	生成数量 ≤ 25张
		0.275元/张	9.2折	25张＜生成数量 ≤ 125张
		0.25元/张	8.4折	125张＜生成数量 ≤ 250张
		0.225元/张	7.5折	250张＜生成数量 ≤ 1250张
		0.2元/张	6.7折	1250张＜生成数量 ≤ 2500张
		0.175元/张	5.8折	2500张＜生成数量 ≤ 2.5万张
		0.15元/张	5折	生成数量＞ 2.5万张

图像生成-第三方模型

Stable Diffusion

API参考

说明

仅支持中国大陆（北京）地域。

模型名称	说明	单价	免费额度（注）
stable-diffusion-3.5-large	具有8亿参数的多模态扩散变压器（MMDiT）文本到图像生成模型，具备卓越的图像质量和提示词匹配度，支持生成100万像素的高分辨率图像，且能够在普通消费级硬件上高效运行。相比于v1.5和xl，在图像质量、文本内容生成、复杂提示理解和资源效率方面均有显著提升。	目前仅供免费体验。免费额度用完后不可调用，推荐参考文本生成图像获取替代方案	500张有效期：申请通过后90天内
stable-diffusion-3.5-large-turbo	在stable-diffusion-3.5-large的基础上采用对抗性扩散蒸馏（ADD）技术的模型，具备更快的速度。
stable-diffusion-xl	相比v1.5做了重大改进，被认为是当前开源文生图模型的SOTA水准，具体改进包括：unet backbone是之前的3倍；增加了refinement模块用于改善生成图片的质量；更高效的训练技巧等。
stable-diffusion-v1.5	通过clip模型将文本的embedding和图片embedding映射到相同空间，从而通过输入文本并结合unet的稳定扩散预测噪声的能力，生成图片。是一款基础的文生图模型，得到了业界广泛使用。

FLUX

Black Forest Labs的开源文生图模型，尤其擅长生成包含文字、多主体、手部细节的图片。

文生图FLUX | 立即申请（flux-merged） | 立即申请（flux-dev） | 立即申请（flux-schnell）

说明

仅支持中国大陆（北京）地域。

模型名称	说明	单价	免费额度（注）
flux-merged	结合了flux-dev的深度和flux-schnell的快速执行。	目前仅供免费体验。免费额度用完后不可调用，推荐参考文本生成图像获取替代方案	100张有效期：百炼开通后90天内
flux-dev	开发者版，面向非商业应用，具有与专业版相近的图像质量和指令遵循能力，同时运行效率更高。
flux-schnell	快速版，轻量级模型。

语音合成（文本转语音）

通义千问语音合成

支持输入多语种混合文本，并流式输出音频。使用方法｜API 参考

中国大陆（北京）

通义千问3-TTS-Flash

模型名称	版本	单价	最大输入字符数	支持的语种	免费额度（注）
qwen3-tts-flash 当前能力等同 qwen3-tts-flash-2025-09-18	稳定版	0.8元/万字符	600	中文（普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语）、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语	2025年11月13日0点前开通阿里云百炼：2000字符 2025年11月13日0点后开通阿里云百炼：1万字符有效期：阿里云百炼开通后90天内
qwen3-tts-flash-2025-11-27	快照版				1万字符有效期：阿里云百炼开通后90天内
qwen3-tts-flash-2025-09-18	快照版				2025年11月13日0点前开通阿里云百炼：2000字符 2025年11月13日0点后开通阿里云百炼：1万字符有效期：阿里云百炼开通后90天内

按输入的字符数计费，计算规则如下：

一个汉字（包括简/繁体汉字、日文汉字和韩文汉字） = 2个字符
其他，如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问-TTS

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
		（Token数）			（每千Token）
qwen-tts 当前与 qwen-tts-2025-04-10 能力相同	稳定版	8,192	512	7,680	0.0016元	0.01元	各100万Token 有效期：阿里云百炼开通后90天内
qwen-tts-latest 始终与最新快照版能力相同	最新版
qwen-tts-2025-05-22	快照版
qwen-tts-2025-04-10

音频转换为 Token 的规则：每1秒的音频对应 50个 Token 。若音频时长不足1秒，则按 50个 Token 计算。

国际（新加坡）

模型名称	版本	单价	最大输入字符数	支持的语种
qwen3-tts-flash 当前能力等同 qwen3-tts-flash-2025-09-18	稳定版	0.733924元/万字符	600	中文（普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语）、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语
qwen3-tts-flash-2025-11-27	快照版
qwen3-tts-flash-2025-09-18	快照版

按输入的字符数计费，计算规则如下：

一个汉字（包括简/繁体汉字、日文汉字和韩文汉字） = 2个字符
其他，如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问实时语音合成

支持文本的流式输入并流式输出音频，具有根据文本内容与标点符号自适应调节语音语速的能力。使用方法 | API参考

通义千问3-TTS-VD-Realtime支持使用声音设计音色进行实时语音合成，但不支持使用默认音色。

通义千问3-TTS-VC-Realtime支持使用声音复刻音色进行实时语音合成，但不支持使用默认音色。

通义千问3-TTS-Flash-Realtime和通义千问-TTS-Realtime仅可使用默认音色，但不支持使用声音复刻/设计音色。

中国大陆（北京）

通义千问3-TTS-VD-Realtime

模型名称

版本

单价

支持的语种

免费额度（注）

qwen3-tts-vd-realtime-2025-12-16

快照版

1元/万字符

中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

1万字符

有效期：阿里云百炼开通后90天内

按输入的字符数计费，计算规则如下：

一个汉字（包括简/繁体汉字、日文汉字和韩文汉字） = 2个字符
其他，如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问3-TTS-VC-Realtime

模型名称

版本

单价

支持的语种

免费额度（注）

qwen3-tts-vc-realtime-2025-11-27

快照版

1元/万字符

中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

1万字符

有效期：阿里云百炼开通后90天内

按输入的字符数计费，计算规则如下：

一个汉字（包括简/繁体汉字、日文汉字和韩文汉字） = 2个字符
其他，如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问3-TTS-Flash-Realtime

模型名称	版本	单价	支持的语种	免费额度（注）
qwen3-tts-flash-realtime 当前能力等同 qwen3-tts-flash-realtime-2025-09-18	稳定版	1元/万字符	中文（普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语）、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语	2025年11月13日0点前开通阿里云百炼：2000字符 2025年11月13日0点后开通阿里云百炼：1万字符有效期：阿里云百炼开通后90天内
qwen3-tts-flash-realtime-2025-11-27	快照版			1万字符有效期：阿里云百炼开通后90天内
qwen3-tts-flash-realtime-2025-09-18	快照版			2025年11月13日0点前开通阿里云百炼：2000字符 2025年11月13日0点后开通阿里云百炼：1万字符有效期：阿里云百炼开通后90天内

按输入的字符数计费，计算规则如下：

一个汉字（包括简/繁体汉字、日文汉字和韩文汉字） = 2个字符
其他，如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问-TTS-Realtime

模型名称	版本	上下文长度	最大输入	最大输出	输入成本	输出成本	支持的语种	免费额度（注）
		（Token数）			（每千Token）
qwen-tts-realtime 当前能力等同 qwen-tts-realtime-2025-07-15	稳定版	8,192	512	7,680	0.0024元	0.012元	中文、英文	各100万Token 有效期：阿里云百炼开通后90天内
qwen-tts-realtime-latest 当前能力等同 qwen-tts-realtime-2025-07-15	最新版						中文、英文
qwen-tts-realtime-2025-07-15	快照版						中文、英文

音频转换为 Token 的规则：每1秒的音频对应 50个 Token 。若音频时长不足1秒，则按 50个 Token 计算。

国际（新加坡）

通义千问3-TTS-VD-Realtime

模型名称	版本	单价	支持的语种
qwen3-tts-vd-realtime-2025-12-16	快照版	0.954101元/万字符	中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

按输入的字符数计费，计算规则如下：

一个汉字（包括简/繁体汉字、日文汉字和韩文汉字） = 2个字符
其他，如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问3-TTS-VC-Realtime

模型名称	版本	单价	支持的语种
qwen3-tts-vc-realtime-2025-11-27	快照版	0.954101元/万字符	中文、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语

按输入的字符数计费，计算规则如下：

一个汉字（包括简/繁体汉字、日文汉字和韩文汉字） = 2个字符
其他，如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问3-TTS-Flash-Realtime

模型名称	版本	单价	支持的语种
qwen3-tts-flash-realtime 当前能力等同 qwen3-tts-flash-realtime-2025-09-18	稳定版	0.954101元/万字符	中文（普通话、北京、上海、四川、南京、陕西、闽南、天津、粤语）、英文、西班牙语、俄语、意大利语、法语、韩语、日语、德语、葡萄牙语
qwen3-tts-flash-realtime-2025-11-27	快照版
qwen3-tts-flash-realtime-2025-09-18	快照版

按输入的字符数计费，计算规则如下：

一个汉字（包括简/繁体汉字、日文汉字和韩文汉字） = 2个字符
其他，如一个英文字母、一个标点符号、一个空格 = 1个字符

通义千问声音复刻

声音复刻依托大模型进行特征提取，无需训练即可复刻声音。仅需提供 10~20 秒的音频，即可生成高度相似且听感自然的定制音色。使用方法 | API参考

中国大陆（北京）

模型名称

单价

免费额度（注）

qwen-voice-enrollment

0.01元/音色

1000个音色

有效期：阿里云百炼开通后90天内

国际（新加坡）

模型名称	单价
qwen-voice-enrollment	0.01元/音色

通义千问声音设计

声音设计通过文本描述生成定制化音色，支持多语言和多维度音色特征定义，适用于广告配音、角色塑造、有声内容创作等多种应用。使用方法 | API参考

中国大陆（北京）

模型名称

单价

免费额度（注）

qwen-voice-design

0.2元/音色

1000个音色

有效期：阿里云百炼开通后90天内

国际（新加坡）

模型名称	单价
qwen-voice-design	0.2元/音色

CosyVoice语音合成

CosyVoice是通义实验室依托大规模预训练语言模型，深度融合文本理解和语音生成的新一代生成式语音合成大模型，支持文本至语音的实时流式合成。使用方法 | API参考

说明

仅支持中国大陆（北京）地域。

模型名称	单价	免费额度（注）
cosyvoice-v3-plus	2元/万字符	2025年11月15日0点前开通阿里云百炼：2000字符 2025年11月15日0点后开通阿里云百炼：1万字符有效期：阿里云百炼开通后90天内
cosyvoice-v3-flash	1元/万字符
cosyvoice-v2	2元/万字符
cosyvoice-v1	2元/万字符

字符计算规则：汉字（包括简/繁体汉字、日文汉字和韩文汉字）按2个字符计算，其他所有字符（如字母、数字、日韩文假名/谚文等）均按 1个字符计算。SSML标签内容不计费。

Sambert语音合成

Sambert语音合成API基于达摩院改良的自回归韵律模型，支持文本至语音的实时流式合成。使用方法 | API参考

说明

仅支持中国大陆（北京）地域。

模型名称

单价

免费额度（注）

参见模型（音色）列表

1元/万字符

根据待合成字符数计费（其中1个汉字算2个字符，英文、标点符号、空格均按照1个字符计费）。SSML标签内容不计费。

每主账号每模型每月3万字符。

语音识别（语音转文本）与翻译（语音转成指定语种的文本）

通义千问3-LiveTranslate-Flash

通义千问3-LiveTranslate-Flash 是基于 Qwen3-Omni 架构的音视频翻译模型，支持 18 种语言（包括中文、英文、俄文、法文等）互译。该模型可结合视觉上下文提升翻译准确性，并输出文本与语音。使用方法｜API 参考

中国大陆（北京）

模型名称	版本	上下文长度	最大输入	最大输出	免费额度
		（Token数）
qwen3-livetranslate-flash 当前能力等同于qwen3-livetranslate-flash-2025-12-01	稳定版	53,248	49,152	4,096	各100万Token 有效期：阿里云百炼开通后90天内
qwen3-livetranslate-flash-2025-12-01	快照版

免费额度用完后，输入与输出的计费规则如下：

输入计费项

单价（每千 Token）

音频

0.01元

视频

音频部分单独计费。

0.004元

输出计费项	单价（每千 Token）
音频	0.04元
文本	0.01元

国际（新加坡）

模型名称	版本	上下文长度	最大输入	最大输出
		（Token数）
qwen3-livetranslate-flash 当前能力等同于qwen3-livetranslate-flash-2025-12-01	稳定版	53,248	49,152	4,096
qwen3-livetranslate-flash-2025-12-01	快照版

输入与输出的计费规则如下：

输入计费项

单价（每千 Token）

音频

0.011573元

视频

音频部分单独计费。

0.004629元

输出计费项	单价（每千 Token）
音频	0.046292元
文本	0.011573元

通义千问3-LiveTranslate-Flash-Realtime

qwen3-livetranslate-flash-realtime 是一款多语言音视频实时翻译模型，可识别 18 种语言，并实时翻译为 10 种语言的音频。

核心特性：

多语言支持：支持 18 种语言及 6 种汉语方言。包括中文、英文、法语、德语、俄语、日语、韩语等。支持普通话、粤语、四川话等方言。
视觉增强：利用视觉内容提升翻译准确性。模型通过分析口型、动作和画面中的文字，改善在嘈杂环境下或一词多义场景中的翻译效果。
3秒延迟：实现低至 3 秒的同传延迟。
无损同传：通过语义单元预测技术，解决跨语言语序问题。实时翻译质量接近离线翻译结果。
音色自然：生成音色自然的拟人语音。模型能根据源语音内容，自适应调节语气和情感。

使用方法 | API参考

中国大陆（北京）

模型名称	版本	上下文长度	最大输入	最大输出	免费额度（注）
		（Token数）
qwen3-livetranslate-flash-realtime 当前能力等同 qwen3-livetranslate-flash-realtime-2025-09-22	稳定版	53,248	49,152	4,096	各100万Token 有效期：阿里云百炼开通后90天内
qwen3-livetranslate-flash-realtime-2025-09-22	快照版

免费额度用完后，输入与输出的计费规则如下：

输入计费项	单价（每千 Token）
输入：音频	0.064元
输入：图片	0.008元

输出计费项	单价（每千 Token）
文本	0.064元
音频	0.24元

Token计算规则：

音频：输入或输出每秒音频均消耗 12.5 Token
图片：每输入 28*28 像素消耗 0.5 Token

国际（新加坡）

模型名称	版本	上下文长度	最大输入	最大输出
		（Token数）
qwen3-livetranslate-flash-realtime 当前能力等同 qwen3-livetranslate-flash-realtime-2025-09-22	稳定版	53,248	49,152	4,096
qwen3-livetranslate-flash-realtime-2025-09-22	快照版

输入与输出的计费规则如下：

输入计费项	单价（每千 Token）
输入：音频	0.073392元
输入：图片	0.009541元

输出计费项	单价（每千 Token）
文本	0.073392元
音频	0.278891元

Token计算规则：

音频：输入或输出每秒音频均消耗 12.5 Token
图片：每输入 28*28 像素消耗 0.5 Token

通义千问录音文件识别

基于通义千问多模态基座，支持多语言识别、歌唱识别、噪声拒识等功能。使用方法 | API参考

中国大陆（北京）

通义千问3-ASR-Flash-Filetrans

模型名称

版本

支持的语言

支持的采样率

单价

免费额度（注）

qwen3-asr-flash-filetrans

当前等同qwen3-asr-flash-filetrans-2025-11-17

稳定版

中文（普通话、四川话、闽南语、吴语、粤语）、英文、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语

任意

0.00022元/秒

36,000秒（10小时）

有效期：阿里云百炼开通后90天内

qwen3-asr-flash-filetrans-2025-11-17

快照版

通义千问3-ASR-Flash

模型名称

版本

支持的语言

支持的采样率

单价

免费额度（注）

qwen3-asr-flash

当前等同qwen3-asr-flash-2025-09-08

稳定版

16kHz

0.00022元/秒

36,000秒（10小时）

有效期：阿里云百炼开通后90天内

qwen3-asr-flash-2025-09-08

快照版

更多模型

基于Qwen-Audio训练，支持中英文识别，不建议用于生产环境。

Token计算规则：每秒音频转换为25个Token，不足1秒按1秒计算。

模型名称	版本	支持的语言	支持的格式	支持的采样率	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
					（Token数）			（每千Token）
qwen-audio-asr 当前等同qwen-audio-asr-2024-12-04	稳定版	中文、英文	音频	16kHz	8,192	6,144	2,048	目前仅供免费体验。免费额度用完后不可调用，推荐使用 Qwen3 ASR。		10万Token 有效期：阿里云百炼开通后90天内
qwen-audio-asr-latest 始终等同最新快照版	最新版
qwen-audio-asr-2024-12-04	快照版

国际（新加坡）

通义千问3-ASR-Flash-Filetrans

模型名称

版本

支持的语言

支持的采样率

单价

qwen3-asr-flash-filetrans

当前等同qwen3-asr-flash-filetrans-2025-11-17

稳定版

任意

0.00026元/秒

qwen3-asr-flash-filetrans-2025-11-17

快照版

通义千问3-ASR-Flash

模型名称

版本

支持的语言

支持的采样率

单价

qwen3-asr-flash

当前等同qwen3-asr-flash-2025-09-08

稳定版

16kHz

0.00026元/秒

qwen3-asr-flash-2025-09-08

快照版

通义千问实时语音识别

通义千问实时语音识别大模型具备自动语种识别功能，可识别 11 种语音类型，并能在复杂音频环境下较为准确地转录。使用方法 | API参考

中国大陆（北京）

模型名称

版本

支持的语言

支持的采样率

单价

免费额度（注）

qwen3-asr-flash-realtime

当前等同qwen3-asr-flash-realtime-2025-10-27

稳定版

中文（普通话、四川话、闽南语、吴语）、粤语、英语、日语、德语、韩语、俄语、法语、葡萄牙语、阿拉伯语、意大利语、西班牙语、印地语、印尼语、泰语、土耳其语、乌克兰语、越南语、捷克语、丹麦语、菲律宾语、芬兰语、冰岛语、马来语、挪威语、波兰语、瑞典语

8kHz、16kHz

0.00033元/秒

36,000秒（10小时）

有效期：阿里云百炼开通后90天内

qwen3-asr-flash-realtime-2025-10-27

快照版

国际（新加坡）

模型名称

版本

支持的语言

支持的采样率

单价

qwen3-asr-flash-realtime

当前等同qwen3-asr-flash-realtime-2025-10-27

稳定版

8kHz、16kHz

0.00066元/秒

qwen3-asr-flash-realtime-2025-10-27

快照版

Gummy语音识别/翻译

Gummy大模型支持实时语音识别与翻译，提供长语音识别/翻译与短语音（一句话）识别/翻译两个版本。

长语音识别/翻译

使用方法（语音识别、语音翻译） | API参考

说明

仅支持中国大陆（北京）地域。

模型名称

支持的语言

支持的采样率

适用场景

支持的音频格式

单价

免费额度（注）

gummy-realtime-v1

语音识别支持语种：中文（普通话、粤语）、英文、日语、韩语、德语、法语、俄语、西班牙语、意大利语、葡萄牙语、印尼语、阿拉伯语、泰语

支持的翻译语言对：

中文（普通话） → 英 / 日 / 韩 / 法 / 德 / 西班牙 / 俄 / 意大利
英文 → 中（普通话、粤语） / 日 / 韩 / 葡萄牙 / 法 / 德 / 俄 / 越南 / 西班牙 / 荷兰 / 丹麦 / 阿拉伯 / 意大利 / 印地 / 土耳其 / 马来 / 乌尔都
日语 → 泰 / 英 / 中（普通话）/ 越南 / 法 / 意大利 / 德 / 西班牙
韩语 → 泰 / 英 / 中（普通话）/ 越南 / 法 / 西班牙 / 俄 / 德
法语 → 泰 / 英 / 日 / 中（普通话） / 越南 / 德 / 意大利 / 西班牙 / 俄 / 葡萄牙
德语 → 泰 / 英 / 日 / 中（普通话）/ 法 / 越南 / 俄 / 西班牙 / 意大利 / 葡萄牙
西班牙语 → 泰 / 英 / 日 / 中（普通话） / 法 / 越南 / 意大利 / 德 / 俄 / 葡萄牙
俄语 → 泰 / 英 / 日 / 中（普通话、粤语）/ 法 / 越南 / 德 / 西班牙 / 意大利 / 葡萄牙
意大利语 → 泰 / 英 / 日 / 中（普通话） / 法 / 越南 / 西班牙 / 俄 / 德
葡萄牙语 → 英
印尼语 → 英
阿拉伯语 → 英
泰语 → 日 / 越南 / 法
印地语 → 英
丹麦语 → 英
乌尔都语 → 英
土耳其语 → 英
荷兰语 → 英
马来语 → 英
越南语 → 日 / 法
中文（粤语） → 中（普通话）/ 英

16kHz及以上

会议演讲、视频直播等长时间不间断识别的场景

pcm、wav、mp3、opus、speex、aac、amr

0.00015元/秒

36,000秒（10小时）

2025年1月17日0点前开通阿里云百炼：有效期至2025年7月15日

2025年1月17日0点起至9月8日11点前开通阿里云百炼：自开通日起90天有效

2025年9月8日11点后开通阿里云百炼：自开通日起90天有效

短语音（一句话）识别/翻译

使用方法（语音识别、语音翻译） | API参考

说明

仅支持中国大陆（北京）地域。

模型名称

支持的语言

支持的采样率

适用场景

支持的音频格式

单价

免费额度（注）

gummy-chat-v1

语音识别支持语种：中文（普通话、粤语）、英文、日语、韩语、德语、法语、俄语、西班牙语、意大利语、葡萄牙语、印尼语、阿拉伯语、泰语

支持的翻译语言对：

中文（普通话） → 英 / 日 / 韩 / 法 / 德 / 西班牙 / 俄 / 意大利
英文 → 中（普通话、粤语） / 日 / 韩 / 葡萄牙 / 法 / 德 / 俄 / 越南 / 西班牙 / 荷兰 / 丹麦 / 阿拉伯 / 意大利 / 印地 / 土耳其 / 马来 / 乌尔都
日语 → 泰 / 英 / 中（普通话）/ 越南 / 法 / 意大利 / 德 / 西班牙
韩语 → 泰 / 英 / 中（普通话）/ 越南 / 法 / 西班牙 / 俄 / 德
法语 → 泰 / 英 / 日 / 中（普通话） / 越南 / 德 / 意大利 / 西班牙 / 俄 / 葡萄牙
德语 → 泰 / 英 / 日 / 中（普通话）/ 法 / 越南 / 俄 / 西班牙 / 意大利 / 葡萄牙
西班牙语 → 泰 / 英 / 日 / 中（普通话） / 法 / 越南 / 意大利 / 德 / 俄 / 葡萄牙
俄语 → 泰 / 英 / 日 / 中（普通话、粤语）/ 法 / 越南 / 德 / 西班牙 / 意大利 / 葡萄牙
意大利语 → 泰 / 英 / 日 / 中（普通话） / 法 / 越南 / 西班牙 / 俄 / 德
葡萄牙语 → 英
印尼语 → 英
阿拉伯语 → 英
泰语 → 日 / 越南 / 法
印地语 → 英
丹麦语 → 英
乌尔都语 → 英
土耳其语 → 英
荷兰语 → 英
马来语 → 英
越南语 → 日 / 法
中文（粤语） → 中（普通话）/ 英

16kHz

对话聊天、指令控制、语音输入法、语音搜索等短时语音交互场景

pcm、wav、mp3、opus、speex、aac、amr

0.00015元/秒

36,000秒（10小时）

2025年1月17日0点前开通阿里云百炼：有效期至2025年7月15日

2025年1月17日0点起至9月8日11点前开通阿里云百炼：自开通日起90天有效

2025年9月8日11点后开通阿里云百炼：自开通日起90天有效

Fun-ASR语音识别

Fun-ASR是通义百聆旗下语音识别模型，提供录音文件识别和实时语音识别两个版本。

录音文件识别

使用方法 | API参考

中国大陆（北京）

模型名称	版本	支持的语言	支持的采样率	适用场景	支持的音频格式	单价	免费额度（注）
fun-asr 当前等同fun-asr-2025-11-07	稳定版	中文（普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语；并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等，包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音）、英文、日语	任意	视频直播、电话语音、会议同传等	aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv	0.00022元/秒	36,000秒（10小时）有效期：阿里云百炼开通后90天
fun-asr-2025-11-07 相较fun-asr-2025-08-25做了远场VAD优化，识别更准	快照版
fun-asr-2025-08-25		中文（普通话）、英文
fun-asr-mtl 当前等同fun-asr-mtl-2025-08-25	稳定版	中文（普通话、粤语）、英文、日语、韩语、越南语、印尼语、泰语、马来语、菲律宾语、阿拉伯语、印地语、保加利亚语、克罗地亚语、捷克语、丹麦语、荷兰语、爱沙尼亚语、芬兰语、希腊语、匈牙利语、爱尔兰语、拉脱维亚语、立陶宛语、马耳他语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、瑞典语
fun-asr-mtl-2025-08-25	快照版

国际（新加坡）

模型名称	版本	支持的语言	支持的采样率	适用场景	支持的音频格式	单价
fun-asr 当前等同fun-asr-2025-11-07	稳定版	中文（普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语；并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等，包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音）、英文、日语	任意	视频直播、电话语音、会议同传等	aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv	0.00026元/秒
fun-asr-2025-11-07 相较fun-asr-2025-08-25做了远场VAD优化，识别更准	快照版
fun-asr-2025-08-25		中文（普通话）、英文
fun-asr-mtl 当前等同fun-asr-mtl-2025-08-25	稳定版	中文（普通话、粤语）、英文、日语、韩语、越南语、印尼语、泰语、马来语、菲律宾语、阿拉伯语、印地语、保加利亚语、克罗地亚语、捷克语、丹麦语、荷兰语、爱沙尼亚语、芬兰语、希腊语、匈牙利语、爱尔兰语、拉脱维亚语、立陶宛语、马耳他语、波兰语、葡萄牙语、罗马尼亚语、斯洛伐克语、斯洛文尼亚语、瑞典语
fun-asr-mtl-2025-08-25	快照版

实时语音识别

使用方法 | API参考

中国大陆（北京）

模型名称	版本	支持的语言	支持的采样率	适用场景	支持的音频格式	单价	免费额度（注）
fun-asr-realtime 当前等同fun-asr-realtime-2025-11-07	稳定版	中文（普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语；并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等，包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音）、英文、日语	16kHz	视频直播、会议、电话客服等	pcm、wav、mp3、opus、speex、aac、amr	0.00033元/秒	36,000秒（10小时）有效期：阿里云百炼开通后90天
fun-asr-realtime-2025-11-07 相较fun-asr-realtime-2025-09-15做了远场VAD优化，识别更准	快照版
fun-asr-realtime-2025-09-15		中文（普通话）、英文

国际（新加坡）

模型名称

版本

支持的语言

支持的采样率

适用场景

支持的音频格式

单价

fun-asr-realtime

当前等同fun-asr-realtime-2025-11-07

稳定版

中文（普通话、粤语、吴语、闽南语、客家话、赣语、湘语、晋语；并支持中原、西南、冀鲁、江淮、兰银、胶辽、东北、北京、港台等，包括河南、陕西、湖北、四川、重庆、云南、贵州、广东、广西、河北、天津、山东、安徽、南京、江苏、杭州、甘肃、宁夏等地区官话口音）、英文、日语

16kHz

视频直播、会议、电话客服等

pcm、wav、mp3、opus、speex、aac、amr

0.00066元/秒

fun-asr-realtime-2025-11-07

快照版

Paraformer语音识别

Paraformer是通义实验室旗下的语音识别模型，提供录音文件识别和实时语音识别两个版本。

录音文件识别

使用方法 | API参考

说明

仅支持中国大陆（北京）地域。

模型名称	支持的语言	支持的采样率	适用场景	支持的音频格式	单价	免费额度（注）
paraformer-v2	中文（普通话、粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话、江西话、云南话、上海话）、英文、日语、韩语、德语、法语、俄语	任意	视频直播	aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv	0.00008元/秒	36,000秒（10小时）每月1日0点自动发放有效期1个月
paraformer-8k-v2	中文普通话	8kHz	电话语音
paraformer-v1	中文普通话、英文	任意	音频或视频
paraformer-8k-v1	中文普通话	8kHz	电话语音
paraformer-mtl-v1	中文（普通话、粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话）、英文、日语、韩语、西班牙语、印尼语、法语、德语、意大利语、马来语	16kHz及以上	音频或视频

实时语音识别

使用方法 | API参考

说明

仅支持中国大陆（北京）地域。

模型名称	支持的语言	支持的采样率	适用场景	支持的音频格式	单价	免费额度（注）
paraformer-realtime-v2	中文（普通话、粤语、吴语、闽南语、东北话、甘肃话、贵州话、河南话、湖北话、湖南话、宁夏话、山西话、陕西话、山东话、四川话、天津话、江西话、云南话、上海话）、英文、日语、韩语、德语、法语、俄语支持多个语种自由切换	任意	视频直播、会议等	pcm、wav、mp3、opus、speex、aac、amr	0.00024元/秒	36,000秒（10小时）每月1日0点自动发放有效期1个月
paraformer-realtime-v1	中文普通话	16kHz
paraformer-realtime-8k-v2		8kHz	电话客服等
paraformer-realtime-8k-v1

SenseVoice语音识别

说明

仅支持中国大陆（北京）地域。

录音文件识别

专注于高精度多语言语音识别，还能识别情绪（高兴、悲伤、生气等）和特定事件（背景音乐、歌唱、掌声和笑声等）。API参考

只识别并转写音频中的语音内容，非语音内容不计费。实际转写时长通常短于原始音频时长。由于采用AI判断，可能存在少许误差。

默认情况下，仅转写并计费多轨音频文件的首轨。若指定转写多个音轨，则各音轨按语音时长单独计费。

关于实际计费时长，请查看返回结果中的content_duration_in_milliseconds字段。

模型名称

支持的语言

支持的格式

单价

免费额度

sensevoice-v1

超过50种语言（中、英、日、韩、粤等）

附录：支持语言列表

音频或视频：aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv

0.0007 元/秒

36,000秒（10小时）

每月1日0点自动发放

有效期1个月

视频生成-通义万相与视频编辑

文生视频

通义万相-文生视频模型通过一句话即可生成视频，视频呈现丰富的艺术风格及影视级画质。API参考｜在线体验

计费规则：按成功生成的视频秒数计费，失败不计费也不占用免费额度。

中国大陆（北京）

模型名称	说明	单价	免费额度（注） _{有效期：阿里云百炼开通后90天内}
wan2.6-t2v`推荐`	万相2.6。新增多镜头叙事能力，同时支持自动配音和传入自定义音频文件。	720P：0.6元/秒 1080P：1元/秒	50秒
wan2.5-t2v-preview`推荐`	万相2.5 preview。支持自动配音和传入自定义音频文件。	480P：0.3元/秒 720P：0.6元/秒 1080P：1元/秒	50秒
wan2.2-t2v-plus	万相2.2专业版。指令理解更准，运动稳定流畅生成，生成细节更丰富。	480P：0.14元/秒 1080P：0.70元/秒	50秒
wanx2.1-t2v-turbo	万相2.1极速版。性价比高。	0.24元/秒	200秒
wanx2.1-t2v-plus	万相2.1专业版。画面更具质感。	0.70元/秒	200秒

国际（新加坡）

模型名称	说明	单价	免费额度（注）
wan2.6-t2v`推荐`	万相2.6。新增多镜头叙事能力，同时支持自动配音和传入自定义音频文件。	720P：0.733924元/秒 1080P：1.100886元/秒	无免费额度
wan2.5-t2v-preview`推荐`	万相2.5 preview。支持自动配音和传入自定义音频文件。	480P：0.366961元/秒 720P：0.733923元/秒 1080P：1.100885元/秒	无免费额度
wan2.2-t2v-plus	万相2.2专业版。在画面细节表现、运动稳定性方面均有显著提升。	480P：0.146785元/秒 1080P：0.733924元/秒	无免费额度
wan2.1-t2v-turbo	万相2.1极速版。生成速度快，表现均衡。	0.264213元/秒	无免费额度
wan2.1-t2v-plus	万相2.1专业版。生成细节丰富，画面更具质感。	0.733924元/秒	无免费额度

输入提示词

输出视频（wan2.6，多镜头视频）

一幅史诗级可爱的场景。一只小巧可爱的卡通小猫将军，身穿细节精致的金色盔甲，头戴一个稍大的头盔，勇敢地站在悬崖上。他骑着一匹虽小但英勇的战马，说：“青海长云暗雪山，孤城遥望玉门关。黄沙百战穿金甲，不破楼兰终不还”。悬崖下方，一支由老鼠组成的、数量庞大、无穷无尽的军队正带着临时制作的武器向前冲锋。这是一个戏剧性的、大规模的战斗场景，灵感来自中国古代的战争史诗。远处的雪山上空，天空乌云密布。整体氛围是“可爱”与“霸气”的搞笑和史诗般的融合。

图生视频-基于首帧

通义万相-图生视频模型将输入图片作为视频首帧，再根据提示词生成视频。视频呈现丰富的艺术风格及影视级画质。API参考｜在线体验

计费规则：按成功生成的视频秒数计费，失败不计费也不占用免费额度。

中国大陆（北京）

模型名称	说明	单价	免费额度（注） _{有效期：阿里云百炼开通后90天内}
wan2.6-i2v`推荐`	万相2.6。新增多镜头叙事能力，同时支持自动配音和传入自定义音频文件。	720P：0.6元/秒 1080P：1元/秒	50秒
wan2.5-i2v-preview`推荐`	万相2.5 preview。支持自动配音和传入自定义音频文件。	480P：0.3元/秒 720P：0.6元/秒 1080P：1元/秒	50秒
wan2.2-i2v-flash	万相2.2极速版。极致生成速度，指令理解与运镜控制更准，画面元素保持一致，稳定性与成功率全面提升。	480P：0.10元/秒 720P：0.20元/秒 1080P：0.48元/秒	50秒
wan2.2-i2v-plus	万相2.2专业版。指令理解更准，运镜可控，画面元素保持一致，稳定性与成功率全面提升，生成内容更丰富。	480P：0.14元/秒 1080P：0.70元/秒	50秒
wanx2.1-i2v-turbo	万相2.1极速版。性价比高。	0.24元/秒	200秒
wanx2.1-i2v-plus	万相2.1专业版。画面更具质感。	0.70元/秒	200秒

国际（新加坡）

模型名称	说明	单价	免费额度（注）
wan2.6-i2v`推荐`	万相2.6。新增多镜头叙事能力，同时支持自动配音和传入自定义音频文件。	720P：0.733924元/秒 1080P：1.100886元/秒	无免费额度
wan2.5-i2v-preview`推荐`	万相2.5 preview。支持自动配音和传入自定义音频文件。	480P：0.366961元/秒 720P：0.733923元/秒 1080P：1.100885元/秒	无免费额度
wan2.2-i2v-flash	万相2.2极速版。极致生成速度，在画面细节表现、运动稳定性方面均有显著提升。	480P：0.110089元/秒 720P：0.264213元/秒	无免费额度
wan2.2-i2v-plus	万相2.2专业版。在画面细节表现、运动稳定性方面均有显著提升。	480P：0.146785元/秒 1080P：0.733924元/秒	无免费额度
wan2.1-i2v-turbo	万相2.1极速版。生成速度快，表现均衡。	0.264213元/秒	无免费额度
wan2.1-i2v-plus	万相2.1专业版。生成细节丰富，画面更具质感。	0.733924元/秒	无免费额度

输入首帧图像和音频

输出视频（wan2.6，多镜头视频）

rap-转换自-png

输入音频：

输入提示词：一幅都市奇幻艺术的场景。一个充满动感的涂鸦艺术角色。一个由喷漆所画成的少年，正从一面混凝土墙上活过来。他一边用极快的语速演唱一首英文rap，一边摆着一个经典的、充满活力的说唱歌手姿势。场景设定在夜晚一个充满都市感的铁路桥下。灯光来自一盏孤零零的街灯，营造出电影般的氛围，充满高能量和惊人的细节。视频的音频部分完全由他的rap构成，没有其他对话或杂音。

图生视频-基于首尾帧

通义万相-首尾帧生视频模型，只需要提供首帧和尾帧图片，便能根据提示词生成一段丝滑流畅的动态视频。API参考｜在线体验

计费规则：按成功生成的视频秒数计费，失败不计费也不占用免费额度。

中国大陆（北京）

模型名称

说明

单价

免费额度（注）

_{有效期：阿里云百炼开通后90天内}

wan2.2-kf2v-flash

万相2.2极速版

480P：0.10元/秒

720P：0.20元/秒

1080P：0.48元/秒

50秒

wanx2.1-kf2v-plus

万相2.1专业版

720P：0.70元/秒

200秒

国际（新加坡）

模型名称	单价	免费额度（注）
wan2.1-kf2v-plus	0.733924元/秒	无免费额度

输入示例			输出视频
首帧图片	尾帧图片	提示词	输出视频
		写实风格，一只黑色小猫好奇地看向天空，镜头从平视逐渐上升，最后俯拍小猫好奇的眼神。

参考生视频

通义万相-参考生视频模型支持参考输入视频中的角色形象和音色，搭配提示词生成保持角色一致性的视频。API参考

计费规则：输入视频和输出视频均计费，按视频秒数计费，失败不计费也不占用免费额度。

输入视频的计费时长不超过 5 秒，具体规则参见计费与限流。
输出视频的计费时长为成功生成的视频秒数。

中国大陆（北京）

模型名称

输入单价

输出单价

免费额度（注）

wan2.6-r2v

720P：0.6元/秒

1080P：1元/秒

720P：0.6元/秒

1080P：1元/秒

50秒

有效期：百炼开通后90天内

国际（新加坡）

模型名称

输入单价

输出单价

免费额度（注）

wan2.6-r2v

720P：0.733924元/秒

1080P：1.100886元/秒

720P：0.733924元/秒

1080P：1.100886元/秒

无免费额度

通用视频编辑

通义万相-视频编辑统一模型支持多模态输入，包括文本、图像和视频，能够执行视频生成与通用编辑任务。API参考

计费规则：按成功生成的视频秒数计费，失败不计费也不占用免费额度。

中国大陆（北京）

模型名称

单价

免费额度（注）

wanx2.1-vace-plus

0.70元/秒

50秒

有效期：百炼开通后90天内

国际（新加坡）

模型名称	单价	免费额度（注）
wan2.1-vace-plus	0.733924元/秒	无免费额度

模型功能	输入参考图	输入提示词	输出视频
多图参考	参考图1（参考主体）参考图2（参考背景）	视频中，一位女孩自晨雾缭绕的古老森林深处款款走出，她步伐轻盈，镜头捕捉她每一个灵动瞬间。当女孩站定，环顾四周葱郁林木时，她脸上绽放出惊喜与喜悦交织的笑容。这一幕，定格在了光影交错的瞬间，记录下女孩与大自然的美妙邂逅。	输出视频
视频重绘		视频展示了一辆黑色的蒸汽朋克风格汽车，绅士驾驶着，车辆装饰着齿轮和铜管。背景是蒸汽驱动的糖果工厂和复古元素，画面复古与趣味
局部编辑	输入视频输入掩码图像（白色区域表示编辑区域）	视频展示了一家巴黎风情的法式咖啡馆，一只穿着西装的狮子优雅地品着咖啡。它一手端着咖啡杯，轻轻啜饮，神情惬意。咖啡馆装饰雅致，柔和的色调与温暖灯光映照着狮子所在的区域。	根据提示词修改编辑区域的内容
视频延展	输入首片段视频（1秒）	一只戴着墨镜的狗在街道上滑板，3D卡通。	输出延长后的视频（5秒）
视频画面扩展		一位优雅的女士正在激情演奏小提琴，她身后是一支完整的交响乐团。

通义万相-数字人

基于单张人物图片和音频，生成动作自然的说话、唱歌或表演视频。使用时需依次调用下述模型。wan2.2-s2v 图像检测 | wan2.2-s2v 视频生成

说明

仅支持中国大陆（北京）地域。

模型名称	模型简介	计费单价	免费额度

wan2.2-s2v-detect	检查输入图像是否满足要求（如清晰度、单人、正面）。	0.004元/张	免费额度：200张有效期：阿里云百炼开通后90天内
wan2.2-s2v	根据检测通过的图片和一段音频，生成人物动态视频。	480P：0.5元/秒 720P：0.9元/秒	免费额度：100秒有效期：阿里云百炼开通后90天内

输入示例

输出视频

p1001125-转换自-jpeg

输入音频：

通义万相-图生动作

提供标准和专业两种服务模式，基于人物图片和参考视频，将视频角色的动作、表情迁移到图片角色中，生成人物动作视频，赋予图片角色动态表现力。API参考

中国大陆（北京）

模型名称	模型服务	服务简介	计费单价	免费额度（查看）
wan2.2-animate-move	标准模式`wan-std`	生成速度快，满足基础动画演示等轻需求，性价比高。	0.4元/秒	两种服务共50秒
wan2.2-animate-move	专业模式`wan-pro`	动画流畅度高，动作表情过渡自然，效果更接近真实拍摄。	0.6元/秒	两种服务共50秒

国际（新加坡）

模型名称	模型服务	服务简介	计费单价	免费额度（查看）
wan2.2-animate-move	标准模式`wan-std`	生成速度快，满足基础动画演示等轻需求，性价比高。	0.880709元/秒	无免费额度
wan2.2-animate-move	专业模式`wan-pro`	动画流畅度高，动作表情过渡自然，效果更接近真实拍摄。	1.321063元/秒	无免费额度

人物图片	参考视频	输出视频（标准模式）	输出视频（专业模式）

通义万相-视频换人

提供标准和专业两种服务模式，基于人物图片和参考视频，将视频中的主角替换为图片中的角色，同时保留原视频的场景、光照和色调。API 参考

中国大陆（北京）

模型名称	模型服务	服务简介	计费单价	免费额度（查看）
wan2.2-animate-mix	标准模式`wan-std`	生成速度快，满足基础动画演示等轻需求，性价比高。	0.6元/秒	两种服务共50秒
wan2.2-animate-mix	专业模式`wan-pro`	动画流畅度高，动作表情过渡自然，效果更接近真实拍摄。	0.9元/秒	两种服务共50秒

国际（新加坡）

模型名称	模型服务	服务简介	计费单价	免费额度（查看）
wan2.2-animate-mix	标准模式`wan-std`	生成速度快，满足基础动画演示等轻需求，性价比高。	1.321063元/秒	无免费额度
wan2.2-animate-mix	专业模式`wan-pro`	动画流畅度高，动作表情过渡自然，效果更接近真实拍摄。	1.908202元/秒	无免费额度

人物图片	参考视频	输出视频（标准模式）	输出视频（专业模式）

舞动人像AnimateAnyone

基于人物图片和人物动作模板，生成人物动作视频。直接使用时需依次调用下述三个模型。AnimateAnyone图像检测 API详情 | AnimateAnyone 动作模板生成｜ AnimateAnyone视频生成API详情

说明

仅支持中国大陆（北京）地域。

模型名称	说明	单价	免费额度
animate-anyone-detect-gen2	检测输入的图片是否符合要求	0.004元/张	200张有效期：百炼开通后90天内
animate-anyone-template-gen2	从人物运动视频中提取人物动作并生成动作模板	0.08元/秒	各1800秒有效期：百炼开通后90天内
animate-anyone-gen2	基于人物图片和动作模板生成人物动作视频	0.08元/秒	各1800秒有效期：百炼开通后90天内

下面两个模型支持独立部署。模型部署后，模型调用参考这两个API详情。AnimateAnyone图像检测 API详情 | AnimateAnyone视频生成API详情

模型名称

说明

单价

免费额度

animate-anyone-detect

检测输入图片是否符合要求

当前仅支持部署后调用，仅收取部署费用。部署单价：

10000元/算力单元/月
20元/算力单元/小时

无

animate-anyone

基于人物图片和动作模板生成人物动作视频

输入：人物图片	输入：动作视频	输出（按图片背景生成）	输出（按视频背景生成）

说明

以上示例，由集成了“舞动人像AnimateAnyone”的通义APP生成。
舞动人像AnimateAnyone模型的生成内容为视频画面，不包含音频。

悦动人像EMO

基于人物肖像图片和人声音频文件，生成人物肖像动态视频。使用时需依次调用下述模型。EMO 图像检测 | EMO 视频生成

emo-detect-v1与emo-detect、emo-v1与emo在调用方式及计费方式中有区别，模型效果完全相同。

说明

仅支持中国大陆（北京）地域。

模型名称	说明	单价	免费额度
emo-detect-v1	检测输入的图片是否符合要求，不需要部署，可直接调用	0.004元/张	200张有效期：百炼开通后90天内
emo-v1	生成人物肖像动态视频，不需要部署，可直接调用	生成1:1画幅视频：0.08元/秒生成3:4画幅视频：0.16元/秒	1800秒有效期：百炼开通后90天内
emo-detect	检测输入的图片是否符合要求，仅支持部署后调用	当前仅支持部署后调用，仅收取部署费用。部署单价：20元/算力单元/小时	无
emo	生成人物肖像动态视频，仅支持部署后调用	当前仅支持部署后调用，仅收取部署费用。部署单价：20元/算力单元/小时	无

输入物：人物肖像图片+人声音频文件

输出物：人物肖像动态视频

人物肖像：

上春山

人声音频：参见右侧视频

人物视频：

使用动作风格强度：活泼（"style_level": "active"）

灵动人像LivePortrait

基于人物肖像图片和人声音频文件，快速、轻量地生成人物肖像动态视频。与悦动人像EMO模型相比，生成速度快、价格低，但是生成效果不如悦动人像EMO模型。使用时需依次调用下述两个模型。LivePortrait 图像检测 | LivePortrait 视频生成

说明

仅支持中国大陆（北京）地域。

模型名称

说明

单价

免费额度

liveportrait-detect

检测输入的图片是否符合要求

0.004元/张

200张

有效期：百炼开通后90天内

liveportrait

生成人物肖像动态视频

0.02元/秒

1800秒

有效期：百炼开通后90天内

输入物：人物肖像图片+人声音频文件

输出物：人物肖像动态视频

人物肖像：

Emoji男孩

人声音频：参见右侧视频

人物视频：

表情包Emoji

基于人脸图片和预设的人脸动态模板，生成人脸动态视频。该能力可用于表情包制作、视频素材生成等场景。使用时需依次调用下述模型。Emoji 图像检测｜ Emoji 视频生成

说明

仅支持中国大陆（北京）地域。

模型名称

说明

单价

免费额度

emoji-detect-v1

检测输入图片是否符合要求

0.004元/张

200张

有效期：百炼开通后90天内

emoji-v1

基于人物肖像图片和指定的表情包模板生成人物同款表情

0.08元/秒

500秒

有效期：百炼开通后90天内

输入：人物肖像图片	输出：人物肖像动态视频
	“开心”表情的模板序列：（"input.driven_id": "mengwa_kaixin"）

声动人像VideoRetalk

基于人物视频和人声音频，生成人物讲话口型与输入音频相匹配的视频。使用时需调用下述模型。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

说明

单价

免费额度

videoretalk

生成人物讲话口型与输入音频相匹配的新视频

0.08元/秒

1800秒

有效期：百炼开通后90天内

输入示例	输出示例
人声音频：

视频风格重绘

支持根据用户输入的文字内容，生成符合语义描述的不同风格的视频，或者根据用户输入的视频，进行视频风格重绘。API参考

说明

仅支持中国大陆（北京）地域。

模型名称	说明	单价		免费额度

video-style-transform	将输入视频转换为日式漫画、美式漫画等风格	720P	0.5元/秒	600秒有效期：百炼开通后90天内
		540P	0.2元/秒

输入视频	输出视频（日式漫画）

文本向量

文本向量模型用于将文本转换成一组可以代表文字的数字，适用于搜索、聚类、推荐、分类任务。模型根据输入Token数计费。同步接口API详情| 批处理接口API详情

中国大陆（北京）

模型名称

向量维度

批次大小

单批次最大Token数（注）

支持语种

单价

（每千输入Token）

免费额度（注）

text-embedding-v4

属于Qwen3-Embedding系列

2,048、1,536、1,024（默认）、768、512、256、128、64

8,192

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种及多种编程语言

0.0005元

Batch调用：0.00025元

100万Token

有效期：百炼开通后90天内

text-embedding-v3

1,024（默认）、768、512、256、128或64

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+主流语种

0.0005元

Batch调用：0.00025元

各50万Token

有效期：百炼开通后90天内

更多模型

模型名称	向量维度	批次大小	单批次最大处理Token数	支持语种	单价（每千输入Token）	免费额度（注）
text-embedding-v2	1,536	25	2,048	中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语	0.0007元 Batch调用：0.00035元	50万Token 有效期：百炼开通后90天内
text-embedding-v1				中文、英语、西班牙语、法语、葡萄牙语、印尼语
text-embedding-async-v2		100,000		中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语	0.0007元	各2000万Token 有效期：百炼开通后90天内
text-embedding-async-v1				中文、英语、西班牙语、法语、葡萄牙语、印尼语

国际站（新加坡）

模型名称

向量维度

批次大小

单批次最大Token数（注）

支持语种

单价（每千输入Token）

免费额度（注）

text-embedding-v4

属于Qwen3-Embedding系列

2,048、1,536、1,024（默认）、768、512、256、128、64

8,192

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种

0.000514元

无免费额度

text-embedding-v3

1,024（默认）、768、512

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+主流语种

金融云

模型名称

向量维度

批次大小

单批次最大Token数（注）

支持语种

单价

（每千输入Token）

免费额度（注）

text-embedding-v3

1024（默认）、768或512

8,192

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+主流语种

0.00133元

50万Token

有效期：百炼开通后90天内

说明

批次大小指单次API调用中能处理的文本数量上限。例如，text-embedding-v4的批次大小为10，意味着一次请求最多可传入10个文本进行向量化，且每个文本不得超过 8192 个Token。这个限制适用于：

字符串数组输入：数组最多包含10个元素。
文件输入：文本文件最多包含10行文本。

模型升级概述

text-embedding-v2
- 语种扩充：新增对日语、韩语、德语、俄罗斯语的文本向量化能力。
- 效果提升：优化了预训练模型和SFT策略，提升了整体效果，公开数据评测结果显示有显著改进。
text-embedding-v3
- 语种扩充：支持意大利语、波兰语、越南语、泰语等语种，语种数量增加至50余种。
- 输入长度扩展：最大输入长度从2048 Token扩展至8192 Token。
- 连续向量维度自定义：允许用户选择1024、768、512、256、128或64维度，默认维度为1024。
- 不再区分Query/Document类型：简化输入，text_type参数不再需要指定文本类型。
- Sparse向量支持：支持在接口中指定输出稠密向量和离散向量。
- 效果提升：进一步优化预训练模型和SFT策略，提升整体效果，公开数据评测结果显示效果更佳。
text-embedding-v4
- 语种扩充：涵盖主流自然语言及多种编程语言，语种数量增加至100余种。
- 向量维度弹性扩展：新增2,048及1,536向量维度选项，向量维度选项扩展至8个。
- 效果提升：文本检索、聚类、分类性能大幅提升，相较于text-embedding-v3在MTEB多语言、中英、Code检索等评测任务中效果提升15%~40%。

v1、v2、v3模型的效果数据

模型	MTEB	MTEB（Retrieval task）	CMTEB	CMTEB (Retrieval task)
text-embedding-v1	58.30	45.47	59.84	56.59
text-embedding-v2	60.13	49.49	62.17	62.78
text-embedding-v3（64维度）	57.40	46.52	59.19	62.03
text-embedding-v3（128维度）	60.19	52.51	63.81	68.22
text-embedding-v3（256维度）	61.13	54.41	65.92	71.07
text-embedding-v3（512维度）	62.11	54.30	66.81	71.88
text-embedding-v3（768维度）	62.43	54.74	67.90	72.29
text-embedding-v3（1024维度）	63.39	55.41	68.92	73.23
text-embedding-v4（512维度）	64.73	56.34	68.79	73.33
text-embedding-v4（1024维度）	68.36	59.30	70.14	73.98
text-embedding-v4（2048维度）	71.58	61.97	71.99	75.01

MTEB（大规模文本嵌入评测基准）和CMTEB（中文大规模文本嵌入评测基准）采用0-100分制评估模型性能，数值越高代表效果越优。总分通过综合分类、聚类、检索等任务反映模型通用性，Retrieval Task分数用于衡量检索任务（如文档搜索）的精度，分数越高检索效果越强。

多模态向量

多模态向量模型将文本、图像或视频转换成一组由浮点数组成的向量，适用于视频分类、图像分类、图文检索等。API参考

说明

仅支持中国大陆（北京）地域。

模型名称	数据类型	向量维度	单价（每千输入Token）	免费额度（注）
qwen2.5-vl-embedding	float(32)	1024(默认)、512、768、2048	图片/视频：0.0018元文本：0.0007元	100万Token 有效期：百炼开通后90天内
tongyi-embedding-vision-plus	float(32)	1,152	图片/视频：0.0005元文本：0.0005元
tongyi-embedding-vision-flash	float(32)	768	图片/视频：0.00015元文本：0.00015元
multimodal-embedding-v1	float(32)	1,024	图片/视频：0.0009元文本：0.0007元

文本分类、抽取、排序

OpenNLU

针对给定的文本（中文或英文）进行信息抽取或文本分类。模型根据输出Token数计费。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

最大输入Token数

单价（每千Token）

免费额度（注）

opennlu-v1

1,024

0.00465元

100万Token

有效期：百炼开通后90天内

文本排序模型

通常用于语义检索，即给定查询 (Query) 和一系列候选文本 (Documents)，会根据与查询的语义相关性从高到低对候选文本进行排序。API参考

说明

仅支持中国大陆（北京）地域。

模型名称

最大Document数量

单行最大输入Token

最大输入Token

支持语言

单价（每千输入Token）

免费额度

qwen3-rerank

500

4,000

30,000

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等100+主流语种

0.0005元

100万Token

有效期：百炼开通后90天内

gte-rerank-v2

中、英、日、韩、泰语、西、法、葡、德、印尼语、阿拉伯语等50+语种

0.0008元

单行最大输入Token：每个Query或Document的最大Token数量为4,000。如果输入内容超过此长度，将会被截断。
最大Document数量：每次请求中Document的最大数量为500。
最大输入Token：每次请求中所有Query和Document的Token总数不得超过30,000。

行业

通义法睿

适用于回答法律问题、推荐裁判类案、辅助案情分析、生成法律文书、检索法律知识、审查合同条款等。API参考 | 在线体验

说明

仅支持中国大陆（北京）地域。

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本
模型名称	（Token数）			（每千Token）
farui-plus	12k	12k	2k	0.02元

意图理解

通义意图理解模型，能够在百毫秒级时间内快速、准确地解析用户意图，并选择合适工具来解决用户问题。API参考｜使用方法

说明

仅支持中国大陆（北京）地域。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

（注）

（Token数）

（每千Token）

tongyi-intent-detect-v3

8,192

1,024

0.0004元

0.001元

100万Token

有效期：百炼开通后90天内

角色扮演

通义千问的角色扮演模型，适合拟人化的对话场景（如虚拟社交、游戏NPC、IP复刻、硬件/玩具/车机等）。相比于其它通义千问模型，提升了人设还原、话题推进、倾听共情等能力。使用方法

中国大陆（北京）

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度（注）

（Token数）

（每千Token）

qwen-plus-character

32,768

32,000

4,096

0.0008元

0.002元

100万Token

有效期：阿里云百炼开通后90天内

国际（新加坡）

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	免费额度（注）
模型名称	（Token数）			（每千Token）		免费额度（注）
qwen-plus-character-ja	8,192	7,680	512	0.00367元	0.010275元	无免费额度

界面交互

GUI-Plus 可基于屏幕截图和自然语言指令来解析用户意图，并转换为标准化的图像用户界面（GUI）操作（如点击、输入、滚动等），供外部系统决策或执行。相较于通义千问VL系列模型，提升了GUI操作的准确性。使用方法 | API参考

说明

仅中国大陆（北京）地域支持。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

（注）

（Token数）

（每千Token）

gui-plus

256,000

254,976

单图最大16384

32,768

0.0015元

0.0045元

100万Token

有效期：阿里云百炼开通后90天内

已下线模型

2025年7月30日下线

类别	模型名称	上下文长度	最大输入	输入成本	输出成本	替代模型
		（Token数）
通义千问VL快照版	qwen-vl-plus-2023-12-01	8,000	6,000	2,000	0.008元	qwen-vl-plus
零一万物	yi-large	32,000	32,000	仅供免费体验，免费额度用完后不可调用。		Qwen3、DeepSeek、Kimi等
	yi-medium
	yi-large-rag	16,000	16,000
	yi-large-turbo
Dolly	dolly-12b-v2	限时免费

2025年7月2日下线

类别	模型名称	上下文长度	最大输入	输入成本	输出成本	替代模型
		（Token数）
Llama-仅文本输入	llama3.3-70b-instruct	32,000	30,000	仅供免费体验，免费额度用完后不可调用。		Qwen3、DeepSeek、Kimi等
	llama3.2-3b-instruct
	llama3.2-1b-instruct
	llama3.1-405b-instruct
	llama3.1-70b-instruct
	llama3.1-8b-instruct
	llama3-70b-instruct	8,000	8,000
	llama3-8b-instruct
	llama2-13b-chat-v2	4,000	4,000
	llama2-7b-chat-v2
Llama-文本和图像输入	llama3.2-90b-vision-instruct	8,192	8,192
	llama3.2-11b-vision
百川开源版	baichuan2-13b-chat-v1	4,096	4,096	0.008元	0.008元
	baichuan2-7b-chat-v1			0.006元	0.006元
	baichuan-7b-v1			仅供免费体验，免费额度用完后不可调用。
ChatGLM	chatglm3-6b	7,500	7,500	仅供免费体验，免费额度用完后不可调用。
	chatglm-6b-v2	6,500	6,500	0.006元	0.006元
姜子牙	ziya-llama-13b-v1	-		限时免费（需申请）
BELLE	belle-llama-13b-2m-v1
元语	chatyuan-large-v2
BiLLa	billa-7b-sft-v1
动漫人物生成	wanx-style-cosplay-v1			仅供免费体验，免费额度用完后不可调用。		无直接替代模型
图配文	wanx-ast
创意文字生成-WordArt锦书	wordart-surnames

2025年5月8日下线

模型名称	上下文长度	最大输入	最大输出	输入成本	输出成本	替代模型
模型名称	（Token数）			（每千Token）		替代模型
qwen-max-2024-01-07 又称qwen-max-0107	8,000	6,000	2,000	0.04元	0.12元	qwen-max
qwen-plus-2024-06-24 又称qwen-plus-0624	32,000	30,000	8,000	0.004元	0.012元	qwen-plus
qwen-plus-2024-02-06 又称qwen-plus-0206	32,000	30,000	8,000	0.004元	0.012元	qwen-plus
qwen-turbo-2024-02-06 又称qwen-turbo-0206	8,000	6,000	2,000	0.002元	0.006元	qwen-turbo
qwen-vl-max-2024-02-01 又称qwen-vl-max-0201	8,000	6,000 单图最大1280	2,000	0.02元		qwen-vl-max
qwen-72b-chat	32,000	30,000	2,000	0.02元		qwen2.5-72b-instruct
qwen-14b-chat	8,000	6,000	2,000	0.008元		qwen2.5-14b-instruct
qwen-7b-chat	7,500		1,500	0.006元		qwen2.5-7b-instruct
qwen-1.8b-chat	8,000		2,000	限时免费		qwen2.5-1.5b-instruct
qwen-1.8b-longcontext-chat	32,000	30,000	2,000	限时免费		qwen2.5-1.5b-instruct
qwen2-math-72b-instruct	4,096	3,072	3,072	0.004元	0.012元	qwen2.5-math-72b-instruct
qwen2-math-7b-instruct				0.001元	0.002元	qwen2.5-math-7b-instruct
qwen2-math-1.5b-instruct				限时免费		qwen2.5-math-1.5b-instruct

模型名称	单价	替代模型
motionshop-video-detect	0.04元/次	使用animate-anyone-gen2的“按视频背景生成”功能，可达到近似效果
motionshop-gen3d	1元/次
motionshop-synthesis	0.2元/秒