通义千问大语言模型介绍

通义千问是由阿里云自主研发的大模型,用于理解和分析用户输入的自然语言,以及图片、音频、视频等多模态数据。在不同领域和任务为用户提供服务和帮助。您可以通过提供尽可能清晰详细的指令,来获取符合您预期的结果。

更多通义系列模型请参见通义大模型

模型体验

您可以在模型体验中心试用通义千问模型。

应用场景

通义千问凭借其强大的语言及多模态数据处理能力,为用户带来高效、智能的语言服务体验,其能力包括但不限于文字创作、翻译服务和对话模拟等,具体应用场景如下:

  • 文字创作:撰写故事、公文、邮件、剧本和诗歌等。

  • 文本处理:润色文本和提取文本摘要等。

  • 编程辅助:编写和优化代码等。

  • 翻译服务:提供各类语言的翻译服务,如英语、日语、法语或西班牙语等。

  • 对话模拟:扮演不同角色进行交互式对话。

  • 数据可视化:图表制作和数据呈现等。

文本生成-通义千问

以下是通义千问模型的商业版。相较于开源版,商业版具有最新的能力和改进。

各模型会不定期更新升级。如需使用固定版本,请选择快照版本。快照版本通常维护至下个快照版本发布时间的后一个月。

QwQ

基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平。使用方法

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwq-plus

当前等同 qwq-plus-2025-03-05

稳定版

131,072

98,304

32,768

8,192

0.0016

Batch调用:0.0008

0.004

Batch调用:0.002

100万 Token

有效期:百炼开通后180天内

qwq-plus-latest

始终等同最新快照版

最新版

0.0016

0.004

qwq-plus-2025-03-05

又称qwq-plus-0305

快照版

通义千问-Max

通义千问系列效果最好的模型,适合复杂、多步骤的任务。使用方法 | API参考 | 在线体验

公共云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-max

当前等同qwen-max-2024-09-19

Batch调用半价

稳定版

32,768

30,720

8,192

0.0024

0.0096

100Token

有效期:百炼开通后180天内

qwen-max-latest

始终等同最新快照版

Batch调用半价

最新版

131,072

129,024

qwen-max-2025-01-25

又称qwen-max-0125、Qwen2.5-Max

快照版

qwen-max-2024-09-19

又称qwen-max-0919

32,768

30,720

0.02

0.06

qwen-max-2024-04-28

又称qwen-max-0428

8,000

6,000

2,000

0.04

0.12

qwen-max-2024-04-03

又称qwen-max-0403
最新的qwen-max-0125模型:通义千问系列效果最好的模型,代码编写与理解能力、逻辑能力、多语言能力显著提升,回复风格面向人类偏好进行大幅调整,模型回复详实程度和格式清晰度明显改善,内容创作、JSON格式遵循、角色扮演能力定向提升。

金融云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(Token数)

(每千Token)

qwen-max

稳定版

8,000

6,000

2,000

0.038

Batch调用:0.019

0.114

Batch调用:0.057

100Token

有效期:百炼开通后180天内

通义千问-Plus

能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务。其中 qwen-plus-latest 与 qwen-plus-2025-04-28 同时支持思考模式与非思考模式。

使用方法 | API参考 | 在线体验思考模式

公共云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-plus

当前等同qwen-plus-2025-01-25

Batch调用半价

稳定版

131,072

129,024

8,192

0.0008

0.002

100Token

有效期:百炼开通后180天内

qwen-plus-latest

始终等同最新快照版

Batch调用半价

最新版

思考模式

98,304

非思考模式

129,024

16,384

思维链最长38,912

思考模式

0.016

非思考模式

0.002

qwen-plus-2025-04-28

又称qwen-plus-0428
属于Qwen3系列

快照版

qwen-plus-2025-01-25

又称qwen-plus-0125

129,024

8,192

0.002

qwen-plus-2025-01-12

又称qwen-plus-0112

qwen-plus-2024-12-20

又称qwen-plus-1220

qwen-plus-2024-11-27

又称qwen-plus-1127

qwen-plus-2024-11-25

又称qwen-plus-1125

qwen-plus-2024-09-19

又称qwen-plus-0919

qwen-plus-2024-08-06

又称qwen-plus-0806

128,000

0.004

0.012

qwen-plus-2024-07-23

又称qwen-plus-0723​

32,000

30,000

8,000

最新的qwen-plus-2025-04-28与 qwen-plus-latest 模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,模型的能力得到了大幅提升:

  1. 推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

  2. 人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

  3. Agent 能力:在思考、非思考两种模式下都达到业界领先水平,能精准调用外部工具。

  4. 多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

  5. 回复格式:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

对于 qwen-plus-2025-04-28 与 qwen-plus-latest 模型,开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。

金融云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(Token数)

(每千Token)

qwen-plus

稳定版

131,072

128,000

8,192

0.00152

Batch调用:0.00076

0.0038

Batch调用:0.0019

100Token

有效期:百炼开通后180天内

通义千问-Turbo

通义千问系列速度最快、成本极低的模型,适合简单任务。其中 qwen-turbo-latest 与 qwen-turbo-2025-04-28 同时支持思考模式与非思考模式。使用方法 | API参考 | 在线体验思考模式

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-turbo

当前等同 qwen-turbo-2025-02-11

Batch调用半价

稳定版

1,000,000

1,000,000

8,192

0.0003

0.0006

100Token

有效期:百炼开通后180天内

qwen-turbo-latest

始终等同最新快照版

Batch调用半价

最新版

思考模式

131,072

非思考模式

1,000,000

思考模式

98,304

非思考模式

1,000,000

16,384

思维链最长38,912

思考模式

0.006

非思考模式

0.0006

qwen-turbo-2025-04-28

又称qwen-turbo-0428
属于Qwen3系列

快照版

qwen-turbo-2025-02-11

又称qwen-turbo-0211

1,000,000

1,000,000

8,192

0.0006

qwen-turbo-2024-11-01

又称qwen-turbo-1101

1000Token

有效期:百炼开通后180天内

qwen-turbo-2024-09-19

又称qwen-turbo-0919

131,072

129,024

100Token

有效期:百炼开通后180天内

qwen-turbo-2024-06-24

又称qwen-turbo-0624

8,000

6,000

2,000

0.002

0.006

最新的qwen-turbo-2025-04-28qwen-turbo-latest模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,模型的能力得到了大幅提升:

  1. 推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

  2. 人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

  3. Agent 能力:在思考、非思考模式下都达到业界领先水平,能精准调用外部工具。

  4. 多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

  5. 回复格式:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

对于 qwen-turbo-2025-04-28 与 qwen-turbo-latest 模型,开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。

通义千问-Long

通义千问系列上下文窗口最长,能力均衡且成本较低的模型,适合长文本分析、信息抽取、总结摘要和分类打标等任务。使用方法 | 在线体验

公共云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-long

稳定版

10,000,000

10,000,000

8,192

0.0005

Batch调用半价

0.002

Batch调用半价

100Token

有效期:百炼开通后180天内

qwen-long-latest

始终等同最新快照版

最新版

qwen-long-2025-01-25

又称qwen-long-0125

快照版

0.0005

0.002

金融云

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-long

10,000,000

10,000,000

8,192

0.0005

Batch调用:0.00025

0.002

Batch调用:0.001

100Token

有效期:百炼开通后180天内

通义千问Omni

通义千问全新多模态理解生成大模型,支持文本、图像、语音与视频输入,并输出文本与音频,提供了4种自然对话音色。使用方法API 参考

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen-omni-turbo

当前等同qwen-omni-turbo-2025-03-26

稳定版

32,768

30,720

2,048

100Token(不区分模态)

有效期:百炼开通后180天内

qwen-omni-turbo-latest

始终等同最新快照版

最新版

qwen-omni-turbo-2025-03-26

又称qwen-omni-turbo-0326

快照版

qwen-omni-turbo-2025-01-19

又称qwen-omni-turbo-0119

免费额度用完后,输入与输出的计费规则如下:

稳定版模型qwen-omni-turbo支持Batch调用,费用为以下价格的50%。注:Batch调用不支持抵扣免费额度。

输入计费项

单价(每千 Token)

输入:文本

0.0004

输入:音频

0.025

输入:图片/视频

0.0015

输出计费项

单价(每千 Token)

输出:文本

0.0016元(输入仅包含文本时)

0.0045元(输入包含图片/音频/视频时)

输出:文本+音频

0.05元(音频)

输出的文本不计费。

计费示例:某次请求输入了1000 Token 的文本和1000 Token 的图片,输出了1000 Token 的文本和1000 Token 的音频,则该请求花费:0.0004元(文本输入)+ 0.0015元(图片输入)+ 0.05元(音频输出)= 0.0519元。在Batch调用模式下,该请求花费按50%计收,为0.02595元。

通义千问Omni-Realtime

相比于通义千问Omni,支持音频的流式输入,且内置 VAD(Voice Activity Detection,语音活动检测)功能,可自动检测用户语音的开始和结束。

模型名称

版本

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen-omni-turbo-realtime

当前等同qwen-omni-turbo-2025-05-08

稳定版

32,768

30,720

2,048

100Token(不区分模态)

有效期:百炼开通后180天内

qwen-omni-turbo-realtime-latest

始终等同最新快照版

最新版

qwen-omni-turbo-realtime-2025-05-08

快照版

免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每千 Token)

输入:文本

0.0016

输入:音频

0.025

输出计费项

单价(每千 Token)

输出:文本

0.0064元(输入仅包含文本时)

0.018元(输入包含音频时)

输出:文本+音频

0.05元(音频)

输出的文本不计费。

QVQ

QVQ是视觉推理模型,支持视觉输入及思维链输出,在数学、编程、视觉分析、创作以及通用任务上都表现了更强的能力。使用方法

模型名称

版本

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qvq-max

当前等同 qvq-max-2025-03-25

稳定版

122,880

98,304

单图最大16384

16,384

8,192

0.008

0.032

100万 Token

有效期:百炼开通后180天内

qvq-max-latest

始终等同最新快照版

最新版

qvq-max-2025-03-25

又称qvq-max-0325

快照版

通义千问VL

通义千问VL是具有视觉(图像)理解能力的文本生成模型,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。使用方法 | API参考 | 在线体验

通义千问VL模型按输入和输出的总Token数进行计费。
图像Token的计算规则:每28x28像素对应一个Token,一张图最少需要4Token。详细计算规则请参见视觉理解

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-vl-max

相比qwen-vl-plus再次提升视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能
当前等同qwen-vl-max-2024-11-19

稳定版

32,768

30,720

单图最大16384

2,048

0.003

Batch调用半价

0.009

Batch调用半价

100Token

有效期:百炼开通后180天内

qwen-vl-max-latest

始终等同最新快照版

最新版

131,072

129,024

单图最大16384

8,192

qwen-vl-max-2025-04-08

又称qwen-vl-max-0408
数学和推理能力有所提升。

快照版

0.003

0.009

qwen-vl-max-2025-04-02

又称qwen-vl-max-0402
显著提高解决复杂数学问题的准确性。

qwen-vl-max-2025-01-25

又称qwen-vl-max-0125
升级至Qwen2.5-VL系列模型,扩展上下文至128k,显著增强图像和视频的理解能力。

qwen-vl-max-2024-12-30

又称qwen-vl-max-1230

32,768

30,720

单图最大16384

2,048

qwen-vl-max-2024-11-19

又称qwen-vl-max-1119

qwen-vl-max-2024-10-30

又称qwen-vl-max-1030

0.02

qwen-vl-max-2024-08-09

又称qwen-vl-max-0809
扩展上下文至32k,增强图像理解能力,能更好地识别图片中的多语种和手写体。

qwen-vl-plus

当前等同qwen-vl-plus-2025-01-25

稳定版

131,072

129,024

单图最大16384

8,192

0.0015

Batch调用半价

0.0045

Batch调用半价

qwen-vl-plus-latest

始终等同最新快照版

最新版

0.0015

0.0045

qwen-vl-plus-2025-05-07

又称qwen-vl-plus-0507
在数学、推理、监控视频内容的理解方面的能力有显著提升。

快照版

qwen-vl-plus-2025-01-25

又称qwen-vl-plus-0125
升级至Qwen2.5-VL系列模型,扩展上下文至128k,显著增强图像和视频的理解能力。

qwen-vl-plus-2025-01-02

又称qwen-vl-plus-0102

32,768

30,720

单图最大16384

2,048

qwen-vl-plus-2024-08-09

又称qwen-vl-plus-0809

qwen-vl-plus-2023-12-01

8,000

6,000

2,000

0.008

通义千问OCR

通义千问OCR模型是专用于文字提取的模型。相较于通义千问VL模型,它更专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种语言,包括英语、法语、日语、韩语、德语、俄语和意大利语等。使用方法 | API参考在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入输出单价

免费额度

(注)

(Token数)

(每千Token)

qwen-vl-ocr

当前等同qwen-vl-ocr-2024-10-28

稳定版

34,096

30,000

单图最大30000

4,096

0.005

100Token

有效期:百炼开通后180天内

qwen-vl-ocr-latest

始终等同最新快照版

最新版

38,192

8,192

qwen-vl-ocr-2025-04-13

又称qwen-vl-ocr-0413
大幅提升文字识别能力,新增六种内置的OCR任务,增加了自定义Prompt、图像旋转矫正等功能。

快照版

qwen-vl-ocr-2024-10-28

又称qwen-vl-ocr-1028

快照版

34,096

4,096

通义千问Audio

通义千问Audio是音频理解模型,支持输入多种音频(人类语音、自然音、音乐、歌声)和文本,并输出文本。该模型不仅能对输入的音频进行转录,还具备更深层次的语义理解、情感分析、音频事件检测、语音聊天等能力。使用方法

通义千问Audio模型按输入和输出的总Token数进行计费。
音频转换为Token的规则:每一秒钟的音频对应25Token。若音频时长不足1秒,则按25Token计算。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-audio-turbo

当前等同qwen-audio-turbo-2024-08-07

稳定版

8,000

6,000

1,500

目前仅供免费体验。

免费额度用完后不可调用,敬请关注后续动态。

10Token

有效期:百炼开通后180天内

qwen-audio-turbo-latest

始终等同最新快照版

最新版

8,192

6,144

2,048

qwen-audio-turbo-2024-12-04

又称qwen-audio-turbo-1204
大幅提升语音识别准确率,且新增了语音聊天能力。

快照版

qwen-audio-turbo-2024-08-07

又称qwen-audio-turbo-0807

8,000

6,000

1,500

通义千问ASRBeta版本

通义千问ASR是基于Qwen-Audio训练,专用于语音识别的模型。目前支持的语言有:中文和英文。使用方法

通义千问Audio与通义千问ASR(Beta版本)的区别

  • 功能对比:

    • 通义千问Audio模型是对话模型,不仅能够进行语音识别,还具备更深层次的语义理解、语音聊天等能力,支持设置提示词。

    • 通义千问ASR模型是专用于语音识别的模型,不支持设置提示词(包括System PromptUser Prompt)。

  • 准确率对比:

    • 在语音识别准确率上,通义千问ASR模型高于通义千问Audio模型。

  • 音频时长对比:

    • 通义千问Audio模型:30秒内。

    • 通义千问ASR模型:3分钟以内。

  • 支持识别的语言对比

    • 通义千问Audio模型:中文、英文、粤语、法语、意大利语、西班牙语、德语和日语。

    • 通义千问ASR模型:中文、英文。目前通义千问ASRBeta版本,后续版本中将会陆续支持更多语言的识别。

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-audio-asr

当前等同qwen-audio-asr-2024-12-04

稳定版

8,192

6,144

2,048

目前仅供免费体验。

免费额度用完后不可调用,敬请关注后续动态。

10Token

有效期:百炼开通后180天内

qwen-audio-asr-latest

始终等同最新快照版

最新版

qwen-audio-asr-2024-12-04 

又称qwen-audio-asr-1204 

快照版

通义千问数学模型

通义千问数学模型是专门用于数学解题的语言模型。使用方法 | API参考 | 在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-math-plus

当前等同qwen-math-plus-2024-09-19

稳定版

4,096

3,072

3,072

0.004

0.012

100Token

有效期:百炼开通后180天内

qwen-math-plus-latest

始终等同最新快照版

最新版

qwen-math-plus-2024-09-19

又称qwen-math-plus-0919

快照版

qwen-math-plus-2024-08-16

又称qwen-math-plus-0816

qwen-math-turbo

当前等同qwen-math-turbo-2024-09-19

稳定版

0.002

0.006

qwen-math-turbo-latest

始终等同最新快照版

最新版

qwen-math-turbo-2024-09-19

又称qwen-math-turbo-0919

快照版

通义千问Coder

通义千问代码模型。使用方法 | API参考 | 在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-coder-plus

当前等同qwen-coder-plus-2024-11-06

稳定版

131,072

129,024

8,192

0.0035

0.007

100Token

有效期:百炼开通后180天内

qwen-coder-plus-latest

等同qwen-coder-plus最新的快照版本

最新版

qwen-coder-plus-2024-11-06

又称qwen-coder-plus-1106

快照版

qwen-coder-turbo

当前等同qwen-coder-turbo-2024-09-19

稳定版

131,072

129,024

8,192

0.002

0.006

qwen-coder-turbo-latest

等同qwen-coder-turbo最新的快照版本

最新版

qwen-coder-turbo-2024-09-19

又称qwen-coder-turbo-0919

快照版

通义千问翻译模型

基于通义千问模型优化的机器翻译大语言模型,擅长中英互译、中文与小语种互译、英文与小语种互译,小语种包括日、韩、法、西、德、葡(巴西)、泰、印尼、越、阿等26种。在多语言互译的基础上,提供术语干预、领域提示、记忆库等能力,提升模型在复杂应用场景下的翻译效果。使用方法

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-mt-plus

2,048

1,024

1,024

0.015

0.045

50Token

有效期:百炼开通后180天内

qwen-mt-turbo

0.001

0.003

文本生成-通义千问-开源版

  • 模型名称中,xxb表示参数规模,例如qwen2-72b-instruct表示参数规模为72B,即720亿。

  • 百炼支持调用通义千问的开源版,您无需本地部署模型。对于开源版,建议使用Qwen3Qwen2.5模型。

Qwen3

Qwen3 模型支持思考模式和非思考模式,您可以通过 enable_thinking 参数实现两种模式的切换。除此之外,Qwen3 模型的能力得到了大幅提升:

  1. 推理能力:在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。

  2. 人类偏好能力:创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。

  3. Agent 能力:在推理、非推理两种模式下都达到业界领先水平,能精准调用外部工具。

  4. 多语言能力:支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

    支持的语言

    英语(English)

    简体中文(Simplified Chinese)

    繁体中文(Traditional Chinese)

    法语(French)

    西班牙语(Spanish)

    阿拉伯语(Arabic),使用阿拉伯字母。是众多阿拉伯国家的官方语言。

    俄语(Russian),使用西里尔字母。在俄罗斯及其他一些国家是官方语言。

    葡萄牙语(Portuguese),使用拉丁字母。在葡萄牙、巴西和其他葡萄牙语国家是官方语言。

    德语(German),使用拉丁字母。在德国和奥地利等地是官方语言。

    意大利语(Italian),使用拉丁字母。在意大利、圣马力诺以及瑞士的部分地区是官方语言。

    荷兰语(Dutch),使用拉丁字母。在荷兰、比利时部分地区(弗拉芒地区)和苏里南是官方语言。

    丹麦语(Danish),使用拉丁字母。在丹麦是官方语言。

    爱尔兰语(Irish),使用拉丁字母。在爱尔兰是官方语言之一。

    威尔士语(Welsh),使用拉丁字母。在威尔士使用,是官方语言之一。

    芬兰语(Finnish),使用拉丁字母。在芬兰是官方语言。

    冰岛语(Icelandic),使用拉丁字母。在冰岛是官方语言。

    瑞典语(Swedish),使用拉丁字母。是瑞典的官方语言。

    新挪威语(Norwegian Nynorsk),使用拉丁字母。在挪威与书面挪威语共同使用,属主流语言的一部分。

    书面挪威语(Norwegian Bokmål),使用拉丁字母。在挪威使用,是主流语言的一部分。

    日语(Japanese),使用日文字母。在日本是官方语言。

    朝鲜语/韩语(Korean),使用韩字(Hangul)。在韩国和朝鲜是官方语言。

    越南语(Vietnamese),使用拉丁字母。在越南是官方语言。

    泰语(Thai),使用泰文字母。在泰国是官方语言。

    印度尼西亚语(Indonesian),使用拉丁字母。是印度尼西亚的官方语言。

    马来语(Malay),使用拉丁字母。是马来西亚等地的主要语言。

    缅甸语(Burmese),使用缅甸字母。在缅甸是官方语言。

    他加禄语(Tagalog),使用拉丁字母。菲律宾的主要语言之一。

    高棉语(Khmer),使用高棉字母。在柬埔寨是官方语言。

    老挝语(Lao),使用老挝字母。在老挝是官方语言。

    印地语(Hindi),使用天城文(Devanagari)。是印度的官方语言之一。

    孟加拉语(Bengali),使用孟加拉字母。在孟加拉国和印度西孟加拉邦是官方语言。

    乌尔都语(Urdu),使用阿拉伯字母。在巴基斯坦是官方语言之一,也在印度使用。

    尼泊尔语(Nepali),使用天城字母。在尼泊尔是官方语言。

    希伯来语(Hebrew),使用希伯来字母。在以色列是官方语言。

    土耳其语(Turkish),使用拉丁字母。在土耳其和塞浦路斯北部是官方语言。

    波斯语(Persian),使用阿拉伯字母。在伊朗和塔吉克斯坦等地是官方语言。

    波兰语(Polish),使用拉丁字母。在波兰是官方语言。

    乌克兰语(Ukrainian),使用西里尔字母。在乌克兰是官方语言。

    捷克语(Czech),使用拉丁字母。在捷克是官方语言。

    罗马尼亚语(Romanian),使用拉丁字母。在罗马尼亚和摩尔多瓦是官方语言。

    保加利亚语(Bulgarian),使用西里尔字母。在保加利亚是官方语言。

    斯洛伐克语(Slovak),使用拉丁字母。在斯洛伐克是官方语言。

    匈牙利语(Hungarian),使用拉丁字母。在匈牙利是官方语言。

    斯洛文尼亚语(Slovenian),使用拉丁字母。在斯洛文尼亚是官方语言。

    拉脱维亚语(Latvian),使用拉丁字母。在拉脱维亚是官方语言。

    爱沙尼亚语(Estonian),使用拉丁字母。在爱沙尼亚是官方语言。

    立陶宛语(Lithuanian),使用拉丁字母。在立陶宛是官方语言。

    白俄罗斯语(Belarusian),使用西里尔字母。在白俄罗斯是官方语言之一。

    希腊语(Greek),使用希腊字母。在希腊和塞浦路斯是官方语言。

    克罗地亚语(Croatian),使用拉丁字母。在克罗地亚是官方语言。

    马其顿语(Macedonian),使用西里尔字母。是北马其顿的官方语言。

    马耳他语(Maltese),使用拉丁字母。在马耳他是官方语言。

    塞尔维亚语(Serbian),使用西里尔字母。在塞尔维亚是官方语言。

    波斯尼亚语(Bosnian),使用拉丁字母。在波斯尼亚和黑塞哥维那是官方语言之一。

    格鲁吉亚语(Georgian),使用格鲁吉亚字母(Georgian script)。在格鲁吉亚是官方语言。

    亚美尼亚语(Armenian),使用亚美尼亚字母。在亚美尼亚是官方语言。

    北阿塞拜疆语(North Azerbaijani),使用拉丁字母。在阿塞拜疆是官方语言。

    哈萨克语(Kazakh),使用西里尔字母。在哈萨克斯坦是官方语言。

    北乌兹别克语(Northern Uzbek),使用拉丁字母。在乌兹别克斯坦是官方语言。

    塔吉克语(Tajik),使用西里尔字母。在塔吉克斯坦是官方语言。

    斯瓦西里语(Swahili),使用拉丁字母。在东非许多国家是通用语或官方语言。

    南非语(Afrikaans),使用拉丁字母。主要在南非和纳米比亚使用。

    粤语(Cantonese),使用繁体字。主要在中国广东省、香港和澳门使用,是这些地区的主要语言之一。

    卢森堡语(Luxembourgish),使用拉丁字母。在卢森堡和德国部分地区使用,是官方语言之一。

    林堡语(Limburgish),使用拉丁字母。主要在荷兰、比利时和德国部分地区使用。

    加泰罗尼亚语(Catalan),使用拉丁字母。在加泰罗尼亚和其他部分西班牙地区使用。

    加利西亚语(Galician),使用拉丁字母。主要在西班牙加利西亚地区使用。

    阿斯图里亚斯语(Asturian),使用拉丁字母。主要在西班牙阿斯图里亚斯地区使用。

    巴斯克语(Basque),使用拉丁字母。主要在西班牙和法国的巴斯克地区使用,是西班牙巴斯克自治区的官方语言之一。

    奥克语(Occitan),使用拉丁字母。主要在法国南部地区使用。

    威尼斯语(Venetian),使用拉丁字母。主要在意大利威尼斯地区使用。

    撒丁语(Sardinian),使用拉丁字母。主要在意大利撒丁岛使用。

    西西里语(Sicilian),使用拉丁字母。主要在意大利西西里岛使用。

    弗留利语(Friulian),使用拉丁字母。主要在意大利弗留利-威尼斯朱利亚使用。

    隆巴底语(Lombard),使用拉丁字母。主要在意大利伦巴第地区使用。

    利古里亚语(Ligurian),使用拉丁字母。主要在意大利利古里亚地区使用。

    法罗语(Faroese),使用拉丁字母。主要在法罗群岛使用,是法罗群岛的官方语言之一。

    托斯克阿尔巴尼亚语(Tosk Albanian),使用拉丁字母。主要是阿尔巴尼亚南部方言。

    西里西亚语(Silesian),使用拉丁字母。主要在波兰使用。

    巴什基尔语(Bashkir),使用西里尔字母。主要在俄罗斯巴什科尔托斯坦使用。

    鞑靼语(Tatar),使用西里尔字母。主要在俄罗斯塔塔尔斯坦使用。

    美索不达米亚阿拉伯语(Mesopotamian Arabic),使用阿拉伯字母。主要在伊拉克使用。

    内志阿拉伯语(Najdi Arabic),使用阿拉伯字母。主要在沙特阿拉伯的内志地区使用。

    埃及阿拉伯语(Egyptian Arabic),使用阿拉伯字母。主要在埃及使用。

    黎凡特阿拉伯语(Levantine Arabic),使用阿拉伯字母。主要在叙利亚和黎巴嫩使用。

    闪米特阿拉伯语(Ta'izzi-Adeni Arabic),使用阿拉伯字母。主要在也门和沙特阿拉伯的哈德拉莫区域使用。

    达里语(Dari),使用阿拉伯字母。在阿富汗是官方语言之一。

    突尼斯阿拉伯语(Tunisian Arabic),使用阿拉伯字母。主要在突尼斯使用。

    摩洛哥阿拉伯语(Moroccan Arabic),使用阿拉伯字母。主要在摩洛哥使用。

    克里奥尔语(Kabuverdianu),使用拉丁字母。主要在佛得角使用。

    托克皮辛语(Tok Pisin),使用拉丁字母。在巴布亚新几内亚是主要的通用语之一。

    意第绪(Eastern Yiddish),使用希伯来字母。主要在犹太社区中使用。

    信德阿拉伯语(Sindhi),使用阿拉伯字母。在巴基斯坦信德省是官方语言之一。

    僧伽罗语(Sinhala),使用僧伽罗字母。在斯里兰卡是官方语言之一。

    泰卢固语(Telugu),使用泰卢固字母。在印度安得拉邦和特伦甘纳邦是官方语言之一。

    旁遮普语(Punjabi),使用古尔穆奇字母。在印度旁遮普邦使用,是印度的官方语言之一。

    泰米尔语(Tamil),使用泰米尔字母。在印度泰米尔纳德邦和斯里兰卡是官方语言之一。

    古吉拉特语(Gujarati),使用古吉拉特字母。在印度古吉拉特邦是官方语言之一。

    马拉雅拉姆语(Malayalam),使用马拉雅拉姆字母。在印度喀拉拉邦是官方语言之一。

    马拉地语(Marathi),使用天城字母。在印度马哈拉施特拉邦是官方语言之一。

    卡纳达语(Kannada),使用卡纳达字母。在印度卡纳塔克邦是官方语言之一。

    马加拉语(Magahi),使用天城文本。主要在印度比哈尔邦使用。

    奥里亚语(Oriya),使用乌尔都语字母。在印度奥迪沙邦是官方语言之一。

    阿瓦德语(Awadhi),使用天城字母。主要在印度北方邦使用。

    迈蒂利语(Maithili),使用天城字母。在印度比哈尔邦和尼泊尔特莱平原使用,是印度的官方语言之一。

    阿萨姆语(Assamese),使用孟加拉字母。在印度阿萨姆邦是官方语言之一。

    切蒂斯格尔语(Chhattisgarhi),使用天城字母。主要在印度切蒂斯格尔邦使用。

    比哈尔语(Bhojpuri),使用天城字母。在印度和尼泊尔部分地区使用。

    米南加保语(Minangkabau),使用拉丁字母。主要在印度尼西亚苏门答腊岛使用。

    巴厘语(Balinese),使用拉丁字母。主要在印度尼西亚巴厘岛使用。

    爪哇语(Javanese),使用拉丁字母(也惯用爪哇文字)。在印度尼西亚爪哇岛广泛使用。

    班章语(Banjar),使用拉丁字母。主要在印度尼西亚加里曼丹岛使用。

    巽他语(Sundanese),使用拉丁字母(虽然传统上使用巽他文字)。主要在印度尼西亚爪哇岛的西部使用。

    宿务语(Cebuano),使用拉丁字母。主要在菲律宾宿务地区使用。

    邦阿西楠语(Pangasinan),使用拉丁字母。主要在菲律宾邦阿西楠语省使用。

    伊洛卡诺语(Iloko),使用拉丁字母。主要在菲律宾使用。

    瓦莱语(Waray (Philippines)),使用拉丁字母。主要在菲律宾使用。

    海地语(Haitian),使用拉丁字母。在海地是官方语言之一。

    帕皮阿门托语(Papiamento),使用拉丁字母。主要在加勒比地区如阿鲁巴岛和库拉索岛使用。

  5. 回复格式:修复了之前版本存在的回复格式的问题,如异常 Markdown、中间截断、错误输出 boxed 等问题。

Qwen3 开源模型在思考模式下不支持非流式输出方式。

思考模式 |非思考模式| API 参考

模型名称

模式

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen3-235b-a22b

非思考

131,072

129,024

-

16,384

0.002

0.008

100万 Token

有效期:百炼开通后180天内

思考

98,304

38,912

0.02

qwen3-32b

非思考

129,024

-

0.002

0.008

思考

98,304

38,912

0.02

qwen3-30b-a3b

非思考

129,024

-

0.00075

0.003

思考

98,304

38,912

0.0075

qwen3-14b

非思考

129,024

-

8,192

0.001

0.004

思考

98,304

38,912

0.01

qwen3-8b

非思考

129,024

-

0.0005

0.002

思考

98,304

38,912

0.005

qwen3-4b

非思考

129,024

-

0.0003

0.0012

思考

98,304

38,912

0.003

qwen3-1.7b

非思考

32,768

30,720

-

0.0012

思考

28,672

与输入相加不超过30,720

0.003

qwen3-0.6b

非思考

30,720

-

0.0012

思考

28,672

与输入相加不超过30,720

0.003

对于 Qwen3 模型,开启思考模式时如果没有输出思考过程,按非思考模式价格进行收费。

QwQ-开源版

基于 Qwen2.5-32B 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。模型数学代码等核心指标(AIME 24/25、LiveCodeBench)以及部分通用指标(IFEval、LiveBench等)达到DeepSeek-R1 满血版水平,各指标均显著超过同样基于 Qwen2.5-32B 的 DeepSeek-R1-Distill-Qwen-32B。使用方法

模型名称

上下文长度

最大输入

最大思维链长度

最大回复长度

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwq-32b

131,072

98,304

32,768

8,192

0.002

0.006

100万 Token

有效期:百炼开通后180天内

QwQ-Preview

qwq-32b-preview 模型是由 Qwen 团队于2024年开发的实验性研究模型,专注于增强 AI 推理能力,尤其是数学和编程领域。qwq-32b-preview 模型的局限性请参见QwQ官方博客使用方法 | API参考在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwq-32b-preview

32,768

30,720

16,384

0.002

Batch调用半价

0.006

Batch调用半价

100Token

有效期:百炼开通后180天内

Qwen2.5

Qwen2.5Qwen大型语言模型系列。针对Qwen2.5,我们发布了一系列基础语言模型和指令调优语言模型,参数规模从5亿到720亿不等。Qwen2.5Qwen2基础上进行了以下改进:

  • 在我们最新的大规模数据集上进行预训练,包含多达18万亿个Token。

  • 由于我们在这些领域的专业专家模型,模型的知识显著增多,编码和数学能力也大幅提高。

  • 在遵循指令、生成长文本(超过8K个标记)、理解结构化数据(例如表格)和生成结构化输出(尤其是JSON)方面有显著改进。对系统提示的多样性更具弹性,增强了聊天机器人的角色扮演实现和条件设置。

  • 支持超过29种语言,包括中文、英语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、阿拉伯语等。

使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2.5-14b-instruct-1m

1,000,000

1,000,000

8,192

0.001

0.003

100Token

有效期:百炼开通后180天内

qwen2.5-7b-instruct-1m

0.0005

0.001

qwen2.5-72b-instruct

131,072

129,024

0.004

0.012

qwen2.5-32b-instruct

0.002

0.006

qwen2.5-14b-instruct

0.001

0.003

qwen2.5-7b-instruct

0.0005

0.001

qwen2.5-3b-instruct

32,768

30,720

0.0003

0.0009

qwen2.5-1.5b-instruct

限时免费

qwen2.5-0.5b-instruct

Qwen2

阿里云的通义千问2-开源版。使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2-72b-instruct

131,072

128,000

6,144

0.004

0.012

100Token

有效期:百炼开通后180天内

qwen2-57b-a14b-instruct

65,536

63,488

0.0035

0.007

qwen2-7b-instruct

131,072

128,000

0.001

0.002

qwen2-1.5b-instruct

32,768

30,720

限时免费

qwen2-0.5b-instruct

Qwen1.5

阿里云的通义千问1.5-开源版。使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen1.5-110b-chat

32,000

30,000

8,000

0.007

0.014

100Token

有效期:百炼开通后180天内

qwen1.5-72b-chat

2,000

0.005

0.01

qwen1.5-32b-chat

0.0035

0.007

qwen1.5-14b-chat

8,000

6,000

0.002

0.004

qwen1.5-7b-chat

0.001

0.002

qwen1.5-1.8b-chat

32,000

30,000

限时免费

qwen1.5-0.5b-chat

QVQ

qvq-72b-preview模型是由 Qwen 团队开发的实验性研究模型,专注于提升视觉推理能力,尤其在数学推理领域。qvq-72b-preview模型的局限性请参见QVQ官方博客使用方法 | API参考

如果希望模型先输出思考过程再输出回答内容,请使用商业版模型QVQ

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qvq-72b-preview

32,768

16,384

单图最大16384

16,384

0.012

0.036

10Token

有效期:百炼开通后180天内

Qwen-Omni

基于Qwen2.5训练的全新多模态理解生成大模型,支持文本、图像、语音、视频输入理解,具备文本和语音同时流式生成的能力,多模态内容理解速度显著提升。使用方法API 参考

模型名称

上下文长度

最大输入

最大输出

免费额度

(注)

(Token数)

qwen2.5-omni-7b

32,768

30,720

2,048

100Token(不区分模态)

有效期:百炼开通后180天内

开源版模型的免费额度用完后,输入与输出的计费规则如下:

输入计费项

单价(每千 Token)

输入:文本

0.0006

输入:音频

0.038

输入:图片/视频

0.002

输出计费项

单价(每千 Token)

输出:文本

0.0024元(输入仅包含文本时)

0.006元(输入包含图片/音频/视频时)

输出:文本+音频

0.076元(音频)

输出的文本不计费。

计费示例:某次请求输入了1000 Token 的文本和1000 Token 的图片,输出了1000 Token 的文本和1000 Token 的音频,则该请求花费:0.0006元(文本输入)+ 0.002元(图片输入)+ 0.076元(音频输出)= 0.0786元。

Qwen-VL

阿里云的通义千问VL开源版。使用方法 | API参考

其中,Qwen2.5-VLQwen2-VL的基础上做了如下改进:

  • 感知更丰富的世界:Qwen2.5-VL不仅擅长识别常见物体,如花、鸟、鱼和昆虫等,还能分析图像中的文本、图表、图标、图形和布局等。

  • 长视频理解能力:支持对长视频文件(最长10分钟)进行理解,具备通过精准定位相关视频片段来捕捉事件的新能力

  • 视觉定位:Qwen2.5-VL可通过生成bounding box(矩形框的左上角和右下角坐标)或者point(矩形框的中心点坐标)来准确定位图像中的物体,并能够为坐标和属性提供稳定的JSON输出。

  • 结构化输出:可支持对发票、表单、表格等数据进行结构化输出,惠及金融、商业等领域的应用。

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2.5-vl-72b-instruct 

131,072

129,024

单图最大16384

8,192

0.016

0.048

100Token

有效期:百炼开通后180天内

qwen2.5-vl-32b-instruct

0.008

0.024

qwen2.5-vl-7b-instruct

0.002

0.005

qwen2.5-vl-3b-instruct

0.0012

0.0036

qwen2-vl-72b-instruct

32,768

30,720

单图最大16384

2,048

0.016

0.048

qwen2-vl-7b-instruct

32,000

30,000

单图最大16384

2,000

目前仅供免费体验。

免费额度用完后不可调用,敬请关注后续动态。

10Token

有效期:百炼开通后180天内

qwen2-vl-2b-instruct

限时免费

qwen-vl-v1

8,000

6,000

单图最大1280

1,500

目前仅供免费体验。

免费额度用完后不可调用,敬请关注后续动态。

qwen-vl-chat-v1

Qwen-Audio

阿里云的通义千问Audio开源版。使用方法

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2-audio-instruct

相比qwen-audio-chat提升了音频理解能力,且新增了语音聊天能力。

8,000

6,000

1,500

目前仅供免费体验。

免费额度用完后不可调用,敬请关注后续动态。

10Token

有效期:百炼开通后180天内

qwen-audio-chat

Qwen-Math

基于Qwen模型构建的专门用于数学解题的语言模型。Qwen2.5-Math支持中文英文,并整合了多种推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和 TIR(Tool-Integrated Reasoning)。使用方法 | API参考| 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2.5-math-72b-instruct

4,096

3,072

3,072

0.004

0.012

100Token

有效期:百炼开通后180天内

qwen2.5-math-7b-instruct

0.001

0.002

qwen2.5-math-1.5b-instruct

限时免费

Qwen-Coder

通义千问代码模型开源版。Qwen2.5-Coder相比CodeQwen1.5有了实质性的改进。Qwen2.5-Coder在包含5.5万亿Token的编程相关数据上进行了训练,使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2.5-coder-32b-instruct

131,072

129,024

8,192

0.002

0.006

100Token

有效期:百炼开通后180天内

qwen2.5-coder-14b-instruct

qwen2.5-coder-7b-instruct

0.001

0.002

qwen2.5-coder-3b-instruct

32,768

30,720

限时免费体验

qwen2.5-coder-1.5b-instruct

qwen2.5-coder-0.5b-instruct

基础限流

关于模型的限流条件,请参见限流