通义千问大语言模型介绍

通义千问是由阿里云自主研发的大模型,用于理解和分析用户输入的自然语言,以及图片、音频、视频等多模态数据。在不同领域和任务为用户提供服务和帮助。您可以通过提供尽可能清晰详细的指令,来获取符合您预期的结果。

模型体验

您可以在模型体验中心试用通义千问模型。

应用场景

通义千问凭借其强大的语言及多模态数据处理能力,为用户带来高效、智能的语言服务体验,其能力包括但不限于文字创作、翻译服务和对话模拟等,具体应用场景如下:

  • 文字创作:撰写故事、公文、邮件、剧本和诗歌等。

  • 文本处理:润色文本和提取文本摘要等。

  • 编程辅助:编写和优化代码等。

  • 翻译服务:提供各类语言的翻译服务,如英语、日语、法语或西班牙语等。

  • 对话模拟:扮演不同角色进行交互式对话。

  • 数据可视化:图表制作和数据呈现等。

文本生成-通义千问

以下是通义千问模型的商业版。相较于开源版,商业版具有最新的能力和改进。

各模型会不定期更新升级。如需使用固定版本,请使用快照版本。快照版本通常维护至下个快照版本发布时间的后一个月。

通义千问-Max

通义千问系列效果最好的模型,适合复杂、多步骤的任务。使用方法 | API参考 | 在线体验

公共云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-max

当前等同qwen-max-2024-09-19

稳定版

32,768

30,720

8,192

0.02

Batch调用:0.01

0.06

Batch调用:0.03

100Token

有效期:百炼开通后180天内

qwen-max-latest

始终等同最新快照版

最新版

0.02

0.06

qwen-max-2024-09-19

又称qwen-max-0919

快照版

qwen-max-2024-04-28

又称qwen-max-0428

8,000

6,000

2,000

0.04

0.12

qwen-max-2024-04-03

又称qwen-max-0403

qwen-max-2024-01-07

又称qwen-max-0107
最新的qwen-max-0919模型:显著提升了中英文能力、推理能力、复杂指令理解能力及数学和代码能力,支持8千字的长文本输出,强化了对Table、JSON等结构化数据的理解和生成。

金融云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(Token数)

(每千Token)

qwen-max

稳定版

8,000

6,000

2,000

0.038

Batch调用:0.019

0.114

Batch调用:0.057

100Token

有效期:百炼开通后180天内

通义千问-Plus

能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务。使用方法 | API参考 | 在线体验

公共云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-plus

当前等同qwen-plus-2024-09-19

稳定版

131,072

129,024

8,192

0.0008

Batch调用:0.0004

0.002

Batch调用:0.001

100Token

有效期:百炼开通后180天内

qwen-plus-latest

始终等同最新快照版

最新版

0.0008

0.002

qwen-plus-2024-11-27

又称qwen-plus-1127

快照版

qwen-plus-2024-11-25

又称qwen-plus-1125

qwen-plus-2024-09-19

又称qwen-plus-0919

qwen-plus-2024-08-06

又称qwen-plus-0806

0.012

qwen-plus-2024-07-23

又称qwen-plus-0723​

32,000

30,000

8,000

qwen-plus-2024-06-24

又称qwen-plus-0624

qwen-plus-2024-02-06

又称qwen-plus-0206

最新的qwen-plus-0919模型:显著提升了中英文能力、推理能力、复杂指令理解能力及数学和代码能力,支持8千字的长文本输出。

金融云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(Token数)

(每千Token)

qwen-plus

稳定版

131,072

128,000

8,192

0.00152

Batch调用:0.00076

0.0038

Batch调用:0.0019

100Token

有效期:百炼开通后180天内

通义千问-Turbo

通义千问系列速度最快、成本很低的模型,适合简单任务。使用方法 | API参考 | 在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-turbo

当前等同qwen-turbo-2024-09-19

稳定版

131,072

129,024

8,192

0.0003

Batch调用:0.00015

0.0006

Batch调用:0.0003

100Token

有效期:百炼开通后180天内

qwen-turbo-latest

始终等同最新快照版

最新版

1,000,000

1,000,000

0.0003

0.0006

qwen-turbo-2024-11-01

又称qwen-turbo-1101

快照版

qwen-turbo-2024-09-19

又称qwen-turbo-0919

131,072

129,024

qwen-turbo-2024-06-24

又称qwen-turbo-0624

8,000

6,000

2,000

0.002

0.006

qwen-turbo-2024-02-06

又称qwen-turbo-0206

最新的qwen-turbo-2024-11-01模型:在qwen-turbo-2024-09-19模型的能力之上扩展了上下文长度,模型支持的最大上下文长度从128k扩展到1M

Qwen-Long

支持总结和分析长达千万字的文档,且成本极低。使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-long

10,000,000

10,000,000

6,000

0.0005

0.002

100Token

有效期:百炼开通后180天内

通义千问VL

通义千问VL是具有视觉(图像)理解能力的文本生成模型,不仅能进行OCR(图片文字识别),还能进一步总结和推理,例如从商品照片中提取属性,根据习题图进行解题等。使用方法 | API参考 | 在线体验

通义千问VL模型按输入和输出的总Token数进行计费。
图像转换为Token的规则:512x512像素的图像约等于334Token,其他分辨率图像按比例换算;最小单位是28x28像素,即每28x28像素对应一个Token,如果图像的长或宽不是28的整数倍,则向上取整至28的整数倍;一张图最少4Token。

模型名称

版本

上下文长度

最大输入

最大输出

输入输出单价

免费额度

(注)

(Token数)

(每千Token)

qwen-vl-max

相比qwen-vl-plus再次提升视觉推理和指令遵循能力,在更多复杂任务中提供最佳性能
当前等同qwen-vl-max-2024-08-09

稳定版

32,000

30,000

单图最大16384

2,000

0.02

100Token

有效期:百炼开通后180天内

qwen-vl-max-latest

始终等同最新快照版

最新版

qwen-vl-max-2024-11-19

又称qwen-vl-max-1119

快照版

qwen-vl-max-2024-10-30

又称qwen-vl-max-1030

qwen-vl-max-2024-08-09

又称qwen-vl-max-0809
此版本扩展上下文至32k,增强图像理解能力,能更好地识别图片中的多语种和手写体。

qwen-vl-max-2024-02-01

又称qwen-vl-max-0201

8,000

6,000

单图最大1280

qwen-vl-plus

大幅提升细节识别和文字识别能力,支持超百万像素分辨率和任意宽高比的图像。在广泛的视觉任务中提供卓越性能

稳定版

8,000

6,000

单图最大1280

0.008

qwen-vl-plus-latest

始终等同最新快照版

最新版

32,000

30,000

单图最大16384

qwen-vl-plus-2024-08-09

又称qwen-vl-plus-0809

快照版

qwen-vl-plus-2023-12-01

8,000

6,000

2,000

0.008

通义千问OCR

通义千问OCR模型是专用于文字提取的模型。相较于通义千问VL模型,它更专注于文档、表格、试题、手写体文字等类型图像的文字提取能力。它能够识别多种语言,包括英语、法语、日语、韩语、德语、俄语和意大利语等。使用方法 | API参考在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入输出单价

免费额度

(注)

(Token数)

(每千Token)

qwen-vl-ocr

当前等同qwen-vl-ocr-2024-10-28

稳定版

34096

30000

单图最大30000

4096

0.005

100Token

有效期:百炼开通后180天内

qwen-vl-ocr-latest

始终等同最新快照版

最新版

qwen-vl-ocr-2024-10-28

又称qwen-vl-ocr-1028

快照版

通义千问Audio

通义千问Audio是音频理解模型,支持输入多种音频(人类语音、自然音、音乐、歌声)和文本,并输出文本。该模型不仅能对输入的音频进行转录,还具备更深层次的语义理解、情感分析、音频事件检测、语音聊天等能力。使用方法 | API参考

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-audio-turbo

当前等同qwen-audio-turbo-2024-08-07

稳定版

8,000

6,000

1,500

目前仅供免费体验。

免费额度用完后不可调用,敬请关注后续动态。

10Token

有效期:百炼开通后180天内

qwen-audio-turbo-latest

始终等同最新快照版

最新版

8,192

6,144

2,048

qwen-audio-turbo-2024-12-04

又称qwen-audio-turbo-1204
较上个快照版本大幅提升语音识别准确率,且新增了语音聊天能力。

快照版

qwen-audio-turbo-2024-08-07

又称qwen-audio-turbo-0807

8,000

6,000

1,500

通义千问数学模型

通义千问数学模型是专门用于数学解题的语言模型。使用方法 | API参考 | 在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-math-plus

当前等同qwen-math-plus-2024-09-19

稳定版

4,096

3,072

3,072

0.004

0.012

100Token

有效期:百炼开通后180天内

qwen-math-plus-latest

始终等同最新快照版

最新版

qwen-math-plus-2024-09-19

又称qwen-math-plus-0919

快照版

qwen-math-plus-2024-08-16

又称qwen-math-plus-0816

qwen-math-turbo

当前等同qwen-math-turbo-2024-09-19

稳定版

0.002

0.006

qwen-math-turbo-latest

始终等同最新快照版

最新版

qwen-math-turbo-2024-09-19

又称qwen-math-turbo-0919

快照版

通义千问Coder

通义千问代码模型。使用方法 | API参考 | 在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-coder-plus

当前等同qwen-coder-plus-2024-11-06

稳定版

131,072

129,024

8192

0.0035

0.007

100Token

有效期:百炼开通后180天内

qwen-coder-plus-latest

等同qwen-coder-plus最新的快照版本

最新版

qwen-coder-plus-2024-11-06

又称qwen-coder-plus-1106

快照版

qwen-coder-turbo

当前等同qwen-coder-turbo-2024-09-19

稳定版

131,072

129,024

8,192

0.002

0.006

100Token

有效期:百炼开通后180天内

qwen-coder-turbo-latest

等同qwen-coder-turbo最新的快照版本

最新版

qwen-coder-turbo-2024-09-19

又称qwen-coder-turbo-0919

快照版

文本生成-通义千问-开源版

  • 模型名称中,xxb表示参数规模,例如qwen2-72b-instruct表示参数规模为72B,即720亿。

  • 百炼支持调用通义千问的开源版,您无需本地部署模型。对于开源版,建议使用Qwen2.5Qwen2模型。

QwQ

QwQ模型是由 Qwen 团队开发的实验性研究模型,专注于增强 AI 推理能力,尤其是数学和编程领域。QwQ模型的局限性请参见QwQ官方博客使用方法 | API参考在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwq-32b-preview

32,768

30,720

16,384

0.0035

0.007

100Token

有效期:百炼开通后180天内

Qwen2.5

Qwen2.5Qwen大型语言模型的最新系列。针对Qwen2.5,我们发布了一系列基础语言模型和指令调优语言模型,参数规模从5亿到720亿不等。Qwen2.5Qwen2基础上进行了以下改进:

  • 在我们最新的大规模数据集上进行预训练,包含多达18万亿个Token。

  • 由于我们在这些领域的专业专家模型,模型的知识显著增多,编码和数学能力也大大提高。

  • 在遵循指令、生成长文本(超过8K个标记)、理解结构化数据(例如表格)和生成结构化输出(尤其是JSON)方面有显著改进。对系统提示的多样性更具弹性,增强了聊天机器人的角色扮演实现和条件设置。

  • 支持超过29种语言,包括中文、英语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、越南语、泰语、阿拉伯语等。

使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2.5-72b-instruct

131,072

129,024

8,192

0.004

0.012

100Token

有效期:百炼开通后180天内

qwen2.5-32b-instruct

0.0035

0.007

qwen2.5-14b-instruct

0.002

0.006

qwen2.5-7b-instruct

0.001

0.002

qwen2.5-3b-instruct

32,768

30,720

限时免费

qwen2.5-1.5b-instruct

qwen2.5-0.5b-instruct

Qwen2

阿里云的通义千问2-开源版。使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2-72b-instruct

131,072

128,000

6,144

0.004

0.012

100Token

有效期:百炼开通后180天内

qwen2-57b-a14b-instruct

65,536

63,488

0.0035

0.007

qwen2-7b-instruct

131,072

128,000

0.001

0.002

qwen2-1.5b-instruct

32,768

30,720

限时免费

qwen2-0.5b-instruct

Qwen1.5

阿里云的通义千问1.5-开源版。使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen1.5-110b-chat

32,000

30,000

8,000

0.007

0.014

100Token

有效期:百炼开通后180天内

qwen1.5-72b-chat

2,000

0.005

0.01

qwen1.5-32b-chat

0.0035

0.007

qwen1.5-14b-chat

8,000

6,000

0.002

0.004

qwen1.5-7b-chat

0.002

qwen1.5-1.8b-chat

32,000

30,000

限时免费

qwen1.5-0.5b-chat

Qwen

阿里云的通义千问-开源版。使用方法 | API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-72b-chat

32,000

30,000

2,000

0.02

0.02

100Token

有效期:百炼开通后180天内

qwen-14b-chat

8,000

6,000

0.008

0.008

qwen-7b-chat

7,500

1,500

0.006

0.006

qwen-1.8b-chat

8,000

2,000

限时免费

qwen-1.8b-longcontext-chat

32,000

30,000

限时免费(需申请)

Qwen-VL

阿里云的通义千问VL开源版。使用方法 | API参考

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2-vl-7b-instruct

32,000

30,000

单图最大16384

2,000

目前仅供免费体验。

免费额度用完后不可调用,敬请关注后续动态。

10Token

有效期:百炼开通后180天内

qwen2-vl-2b-instruct

限时免费

qwen-vl-v1

8,000

6,000

单图最大1280

1,500

目前仅供免费体验。

免费额度用完后不可调用,敬请关注后续动态。

qwen-vl-chat-v1

Qwen-Audio

阿里云的通义千问Audio开源版。使用方法 | API参考

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2-audio-instruct

相比qwen-audio-chat提升了音频理解能力,且新增了语音聊天能力。

8,000

6,000

1,500

目前仅供免费体验。

免费额度用完后不可调用,敬请关注后续动态。

10Token

有效期:百炼开通后180天内

qwen-audio-chat

Qwen-Math

基于Qwen模型构建的专门用于数学解题的语言模型。Qwen2.5-Math相比Qwen2-Math有了实质性的改进。Qwen2.5-Math支持中文英文,并整合了多种推理方法,包括CoT(Chain of Thought)、PoT(Program of Thought)和 TIR(Tool-Integrated Reasoning)。使用方法 | API参考| 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2.5-math-72b-instruct

4,096

3,072

3,072

0.004

0.012

100Token

有效期:百炼开通后180天内

qwen2.5-math-7b-instruct

0.001

0.002

qwen2.5-math-1.5b-instruct

限时免费

qwen2-math-72b-instruct

0.004

0.012

qwen2-math-7b-instruct

0.001

0.002

qwen2-math-1.5b-instruct

目前仅供免费体验。

免费额度用完后不可调用,敬请关注后续动态。

Qwen-Coder

通义千问代码模型开源版。Qwen2.5-Coder相比CodeQwen1.5有了实质性的改进。Qwen2.5-Coder在包含5.5万亿Token的编程相关数据上进行了训练,使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。API参考 | 在线体验

模型名称

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen2.5-coder-32b-instruct

131,072

129,024

8,192

0.0035

0.007

100Token

有效期:百炼开通后180天内

qwen2.5-coder-14b-instruct

0.002

0.006

qwen2.5-coder-7b-instruct

0.001

0.002

qwen2.5-coder-3b-instruct

32,768

30,720

限时免费

限时免费

qwen2.5-coder-1.5b-instruct

qwen2.5-coder-0.5b-instruct

基础限流

关于模型的限流条件,请参见限流