通义千问大语言模型介绍

通义千问是由阿里云自主研发的大语言模型,用于理解和分析用户输入的自然语言,在不同领域和任务为用户提供服务和帮助。您可以通过提供尽可能清晰详细的指令,来获取符合您预期的结果。

模型体验

您可以在模型体验中心试用通义千问模型。

应用场景

通义千问凭借其强大的语言处理能力,为用户带来高效、智能的语言服务体验,其能力包括但不限于文字创作、翻译服务和对话模拟等,具体应用场景如下:

  • 文字创作:撰写故事、公文、邮件、剧本和诗歌等。

  • 文本处理:润色文本和提取文本摘要等。

  • 编程辅助:编写和优化代码等。

  • 翻译服务:提供各类语言的翻译服务,如英语、日语、法语或西班牙语等。

  • 对话模拟:扮演不同角色进行交互式对话。

  • 数据可视化:图表制作和数据呈现等。

模型概览

以下是通义千问模型的商业版。相较于开源版,商业版具有最新的能力和改进。

各模型会不定期更新升级。如需使用固定版本,请使用快照版本。快照版本通常维护至下个快照版本发布时间的后一个月。

通义千问-Max

通义千问系列效果最好的模型,适合复杂、多步骤的任务。使用方法 | API参考 | 在线体验

公共云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-max

当前等同qwen-max-2024-09-19

稳定版

32,768

30,720

8,192

0.02

Batch调用:0.01

0.06

Batch调用:0.03

100Token

有效期:百炼开通后180天内

qwen-max-latest

始终等同最新快照版

最新版

0.02

0.06

qwen-max-2024-09-19

又称qwen-max-0919

快照版

qwen-max-2024-04-28

又称qwen-max-0428

8,000

6,000

2,000

0.04

0.12

qwen-max-2024-04-03

又称qwen-max-0403

qwen-max-2024-01-07

又称qwen-max-0107
最新的qwen-max-0919模型:显著提升了中英文能力、推理能力、复杂指令理解能力及数学和代码能力,支持8千字的长文本输出,强化了对Table、JSON等结构化数据的理解和生成。

金融云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(Token数)

(每千Token)

qwen-max

当前等同qwen-max-2024-04-28

稳定版

8,000

6,000

2,000

0.038

Batch调用:0.019

0.114

Batch调用:0.057

100Token

有效期:百炼开通后180天内

qwen-max-2024-04-28

又称qwen-max-0428

快照版

0.038

0.114

通义千问-Plus

能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务。使用方法 | API参考 | 在线体验

公共云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-plus

当前等同qwen-plus-2024-09-19

稳定版

131,072

129,024

8,192

0.0008

Batch调用:0.0004

0.002

Batch调用:0.001

100Token

有效期:百炼开通后180天内

qwen-plus-latest

始终等同最新快照版

最新版

0.0008

0.002

qwen-plus-2024-11-27

又称qwen-plus-1127

快照版

qwen-plus-2024-11-25

又称qwen-plus-1125

qwen-plus-2024-09-19

又称qwen-plus-0919

qwen-plus-2024-08-06

又称qwen-plus-0806

128,000

0.004

0.012

qwen-plus-2024-07-23

又称qwen-plus-0723​

32,000

30,000

8,000

qwen-plus-2024-06-24

又称qwen-plus-0624

qwen-plus-2024-02-06

又称qwen-plus-0206

最新的qwen-plus-0919模型:显著提升了中英文能力、推理能力、复杂指令理解能力及数学和代码能力,支持8千字的长文本输出。

金融云

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(Token数)

(每千Token)

qwen-plus

稳定版

131,072

128,000

8,192

0.00152

Batch调用:0.00076

0.0038

Batch调用:0.0019

100Token

有效期:百炼开通后180天内

qwen-plus-2024-06-24

又称qwen-plus-0624

快照版

32,000

30,000

8,000

0.00152

0.0038

通义千问-Turbo

通义千问系列速度最快、成本很低的模型,适合简单任务。使用方法 | API参考 | 在线体验

模型名称

版本

上下文长度

最大输入

最大输出

输入成本

输出成本

免费额度

(注)

(Token数)

(每千Token)

qwen-turbo

当前等同qwen-turbo-2024-09-19

稳定版

131,072

129,024

8,192

0.0003

Batch调用:0.00015

0.0006

Batch调用:0.0003

100Token

有效期:百炼开通后180天内

qwen-turbo-latest

始终等同最新快照版

最新版

1,000,000

1,000,000

0.0003

0.0006

qwen-turbo-2024-11-01

又称qwen-turbo-1101

快照版

1000Token

有效期:百炼开通后180天内

qwen-turbo-2024-09-19

又称qwen-turbo-0919

131,072

129,024

100Token

有效期:百炼开通后180天内

qwen-turbo-2024-06-24

又称qwen-turbo-0624

8,000

6,000

2,000

0.002

0.006

qwen-turbo-2024-02-06

又称qwen-turbo-0206
最新的qwen-turbo-2024-11-01模型:在qwen-turbo-2024-09-19模型的能力之上扩展了上下文长度,模型支持的最大上下文长度从128k扩展到1M

基础限流

关于模型的限流条件,请参见限流