文档

千问模型

更新时间:
一键部署

模型简介

Qwen1.5

Qwen1.5是Qwen开源系列的下一个版本。与之前的版本相比,Qwen1.5显著提升了聊天模型与人类偏好的一致性,改善了它们的多语言能力,并具备了强大的链接外部系统能力。灵积上提供API服务的是新版本qwen模型的chat版本,在chat能力上大幅提升,即便在英文的MT-Bench上,Qwen1.5-Chat系列也取得了优秀的性能。

阿里云百炼平台上提供的0.5B模型、1.8B模型、7B模型、14B模型、32B模型和72B模型基于千问开源版本,进行了针对性的推理性能优化,为广大开发者提供便捷的API服务。各个版本均对应魔搭社区开源的各个尺寸的模型版本,详细参考链接

CodeQwen1.5

CodeQwen1.5是专门针对代码的Qwen1.5版本。与Qwen1.5相比,CodeQwen1.5在大量的代码数据上训练得到。它拥有强大的代码生成能力,在一系列基准测试中展现出不凡的竞争力。其支持92种编程语言,上下文长度可达64K,在SQL生成和bug修复方面均有出色的表现。

阿里云百炼平台上提供的7B模型基于千问开源版本,进行了针对性的推理性能优化,为广大开发者提供便捷的API服务。各个版本均对应魔搭社区开源的各个尺寸的模型版本,详细参考链接

Qwen

通义千问为阿里云研发的大语言系列模型。千问模型基于Transformer架构,在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在预训练模型的基础之上,使用对齐机制打造了模型的chat版本。其中千问-1.8B是18亿参数规模的模型,千问-7B是70亿参数规模的模型,千问-14B是140亿参数规模的模型,千问-72B是720亿参数规模的模型。

阿里云百炼平台上提供的1.8B模型、7B模型、14B模型和72B模型基于千问开源版本,进行了针对性的推理性能优化,为广大开发者提供便捷的API服务。其中1.8B模型基于最新在魔搭社区开源的最新版本,7B模型基于最新在魔搭社区上开源的V1.1版本,而14B模型同样基于魔搭社区上最新版本提供,72B模型基于魔搭社区开源的最新版本提供。

模型服务

模型名称

模型描述

应用场景

通义千问110B

qwen1.5-110b-chat

通义千问1.5对外开源的110B规模参数量的经过人类指令对齐的chat模型。

  • 文字创作:撰写故事、公文、邮件、剧本和诗歌等。

  • 文本处理:润色文本和提取文本摘要等。

  • 编程辅助:编写和优化代码等。

  • 推理服务:语言编程。

通义千问72B

qwen1.5-72b-chat

通义千问1.5对外开源的72B规模参数量的经过人类指令对齐的chat模型。

qwen-72b-chat

通义千问对外开源的72B规模参数量的经过人类指令对齐的chat模型。

通义千问32B

qwen1.5-32b-chat

通义千问1.5对外开源的32B规模参数量的经过人类指令对齐的chat模型

通义千问14B

qwen-14b-chat

通义千问对外开源的14B规模参数量的经过人类指令对齐的chat模型。

qwen1.5-14b-chat

通义千问1.5对外开源的14B规模参数量的经过人类指令对齐的chat模型。

通义千问7B

qwen1.5-7b-chat

通义千问1.5对外开源的7B规模参数量是经过人类指令对齐的chat模型。

qwen-7b-chat

通义千问对外开源的7B规模参数量的经过人类指令对齐的chat模型。

qwen1.5-7b-chat

通义千问1.5对外开源的7B规模参数量的经过人类指令对齐的针对代码场景的chat模型。

通义千问1.8B

qwen-1.8b-chat

通义千问对外开源的1.8B规模参数量的经过人类指令对齐的chat模型。

通义千问0.5B

qwen1.5-0.5b-chat

通义千问1.5对外开源的0.5B规模参数量的经过人类指令对齐的chat模型。

计费和限流信息

计费信息

模型服务

规格

输入(input)价格

输出(output)价格

计费模式

上线时间

通义千问110B

qwen1.5-110b-chat

0.007元/1,000 tokens

0.014元/1,000 tokens

后付费

已上线

通义千问72B

qwen-72b-chat

0.02元/1,000 tokens

0.02元/1,000 tokens

后付费

已上线

qwen1.5-72b-chat

0.005元/1,000 tokens

0.01元/1,000 tokens

通义千问32B

qwen1.5-32b-chat

0.0035元/1,000 tokens

0.007元/1,000 tokens

后付费

已上线

通义千问14B

qwen-14b-chat

0.008元/1,000 tokens

0.008元/1,000 tokens

后付费

已上线

qwen1.5-14b-chat

0.002元/1,000 tokens

0.004元/1,000 tokens

通义千问7B

qwen-7b-chat

0.006元/1,000 tokens

0.006元/1,000 tokens

后付费

已上线

qwen1.5-7b-chat

0.001元/1,000 tokens

0.002元/1,000 tokens

通义千问1.8B

qwen-1.8b-chat

限时免费中

限时免费中

后付费

已上线

通义千问0.5B

qwen1.5-0.5b-chat

限时免费中

限时免费中

后付费

已上线

基础限流

为了保证用户调用模型的公平性,通义千问默认对用户设置了基础限流。如果超出限流指定的调用限制,用户的API请求将会因为限流控制而失败,用户需要等待一段时间待满足限流条件后方能再次调用。

说明

限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。如果您有超过基础限流配额的访问需求,请使用下面表单中的方式额外提交申请。

模型服务

模型名

基础限流

超出基础限流申请方式

通义千问110B

qwen1.5-110b-chat

以下条件任何一个超出都会触发限流(限时免费开放中,限流策略可能随时变化):

  • 流量 ≤ 10 QPM,每分钟处理不超过10个完整的请求;

  • Token消耗 ≤ 20,000 TPM,每分钟消耗的Token数目不超过20,000。

qwen1.5-110b-chat超出基础限流配额点此申请

通义千问72B

qwen-72b-chat

以下条件任何一个超出都会触发限流(限时免费开放中,限流策略可能随时变化):

  • 流量 ≤ 80 QPM,每分钟处理不超过80个完整的请求;

  • Token消耗 ≤ 130,000 TPM,每分钟消耗的Token数目不超过130,000。

qwen-72b-chat超出基础限流配额点此申请

qwen1.5-72b-chat

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 120 QPM,每分钟处理不超过120个完整的请求;

  • Token消耗 ≤ 200,000 TPM,每分钟消耗的Token数目不超过200,000。

qwen1.5-72b-chat超出基础限流配额点此申请

通义千问32B

qwen1.5-32b-chat

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 10 QPM,每分钟处理不超过10个完整的请求;

  • Token消耗 ≤ 20,000 TPM,每分钟消耗的Token数目不超过20,000。

qwen1.5-32b-chat超出基础限流配额点此申请

通义千问14B

qwen-14b-chat

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 300 QPM,每分钟处理不超过300个完整的请求;

  • Token消耗 ≤ 500,000 TPM,每分钟消耗的Token数目不超过500,000。

qwen-14b-chat超出基础限流配额点此申请

qwen1.5-14b-chat

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 120 QPM,每分钟处理不超过120个完整的请求;

  • Token消耗 ≤ 200,000 TPM,每分钟消耗的Token数目不超过200,000。

qwen1.5-14b-chat超出基础限流配额点此申请

通义千问7B

qwen-7b-chat

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 300 QPM,每分钟处理不超过300个完整的请求;

  • Token消耗 ≤ 500,000 TPM,每分钟消耗的Token数目不超过500,000。

qwen-7b-chat超出基础限流配额点此申请

qwen1.5-7b-chat

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 120 QPM,每分钟处理不超过120个完整的请求;

  • Token消耗 ≤ 200,000 TPM,每分钟消耗的Token数目不超过200,000。

qwen1.5-7b-chat超出基础限流配额点此申请

通义千问1.8B

qwen-1.8b-chat

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 120 QPM,每分钟处理不超过120个完整的请求;

  • Token消耗 ≤ 200,000 TPM,每分钟消耗的Token数目不超过200,000。

qwen-1.8b-chat超出基础限流配额点此申请

如果您熟悉编程语言,推荐您使用SDK或API调用通义千问模型,实现灵活定制和开发。SDK或API调用请参考开发指南