文档

大语言模型

更新时间:
一键部署

模型简介

Qwen1.5

Qwen1.5是Qwen开源系列的下一个版本。与之前的版本相比,Qwen1.5显著提升了聊天模型与人类偏好的一致性,改善了它们的多语言能力,并具备了强大的链接外部系统能力。灵积上提供API服务的是新版本qwen模型的chat版本,在chat能力上大幅提升,即便在英文的MT-Bench上,Qwen1.5-Chat系列也取得了优秀的性能。

阿里云百炼平台上提供的1.8B模型、7B模型、14B模型和72B模型基于千问开源版本,进行了针对性的推理性能优化,为广大开发者提供便捷的API服务。各个版本均对应魔搭社区开源的各个尺寸的模型版本,详细参考链接

Qwen

通义千问为阿里云研发的大语言系列模型。千问模型基于Transformer架构,在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在预训练模型的基础之上,使用对齐机制打造了模型的chat版本。其中千问-1.8B是18亿参数规模的模型,千问-7B是70亿参数规模的模型,千问-14B是140亿参数规模的模型,千问-72B是720亿参数规模的模型。

阿里云百炼平台上提供的1.8B模型、7B模型、14B模型和72B模型基于千问开源版本,进行了针对性的推理性能优化,为广大开发者提供便捷的API服务。其中1.8B模型基于最新在魔搭社区开源的最新版本,7B模型基于最新在魔搭社区上开源的V1.1版本,而14B模型同样基于魔搭社区上最新版本提供,72B模型基于魔搭社区开源的最新版本提供。

模型服务

模型名称

模型描述

应用场景

通义千问72B

qwen1.5-72b-chat

通义千问1.5对外开源的72B规模参数量的经过人类指令对齐的chat模型。

  • 文字创作:撰写故事、公文、邮件、剧本和诗歌等。

  • 文本处理:润色文本和提取文本摘要等。

  • 编程辅助:编写和优化代码等。

qwen-72b-chat

通义千问对外开源的72B规模参数量的经过人类指令对齐的chat模型。

通义千问14B

qwen-14b-chat

通义千问对外开源的14B规模参数量的经过人类指令对齐的chat模型。

qwen1.5-14b-chat

通义千问1.5对外开源的14B规模参数量的经过人类指令对齐的chat模型。

通义千问7B

qwen1.5-7b-chat

通义千问1.5对外开源的7B规模参数量是经过人类指令对齐的chat模型。

qwen-7b-chat

通义千问对外开源的7B规模参数量的经过人类指令对齐的chat模型。

通义千问1.8B

qwen-1.8b-longcontext-chat

通义千问对外开源的1.8B规模参数量的经过人类指令对齐的chat模型。

qwen-1.8b-chat

通义千问对外开源的1.8B规模参数量的经过人类指令对齐的chat模型。

计费和限流信息

说明

限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。

模型名称

计费单价

免费额度

基础限流

qwen-72b-chat

0.02元/1,000tokens

100万tokens

领取方式:新个用户开通后自动发放到账户中,老用户自动补发免费额度。点击计费管理开通阿里云百炼服务。

有效期:1个月

以下条件任何一个超出都会触发限流(限时免费开放中,限流策略可能随时变化):

  • 流量 ≤ 80 QPM,每分钟处理不超过80个完整的请求;

  • Token消耗 ≤ 130,000 TPM,每分钟消耗的Token数目不超过130,000。

qwen-14b-chat

0.008元/1,000tokens

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 300 QPM,每分钟处理不超过300个完整的请求;

  • Token消耗 ≤ 500,000 TPM,每分钟消耗的Token数目不超过500,000。

qwen-7b-chat

0.006元/1,000tokens

qwen-1.8b-chat

限时免费中

限时免费中

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 120 QPM,每分钟处理不超过120个完整的请求;

  • Token消耗 ≤ 200,000 TPM,每分钟消耗的Token数目不超过200,000。

qwen-1.8b-longcontext-chat

限时免费中

限时免费中

/

qwen1.5-7b-chat

即将上架

0.006元/1,000tokens

100万tokens

领取方式:新用户开通后自动发放到账户中,老用户自动补发免费额度。点击计费管理开通阿里云百炼服务。

有效期:1个月

/

qwen1.5-14b-chat

即将上架

0.008元/1,000tokens

/

qwen1.5-72b-chat

即将上架

0.02元/1,000tokens

/

如果您熟悉编程语言,推荐您使用SDK或API调用通义千问模型,实现灵活定制和开发。SDK或API调用请参考开发指南

说明

超出基础限流配额申请

将以下信息补充完整并发送到邮箱:modelstudio@service.aliyun.com,会有专员进行评估。

阿里云主账号UID:

需调整的模型名称:

每分钟请求数:

每分钟使用量(token):

联系电话:

申请原因(需要尽可能的详细):

  • 本页导读 (1)
文档反馈