千问模型
模型简介
Qwen1.5
Qwen1.5是Qwen开源系列的下一个版本。与之前的版本相比,Qwen1.5显著提升了聊天模型与人类偏好的一致性,改善了它们的多语言能力,并具备了强大的链接外部系统能力。灵积上提供API服务的是新版本qwen模型的chat版本,在chat能力上大幅提升,即便在英文的MT-Bench上,Qwen1.5-Chat系列也取得了优秀的性能。
阿里云百炼平台上提供的0.5B模型、1.8B模型、7B模型、14B模型、32B模型和72B模型基于千问开源版本,进行了针对性的推理性能优化,为广大开发者提供便捷的API服务。各个版本均对应魔搭社区开源的各个尺寸的模型版本,详细参考链接。
CodeQwen1.5
CodeQwen1.5是专门针对代码的Qwen1.5版本。与Qwen1.5相比,CodeQwen1.5在大量的代码数据上训练得到。它拥有强大的代码生成能力,在一系列基准测试中展现出不凡的竞争力。其支持92种编程语言,上下文长度可达64K,在SQL生成和bug修复方面均有出色的表现。
阿里云百炼平台上提供的7B模型基于千问开源版本,进行了针对性的推理性能优化,为广大开发者提供便捷的API服务。各个版本均对应魔搭社区开源的各个尺寸的模型版本,详细参考链接。
Qwen
通义千问为阿里云研发的大语言系列模型。千问模型基于Transformer架构,在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。同时,在预训练模型的基础之上,使用对齐机制打造了模型的chat版本。其中千问-1.8B是18亿参数规模的模型,千问-7B是70亿参数规模的模型,千问-14B是140亿参数规模的模型,千问-72B是720亿参数规模的模型。
阿里云百炼平台上提供的1.8B模型、7B模型、14B模型和72B模型基于千问开源版本,进行了针对性的推理性能优化,为广大开发者提供便捷的API服务。其中1.8B模型基于最新在魔搭社区开源的最新版本,7B模型基于最新在魔搭社区上开源的V1.1版本,而14B模型同样基于魔搭社区上最新版本提供,72B模型基于魔搭社区开源的最新版本提供。
模型服务 | 模型名称 | 模型描述 | 应用场景 |
通义千问110B | qwen1.5-110b-chat | 通义千问1.5对外开源的110B规模参数量的经过人类指令对齐的chat模型。 |
|
通义千问72B | qwen1.5-72b-chat | 通义千问1.5对外开源的72B规模参数量的经过人类指令对齐的chat模型。 | |
qwen-72b-chat | 通义千问对外开源的72B规模参数量的经过人类指令对齐的chat模型。 | ||
通义千问32B | qwen1.5-32b-chat | 通义千问1.5对外开源的32B规模参数量的经过人类指令对齐的chat模型 | |
通义千问14B | qwen-14b-chat | 通义千问对外开源的14B规模参数量的经过人类指令对齐的chat模型。 | |
qwen1.5-14b-chat | 通义千问1.5对外开源的14B规模参数量的经过人类指令对齐的chat模型。 | ||
通义千问7B | qwen1.5-7b-chat | 通义千问1.5对外开源的7B规模参数量是经过人类指令对齐的chat模型。 | |
qwen-7b-chat | 通义千问对外开源的7B规模参数量的经过人类指令对齐的chat模型。 | ||
qwen1.5-7b-chat | 通义千问1.5对外开源的7B规模参数量的经过人类指令对齐的针对代码场景的chat模型。 | ||
通义千问1.8B | qwen-1.8b-chat | 通义千问对外开源的1.8B规模参数量的经过人类指令对齐的chat模型。 | |
通义千问0.5B | qwen1.5-0.5b-chat | 通义千问1.5对外开源的0.5B规模参数量的经过人类指令对齐的chat模型。 |
计费和限流信息
计费信息
模型服务 | 规格 | 输入(input)价格 | 输出(output)价格 | 计费模式 | 上线时间 |
通义千问110B | qwen1.5-110b-chat | 0.007元/1,000 tokens | 0.014元/1,000 tokens | 后付费 | 已上线 |
通义千问72B | qwen-72b-chat | 0.02元/1,000 tokens | 0.02元/1,000 tokens | 后付费 | 已上线 |
qwen1.5-72b-chat | 0.005元/1,000 tokens | 0.01元/1,000 tokens | |||
通义千问32B | qwen1.5-32b-chat | 0.0035元/1,000 tokens | 0.007元/1,000 tokens | 后付费 | 已上线 |
通义千问14B | qwen-14b-chat | 0.008元/1,000 tokens | 0.008元/1,000 tokens | 后付费 | 已上线 |
qwen1.5-14b-chat | 0.002元/1,000 tokens | 0.004元/1,000 tokens | |||
通义千问7B | qwen-7b-chat | 0.006元/1,000 tokens | 0.006元/1,000 tokens | 后付费 | 已上线 |
qwen1.5-7b-chat | 0.001元/1,000 tokens | 0.002元/1,000 tokens | |||
通义千问1.8B | qwen-1.8b-chat | 限时免费中 | 限时免费中 | 后付费 | 已上线 |
通义千问0.5B | qwen1.5-0.5b-chat | 限时免费中 | 限时免费中 | 后付费 | 已上线 |
基础限流
为了保证用户调用模型的公平性,通义千问默认对用户设置了基础限流。如果超出限流指定的调用限制,用户的API请求将会因为限流控制而失败,用户需要等待一段时间待满足限流条件后方能再次调用。
限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。如果您有超过基础限流配额的访问需求,请使用下面表单中的方式额外提交申请。
模型服务 | 模型名 | 基础限流 | 超出基础限流申请方式 |
通义千问110B | qwen1.5-110b-chat | 以下条件任何一个超出都会触发限流(限时免费开放中,限流策略可能随时变化):
| |
通义千问72B | qwen-72b-chat | 以下条件任何一个超出都会触发限流(限时免费开放中,限流策略可能随时变化):
| |
qwen1.5-72b-chat | 以下条件任何一个超出都会触发限流:
| ||
通义千问32B | qwen1.5-32b-chat | 以下条件任何一个超出都会触发限流:
| |
通义千问14B | qwen-14b-chat | 以下条件任何一个超出都会触发限流:
| |
qwen1.5-14b-chat | 以下条件任何一个超出都会触发限流:
| ||
通义千问7B | qwen-7b-chat | 以下条件任何一个超出都会触发限流:
| |
qwen1.5-7b-chat | 以下条件任何一个超出都会触发限流:
| ||
通义千问1.8B | qwen-1.8b-chat | 以下条件任何一个超出都会触发限流:
|
如果您熟悉编程语言,推荐您使用SDK或API调用通义千问模型,实现灵活定制和开发。SDK或API调用请参考开发指南。