文档

计量计费

更新时间:

通义千问

计费单元

模型服务

计费单元

通义千问

token

重要

Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个token通常对应一个汉字;对于英文文本来说,1个token通常对应3至4个字母。

通义千问模型服务根据模型输入和输出的总token数量进行计量计费,其中多轮对话中的history作为输入也会进行计量计费。每一次模型调用产生的实际token数量可以从 response 中获取。

计费单价

模型服务

模型名

计费单价

通义千问

qwen-turbo

0.008元/1,000 tokens

qwen-plus

0.04元/1,000 tokens

qwen-max

限时免费开放中

qwen-max-1201

qwen-max-longcontext

说明
  1. qwen-turbo原来为qwen-v1qwen-v1计费与qwen-turbo保持一致。qwen-v1模型已弃用,请使用qwen-turbo

  2. qwen-plus原来为qwen-plus-v1qwen-plus-v1计费与qwen-plus保持一致。qwen-plus-v1模型已弃用,请使用qwen-plus

免费额度

模型服务

模型名

免费额度

通义千问

qwen-turbo

开通DashScope即获赠总计 2,000,000 tokens限时免费使用额度,有效期 180 天。

qwen-plus

开通DashScope即获赠总计 1,000,000 tokens限时免费使用额度,有效期 180 天。

qwen-max

限时免费开放中。

qwen-max-1201

qwen-max-longcontext

基础限流

为了保证用户调用模型的公平性,通义千问对于普通用户设置了基础限流。限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。如果超出调用限制,用户的API请求将会因为限流控制而失败,用户需要等待一段时间待满足限流条件后方能再次调用。

重要

通常情况下,基础限流是可以满足大部分客户的应用场景的,如果您有超过基础限流配额的访问需求,请使用下面表单中的方式额外提交申请。

模型服务

模型名

基础限流

超出基础限流申请方式

通义千问

qwen-turbo

以下条件任何一个超出都会触发限流:

  • 调用频次 ≤ 500 QPM,每分钟不超过500次API调用;

  • Token消耗 ≤ 500,000 TPM,每分钟消耗的Token数目不超过500,000。

qwen-turbo超出基础限流配额点此申请

qwen-plus

以下条件任何一个超出都会触发限流:

  • 调用频次 ≤ 200 QPM,每分钟不超过200次API调用;

  • Token消耗 ≤ 200,000 TPM,每分钟消耗的Token数目不超过200,000。

qwen-plus超出基础限流配额点此申请

qwen-max

以下条件任何一个超出都会触发限流(限时免费开放中,限流策略可能随时变化):

  • 调用频次 ≤ 80 QPM,每分钟不超过80次API调用;

  • Token消耗 ≤ 130,000 TPM,每分钟消耗的Token数目不超过130,000。

qwen-max超出基础限流配额点此申请

qwen-max-1201

qwen-max-1201超出基础限流配额点此申请

qwen-max-longcontext

以下条件任何一个超出都会触发限流(限时免费开放中,限流策略可能随时变化):

  • 调用频次 ≤ 1 QPM,每分钟不超过1次API调用;

  • Token消耗 ≤ 300,000 TPM,每分钟消耗的Token数目不超过300,000。

qwen-max-longcontext超出基础限流配额需求请发送电子邮件至 dashscope@alibabacloud.com 额外申请。

查看账单

有关DashScope灵积模型服务的账单时效信息请参阅计量计费规则

有关账单详情请前往阿里云用户中心查询。

  • 本页导读 (0)
文档反馈