计量计费
通义千问
计费单元
模型服务 | 计费单元 |
通义千问 | token |
Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个token通常对应一个汉字;对于英文文本来说,1个token通常对应3至4个字母。
通义千问模型服务根据模型输入和输出的总token数量进行计量计费,其中多轮对话中的history作为输入也会进行计量计费。每一次模型调用产生的实际token数量可以从 response 中获取。
计费单价
模型服务 | 模型名 | 计费单价 |
通义千问 | qwen-turbo | 0.008元/1,000 tokens |
qwen-plus | 0.02元/1,000 tokens | |
qwen-max | 0.12元/1,000 tokens | |
qwen-max-0403 | ||
qwen-max-0107 | ||
qwen-max-1201 | ||
qwen-max-longcontext |
qwen-turbo
原来为qwen-v1
。qwen-v1
计费与qwen-turbo
保持一致。qwen-v1
模型已弃用,请使用qwen-turbo
。qwen-plus
原来为qwen-plus-v1
。qwen-plus-v1
计费与qwen-plus
保持一致。qwen-plus-v1
模型已弃用,请使用qwen-plus
。
免费额度
模型服务 | 模型名 | 免费额度 |
通义千问 | qwen-turbo | 200万tokens 领取方式:开通阿里云百炼服务后,自动发放; 有效期:180天 |
qwen-plus | 100万tokens 领取方式:开通阿里云百炼服务后,自动发放; 有效期:180天 | |
qwen-max | 100万tokens 领取方式:开通阿里云百炼服务后,自动发放; 有效期:30天 | |
qwen-max-0403 | ||
qwen-max-0107 | ||
qwen-max-1201 | ||
qwen-max-longcontext |
基础限流
为了保证用户调用模型的公平性,通义千问对于普通用户设置了基础限流。限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。如果超出调用限制,用户的API请求将会因为限流控制而失败,用户需要等待一段时间待满足限流条件后方能再次调用。
通常情况下,基础限流是可以满足大部分客户的应用场景的,如果您有超过基础限流配额的访问需求,请使用下面表单中的方式额外提交申请。
模型服务 | 模型名 | 基础限流 | 超出基础限流申请方式 |
通义千问 | qwen-turbo | 以下条件任何一个超出都会触发限流:
| |
qwen-plus | 以下条件任何一个超出都会触发限流:
| ||
qwen-max | 以下条件任何一个超出都会触发限流(限时免费开放中,限流策略可能随时变化):
| ||
qwen-max-0403 | |||
qwen-max-1201 | |||
qwen-max-0107 | 以下条件任何一个超出都会触发限流(限时免费开放中,限流策略可能随时变化):
| ||
qwen-max-longcontext | 以下条件任何一个超出都会触发限流:
| 暂无 |
查看账单
有关账单详情请前往阿里云用户中心查询。
- 本页导读 (1)