计量计费

说明

后续的qwen-vl模型调用请移步至百炼平台,参考文档:API详情

通义千问VL

计费单元

模型服务

计费单元

通义千问VL

token

重要

Token是模型用来表示自然语言文本的基本单位,可以直观地理解为“字”或“词”。对于中文文本来说,1个token通常对应一个汉字;对于英文文本来说,1个token通常对应3至4个字母。

通义千问VL模型服务根据模型输入和输出的总token数量进行计量计费,其中多轮对话中的content作为输入也会进行计量计费。每一次模型调用产生的实际token数量可以从 response 中获取。

计费单价

模型服务

模型名

计费单价

通义千问VL

qwen-vl-plus

0.008元/1,000 tokens

qwen-vl-max

0.02元/1,000 tokens

qwen-vl-max-0809

qwen-vl-max-0201

免费额度

模型服务

模型名

免费额度

通义千问VL

qwen-vl-plus

开通DashScope即获赠总计 1,000,000 tokens 限时免费使用额度,有效期30天。

2024年9月19号0点之后开通的用户,免费额度有效期180天。

qwen-vl-max

qwen-vl-max-0809

100万Token

有效期:已开通百炼的用户,自8月23日0点起30天内有效。

新开通百炼的用户,在开通后30天内有效。

qwen-vl-max-0201

开通DashScope即获赠总计 1,000,000 tokens 限时免费使用额度,有效期30天。

2024年9月19号0点之后开通的用户,免费额度有效期180天。

基础限流

为了保证用户调用模型的公平性,模型存在基础限流设置。如果超出限流指定的调用限制,用户的API请求将会因为限流控制而失败,用户需要等待一段时间,待满足限流条件后方能再次调用。

说明

限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。

模型服务

模型名

基础限流

通义千问VL

qwen-vl-plus

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 60 QPM,每分钟处理不超过60个完整的请求;

  • Token消耗 ≤ 100,000 TPM,每分钟消耗的Token数目不超过100,000。

qwen-vl-max

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 15 QPM,每分钟处理不超过15个完整的请求;

  • Token消耗 ≤ 25,000 TPM,每分钟消耗的Token数目不超过25,000。

qwen-vl-max-0809

qwen-vl-max-0201

查看账单

有关DashScope的账单时效信息请参阅产品计费

有关账单详情请前往阿里云费用与成本查询。