计量计费_大模型服务平台百炼-阿里云帮助中心

通义千问VL

计费单元

模型服务	计费单元
通义千问VL	token

重要

Token是模型用来表示自然语言文本的基本单位，可以直观的理解为“字”或“词”。对于中文文本来说，1个token通常对应一个汉字；对于英文文本来说，1个token通常对应3至4个字母。

通义千问VL模型服务根据模型输入和输出的总token数量进行计量计费，其中多轮对话中的content作为输入也会进行计量计费。每一次模型调用产生的实际token数量可以从 response 中获取。

qwen-vl-plus&qwen-vl-max 的pix2token转换公式为：512*512对应约334token，其他pix按比例折算。最小单位为28*28的pix对应一个token，如果长宽不是28的整数倍向上取到28的整数倍计算，一张图最少4个token，最多1280个token。

计费单价

模型服务	模型名	计费单价
通义千问VL	qwen-vl-plus	0.008元/1,000 tokens

	qwen-vl-max	0.02元/1,000 tokens

免费额度

模型服务	模型名	免费额度
通义千问VL	qwen-vl-plus	100万tokens 领取方式：新用户开通后自动发放到账户中，点击计费管理开通阿里云百炼服务。有效期：1个月

	qwen-vl-max

基础限流

为了保证用户调用模型的公平性，默认对于普通用户设置了基础限流。如果超出限流指定的调用限制，用户的API请求将会因为限流控制而失败，用户需要等待一段时间，待满足限流条件后方能再次调用。

说明

限流是基于模型维度的，并且和调用用户的阿里云主账号相关联，按照该账号下所有API-KEY调用该模型的总和计算限流。

重要

通常情况下，基础限流是可以满足大部分客户的应用场景的，如果您有超过基础限流配额的访问需求，请使用下面表单中的方式额外提交申请。

模型服务

模型名

基础限流

超出基础限流申请方式

通义千问VL

qwen-vl-plus

以下条件任何一个超出都会触发限流：

流量 ≤ 60 QPM，每分钟处理不超过60个完整的请求；
Token消耗 ≤ 100,000 TPM，每分钟消耗的Token数目不超过100,000。

qwen-vl-plus超出基础限流配额点此申请

qwen-vl-max

以下条件任何一个超出都会触发限流：

流量 ≤ 15 QPM，每分钟处理不超过15个完整的请求；
Token消耗 ≤ 25,000 TPM，每分钟消耗的Token数目不超过25,000。

qwen-vl-max超出基础限流配额点此申请

查看账单

有关账单详情请前往阿里云用户中心查询。