文档

计量计费

更新时间:
一键部署

Qwen-Long

计费单元

模型服务

计费单元

Qwen-Long

token

说明

Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个token通常对应一个汉字;对于英文文本来说,1个token通常对应3至4个字母。

Qwen-Long模型服务根据模型输入和输出的token数量进行计量计费,其中多轮对话中的history作为输入也会进行计量计费。每一次模型调用产生的实际token数量可以从 response 中获取。

计费单价

模型服务

模型名

计费单价(输入)

计费单价(输出)

Qwen-Long

qwen-long

0.0005元/1,000 tokens

0.002元/1,000 tokens

免费额度

说明

2024年5月21日,阿里云百炼大模型服务平台将开启一系列限时免费活动,最新的限时免费额度,请参考新用户限时免费福利

模型服务

模型名

免费额度

Qwen-Long

qwen-long

限2024年5月21日0点-2024年6月21日24点内首次开通百炼或灵积平台,即获赠一次性总计4,000,000 tokens限时免费使用额度,免费额度自激活日起30天内有效。如果您已在活动启动前开通过百炼或灵积平台模型服务,则您将不符合本次活动优惠条件。百炼和灵积共享免费额度,免费额度只能申请一次。活动详情请参考新用户限时免费福利公告。

基础限流

为了保证用户调用模型的公平性,Qwen-Long对于普通用户设置了基础限流。限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。如果超出调用限制,用户的API请求将会因为限流控制而失败,用户需要等待一段时间待满足限流条件后方能再次调用。

重要

如果您需要超过基础限流配额的访问,请使用下面的表格额外提交申请。

模型服务

模型名

基础限流

超出基础限流申请方式

Qwen-Long

qwen-long

以下条件中任何一个超出都会触发限流:

  • 调用频次 ≤ 100 QPM,每分钟不超过100次API调用;

  • Token消耗暂无限制。

qwen-long超出基础限流配额点此申请

查看账单

有关账单详情请前往阿里云用户中心查询。

  • 本页导读 (1)