Dolly计量计费

更新时间: 2024-01-02 16:37:22

重要

Dolly模型API调用需"申请体验"并通过后才可使用,否则API调用将返回错误状态码。

Dolly

计费单元

模型服务

计费单元

Dolly开源大语言模型

token

重要

Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个token通常对应一个汉字;对于英文文本来说,1个token通常对应3至4个字母。

Dolly模型服务根据模型输入和输出的总token数量进行计量计费,其中多轮对话中的history作为输入也会进行计量计费。每一次模型调用产生的实际token数量可以从 response 中获取。

计费单价

模型服务

模型名

计费单价

Dolly开源大语言模型

dolly-12b-v2

限时免费中。

免费额度

模型服务

模型名

免费额度

Dolly开源大语言模型

dolly-12b-v2

申请体验通过后,提供100,000 tokens免费使用额度。

基础限流

为了保证用户调用模型的公平性,默认对于普通用户设置了基础限流。如果超出限流指定的调用限制,用户的API请求将会因为限流控制而失败,用户需要等待一段时间待满足限流条件后方能再次调用。如果有超出基础限流的调用需求,可发送电子邮件至 dashscope@alibabacloud.com 申请调整。

说明

限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。

模型服务

模型名

基础限流

Dolly开源大语言模型

dolly-12b-v2

以下条件任何一个超出都会触发限流:

  • 流量 ≤ 10 QPM,每分钟处理不超过10个完整的请求;

  • Token消耗 ≤ 2,500 TPM,每分钟消耗的Token数目不超过2,500。

查看账单

有关DashScope灵积模型服务的账单时效信息请参阅:计量计费规则

有关账单详情请前往阿里云用户中心查询。

阿里云首页 模型服务灵积 相关技术圈