计费单元
模型服务 | 计费单元 |
通用文本向量 | token |
这里token数量指的是大模型使用的tokenizer分词后对应的最小分词单元的数量。在通用文本向量模型中,单个token平均约对应1.5个汉字,0.7个英文单词。通用文本向量服务根据模型输出结果对应的token数量进行计量计费。每一次模型调用产生的实际token数量可以从response中获取。
目前仅支持 text-embedding-v3。当前版本不支持 text-embedding-v1 和 text-embedding-v2。
计费单价
模型名 | 计费单价(币种:RMB) |
text-embedding-v1 | 0.0007元/1000 tokens |
text-embedding-async-v1 | |
text-embedding-v2 | |
text-embedding-async-v2 | |
text-embedding-v3 |
免费额度
模型服务 | 免费额度 |
text-embedding-v1 | 50万tokens 领取方式:开通阿里云百炼大模型后自动发放到账户中,点击产品开通了解详情。 有效期:180天 |
text-embedding-v2 | |
text-embedding-v3 | |
text-embedding-async-v1 | 2000万tokens 领取方式:开通阿里云百炼大模型后自动发放到账户中,点击产品开通了解详情。 有效期:180天 |
text-embedding-async-v2 |
您可以参阅新人免费额度确认您是否具备享有免费额度的资格,并查询免费总额度、剩余额度及到期时间。
基础限流
为了保证用户调用模型的公平性,因此通用文本向量对用户设置了基础限流。限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。如果超出调用限制,用户的API请求将因为限流控制而失败,用户需要等待一段时间待满足限流条件后方能再次调用。
限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。
模型服务 | 模型名 | 基础限流 |
通用文本向量 | text-embedding-v1 | 以下条件任何一个超出都会触发限流:
|
text-embedding-v2 | ||
text-embedding-v3 | ||
text-embedding-async-v1 | 以下条件任何一个超出都会触发提交作业限流:
另外,为了避免大量突发的作业占据太多资源,限制并发的作业数为3个,即任意时间,单个用户最多只有3个通用文本向量的异步作业在并发运行,其他的作业只能在队列中等待。 | |
text-embedding-async-v2 |
查看账单
有关阿里云百炼大模型服务的账单时效信息请参阅产品计费。
有关账单详情请前往费用与成本查询。