通用文本向量Text Embedding计量计费_大模型服务平台百炼(Model Studio)-阿里云帮助中心

计费单元

模型服务	计费单元
通用文本向量	token

重要

这里token数量指的是大模型使用的tokenizer分词后对应的最小分词单元的数量。在通用文本向量模型中，单个token平均约对应1.5个汉字，0.7个英文单词。通用文本向量服务根据模型输出结果对应的token数量进行计量计费。每一次模型调用产生的实际token数量可以从response中获取。

说明

目前仅支持 text-embedding-v3。当前版本不支持 text-embedding-v1 和 text-embedding-v2。

计费单价

模型名	计费单价（币种：RMB）
text-embedding-v1	0.0007元/1000 tokens
text-embedding-async-v1
text-embedding-v2
text-embedding-async-v2
text-embedding-v3

免费额度

模型服务	免费额度
text-embedding-v1	50万tokens 领取方式：开通阿里云百炼大模型后自动发放到账户中，点击产品开通了解详情。有效期：180天
text-embedding-v2
text-embedding-v3
text-embedding-async-v1	2000万tokens 领取方式：开通阿里云百炼大模型后自动发放到账户中，点击产品开通了解详情。有效期：180天
text-embedding-async-v2

说明

您可以参阅新人免费额度确认您是否具备享有免费额度的资格，并查询免费总额度、剩余额度及到期时间。

基础限流

为了保证用户调用模型的公平性，因此通用文本向量对用户设置了基础限流。限流是基于模型维度的，并且和调用用户的阿里云主账号相关联，按照该账号下所有API-KEY调用该模型的总和计算限流。如果超出调用限制，用户的API请求将因为限流控制而失败，用户需要等待一段时间待满足限流条件后方能再次调用。

说明

限流是基于模型维度的，并且和调用用户的阿里云主账号相关联，按照该账号下所有API-KEY调用该模型的总和计算限流。

模型服务	模型名	基础限流
通用文本向量	text-embedding-v1	以下条件任何一个超出都会触发限流：调用频次 ≤ 30 QPS，每秒钟不超过30次API调用； Token消耗 ≤ 600,000 TPM，每分钟消耗的Token数目不超过600,000。
	text-embedding-v2
	text-embedding-v3
	text-embedding-async-v1	以下条件任何一个超出都会触发提交作业限流：提交作业的调用频次 ≤ 1 QPS，每秒钟最多提交一个作业；当前用户在系统通用文本向量异步作业排队中+运行中的作业数量不超过50个；另外，为了避免大量突发的作业占据太多资源，限制并发的作业数为3个，即任意时间，单个用户最多只有3个通用文本向量的异步作业在并发运行，其他的作业只能在队列中等待。
	text-embedding-async-v2

查看账单

有关阿里云百炼大模型服务的账单时效信息请参阅产品计费。

有关账单详情请前往费用与成本查询。