通用文本向量计费说明

计费单元

模型服务

计费单元

通用文本向量

Token

重要

这里Token数量指的是大模型使用的Tokenizer分词后对应的最小分词单元的数量。在通用文本向量模型中,单个Token平均约对应1.5个汉字和0.7个英文单词。通用文本向量服务根据模型输出结果对应的Token数量进行计量计费。每一次模型调用产生的实际Token数量可以从response中获取。

计费单价

模型名称

向量维度

最大行数

单行最大处理Token

支持语种

单价(每千输入Token)

text-embedding-v3

1,024(默认)、768512

10

8,192

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语等50+主流语种

0.0005

Batch调用:0.00025

text-embedding-v2

1,536

25

2,048

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语

0.0007

Batch调用:0.00035

text-embedding-v1

中文、英语、西班牙语、法语、葡萄牙语、印尼语

text-embedding-async-v2

100,000

中文、英语、西班牙语、法语、葡萄牙语、印尼语、日语、韩语、德语、俄罗斯语

0.0007

text-embedding-async-v1

中文、英语、西班牙语、法语、葡萄牙语、印尼语

说明

您可以参阅新人免费额度确认您是否具备享有免费额度的资格,并查询免费总额度、剩余额度及到期时间。

免费额度

模型服务

免费额度

text-embedding-v1

50Tokens

领取方式:开通阿里云百炼大模型后自动发放到账户中,点击产品开通了解详情。

有效期:180

text-embedding-v2

text-embedding-v3

text-embedding-async-v1

2000Tokens

领取方式:开通阿里云百炼大模型后自动发放到账户中,点击产品开通了解详情。

有效期:180

text-embedding-async-v2

说明

您可以参阅新人免费额度确认您是否具备享有免费额度的资格,并查询免费总额度、剩余额度及到期时间。

基础限流

为了保证用户调用模型的公平性,因此通用文本向量对用户设置了基础限流。限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。如果超出调用限制,用户的API请求将因为限流控制而失败,用户需要等待一段时间待满足限流条件后方能再次调用。

说明

限流是基于模型维度的,并且和调用用户的阿里云主账号相关联,按照该账号下所有API-KEY调用该模型的总和计算限流。

模型服务

模型名

基础限流

通用文本向量

text-embedding-v1

以下条件任何一个超出都会触发限流:

  • 调用频次 ≤ 30 QPS,每秒钟不超过30API调用;

  • Token消耗 ≤ 600,000 TPM,每分钟消耗的Token数目不超过600,000。

text-embedding-v2

text-embedding-v3

text-embedding-async-v1

以下条件任何一个超出都会触发提交作业限流:

  • 提交作业的调用频次 ≤ 1 QPS,每秒钟最多提交一个作业;

  • 当前用户在系统通用文本向量异步作业排队中+运行中的作业数量不超过50个;

另外,为了避免大量突发的作业占据太多资源,限制并发的作业数为3个,即任意时间,单个用户最多只有3个通用文本向量的异步作业在并发运行,其他的作业只能在队列中等待。

text-embedding-async-v2

查看账单

有关阿里云百炼大模型服务的账单时效信息请参阅产品计费

有关账单详情请前往费用与成本查询。