通过阅读本文,您可以快速了解AI搜索开放平台的计费项组成、计费方式、计费规则信息。
计费项
AI搜索开放平台涉及以下计费项:
模型调用:调用模型(如文档内容解析服务、文本向量化服务、排序服务等)服务产生的费用。
模型定制:用户结合自有数据对AI搜索开放平台提供的模型进行模型定制(如向量降维服务定制训练)产生的费用。
模型部署:用户将不同渠道的模型独立部署至AI搜索开放平台所产生的部署和调用费用。
AI搜索开放平台可免费开通,不使用不计费。
计费方式
除搜索引擎服务外,AI搜索开放平台均采用按量付费模式,按照服务调用量与模型定制训练实际消耗的计算时(CU)计费。每小时生成一个计费账单,所有的分时账单归属于一个订单,并按照生成订单时的账单从阿里云账号扣费。
自2024-07-04 17:00起,部分服务采用阶梯计费,参见以下计费规则。
计费规则
模型调用
模型名称 | 模型ID | 计费单位 | 0-500个单位定价 | 超出500个单位定价 |
模型名称 | 模型ID | 计费单位 | 0-500个单位定价 | 超出500个单位定价 |
ops-document-analyze-001 | 元/千tokens | 0.005 | 0.002 | |
元 / 张图片 | 0.006 | |||
元 / 个表格 | 0.012 | |||
调用文档内容解析服务时通过参数控制是否启用基于语义理解的文档层级结构提取功能,启用后,除产生文档解析费用以外,该功能按照0.002元/千tokens计费。 | 元/千tokens | 0.002 | ||
ops-image-analyze-ocr-001 | 元/次 | 0.08 | 0.02 | |
ops-image-analyze-vlm-001 | 元/千tokens | 0.02 | ||
ops-document-split-001 | 元/千tokens | 0.005 | 0.00002 | |
(包含文档向量化和用户Query向量化) | ops-text-embedding-001 | 元/千tokens | 0.005 | 0.0001 |
ops-text-embedding-002 | 0.005 | 0.0005 | ||
ops-text-embedding-zh-001 | 0.005 | 0.00005 | ||
ops-text-embedding-en-001 | 0.005 | 0.00005 | ||
ops-text-sparse-embedding-001 | 元/千tokens | 0.006 | 0.0006 | |
ops-embedding-dim-reduction-001 | 元/个docs | 0.005 | 0.00005 | |
ops-bge-reranker-larger | 元/个docs | 0.001 | 0.00003 | |
ops-text-reranker-001 | 元/个docs | 0.001 | 0.00015 | |
搜索引擎 | 阿里云Elasticsearch:基于开源Elasticsearch构建的全托管云服务,100%兼容开源功能的同时,支持开箱即用、按需付费,详情请参见阿里云ES。 | |||
OpenSearch-向量检索版:计费详情请参见向量检索版。 | ||||
ops-qwen-turbo | 元/千tokens | 输入:0.0004 输出:0.0007 | ||
qwen-turbo | 输入:0.0003 输出:0.0006 | |||
qwen-plus | 输入:0.0008 输出:0.002 | |||
qwen-max | 输入:0.0024 输出:0.0096 | |||
deepseek-r1 | 输入:0.004 输出:0.016 | |||
deepseek-r1-distill-qwen-7b | 输入:0.0005 输出:0.001 | |||
deepseek-r1-distill-qwen-14b | 输入:0.001 输出:0.003 | |||
deepseek-v3 | 输入:0.002 输出:0.008 | |||
ops-query-analyze-001 | 元/千tokens | 意图理解、相似问题扩展:
| ||
NL2SQL生成:
| ||||
通过效果评测模块对AI搜索开放平台提供的RAG开发链路进行效果测评,从用户提出问题开始,到RAG系统召回内容,再到LLM生成回答的整个流程进行综合评测。 | 元/千tokens | 输入:0.04 输出:0.12 |
模型定制
模型名称 | 说明 | 价格 |
模型名称 | 说明 | 价格 |
向量降维模型定制训练支持结合用户提供的向量数据,定制向量降维模型。实际业务场景中,先通过向量化模型对文本或者Query向量化,然后结合向量降维模型进一步降低向量维度。 | 按照实际消耗的计算资源CU数计费,每CU价格为3.87元。 实际消耗的CU数取决于训练的数据量和维度,按照最小化训练10万条1024维数据,需消耗约250个CU,产生费用为250*3.87=967.5元。 |
模型部署
计费公式为:CU单价*机型消耗的CU数量*购买机器个数
例如某用户购买2台gpu.a10.24g.x1部署模型服务,计费=1.07*11.01*2=23.56元/小时。
机型 | CU单价 | 单台机器消耗CU数量 |
机型 | CU单价 | 单台机器消耗CU数量 |
gpu.v100.16g.x1 | 1.07元/小时 | 30.14 |
gpu.t4.16g.x1 | 16.07 | |
gpu.a10.24g.x1 | 11.01 |
注意事项
服务名称与服务ID以及服务的API参数一一对应,详情请参见服务概览。
计费账单按照调用服务请求的实际使用量推送,每小时生成一个计费账单。
涉及阶梯计费的服务,系统按照阶梯推送账单。
部分服务以千tokens作为计费单位,统计用量时可能出现小数。
请确保阿里云账号处于未欠费状态,避免影响搜索服务的正常使用。
计费示例
假设某用户调用了1000个单位的文档切片服务,产生的费用如下:
500个单位(含500)的费用:0.005元*500=2.5元
500个单位以上的费用:0.00002元*500=0.01元
总费用:2.5+0.01=2.51元
相关文档
- 本页导读 (1)
- 计费项
- 计费方式
- 计费规则
- 模型调用
- 模型定制
- 模型部署
- 注意事项
- 计费示例
- 相关文档