AI搜索开放平台如何计费_智能开放搜索 OpenSearch(Open Search)-阿里云帮助中心

通过阅读本文，您可以快速了解AI搜索开放平台的计费项组成、计费方式、计费规则信息。

计费项

AI搜索开放平台涉及以下计费项：

模型调用：调用模型（如文档内容解析服务、文本向量化服务、排序服务等）服务产生的费用。
模型定制：用户结合自有数据对AI搜索开放平台提供的模型进行模型定制（如向量降维服务定制训练）产生的费用。
模型部署：用户将不同渠道的模型独立部署至AI搜索开放平台所产生的部署和调用费用。

说明

AI搜索开放平台可免费开通，不使用不计费。

计费方式

除搜索引擎服务外，AI搜索开放平台均采用按量付费模式，按照服务调用量与模型定制训练实际消耗的计算时（CU）计费。每小时生成一个计费账单，所有的分时账单归属于一个订单，并按照生成订单时的账单从阿里云账号扣费。

重要

自2024-07-04 17:00起，部分服务采用阶梯计费，参见以下计费规则。

计费规则

模型调用

模型名称	模型ID	计费单位	0-500个单位定价	超出500个单位定价

模型名称	模型ID	计费单位	0-500个单位定价	超出500个单位定价
文档内容解析	ops-document-analyze-001	元/千tokens	0.005	0.002
		元 / 张图片	0.006
		元 / 个表格	0.012
文档内容解析-基于语义理解的文档层级结构提取说明调用文档内容解析服务时通过参数控制是否启用基于语义理解的文档层级结构提取功能，启用后，除产生文档解析费用以外，该功能按照0.002元/千tokens计费。		元/千tokens	0.002
图片文本识别	ops-image-analyze-ocr-001	元/次	0.08	0.02
图片内容理解	ops-image-analyze-vlm-001	元/千tokens	0.02
文档切片	ops-document-split-001	元/千tokens	0.005	0.00002
文本向量（包含文档向量化和用户Query向量化）	ops-text-embedding-001	元/千tokens	0.005	0.0001
	ops-text-embedding-002		0.005	0.0005
	ops-text-embedding-zh-001		0.005	0.00005
	ops-text-embedding-en-001		0.005	0.00005
文本稀疏向量	ops-text-sparse-embedding-001	元/千tokens	0.006	0.0006
向量降维服务	ops-embedding-dim-reduction-001	元/个docs	0.005	0.00005
排序服务	ops-bge-reranker-larger	元/个docs	0.001	0.00003
排序服务	ops-text-reranker-001	元/个docs	0.001	0.00015
搜索引擎	阿里云Elasticsearch：基于开源Elasticsearch构建的全托管云服务，100%兼容开源功能的同时，支持开箱即用、按需付费，详情请参见阿里云ES。
搜索引擎	OpenSearch-向量检索版：计费详情请参见向量检索版。
大语言模型	ops-qwen-turbo	元/千tokens	输入：0.0004 输出：0.0007
	qwen-turbo		输入：0.0003 输出：0.0006
	qwen-plus		输入：0.0008 输出：0.002
	qwen-max		输入：0.0024 输出：0.0096
	deepseek-r1		输入：0.004 输出：0.016
	deepseek-r1-distill-qwen-7b		输入：0.0005 输出：0.001
	deepseek-r1-distill-qwen-14b		输入：0.001 输出：0.003
	deepseek-v3		输入：0.002 输出：0.008
查询分析	ops-query-analyze-001	元/千tokens	意图理解、相似问题扩展：输入：0.007 输出：0.027
查询分析	ops-query-analyze-001	元/千tokens	NL2SQL生成：输入：0.002 输出：0.006
效果测评	通过效果评测模块对AI搜索开放平台提供的RAG开发链路进行效果测评，从用户提出问题开始，到RAG系统召回内容，再到LLM生成回答的整个流程进行综合评测。	元/千tokens	输入：0.04 输出：0.12

模型定制

模型名称	说明	价格

模型名称

说明

价格

向量降维模型定制训练

向量降维模型定制训练支持结合用户提供的向量数据，定制向量降维模型。实际业务场景中，先通过向量化模型对文本或者Query向量化，然后结合向量降维模型进一步降低向量维度。

按照实际消耗的计算资源CU数计费，每CU价格为3.87元。

实际消耗的CU数取决于训练的数据量和维度，按照最小化训练10万条1024维数据，需消耗约250个CU，产生费用为250*3.87=967.5元。

模型部署

计费公式为：CU单价*机型消耗的CU数量*购买机器个数

例如某用户购买2台gpu.a10.24g.x1部署模型服务，计费=1.07*11.01*2=23.56元/小时。

机型	CU单价	单台机器消耗CU数量

机型	CU单价	单台机器消耗CU数量
gpu.v100.16g.x1	1.07元/小时	30.14
gpu.t4.16g.x1		16.07
gpu.a10.24g.x1		11.01

注意事项

服务名称与服务ID以及服务的API参数一一对应，详情请参见服务概览。
计费账单按照调用服务请求的实际使用量推送，每小时生成一个计费账单。
涉及阶梯计费的服务，系统按照阶梯推送账单。
部分服务以千tokens作为计费单位，统计用量时可能出现小数。
请确保阿里云账号处于未欠费状态，避免影响搜索服务的正常使用。

计费示例

假设某用户调用了1000个单位的文档切片服务，产生的费用如下：

500个单位（含500）的费用：0.005元*500=2.5元
500个单位以上的费用：0.00002元*500=0.01元
总费用：2.5+0.01=2.51元

计费方式和计费项

计费项