各项服务计费规则详细价格-智能开放搜索 OpenSearch-阿里云

通过阅读本文，您可以快速了解AI搜索开放平台的计费项组成、计费方式、计费规则信息。

计费项

AI搜索开放平台涉及以下计费项：

模型调用：调用模型（如文档内容解析服务、文本向量化服务、排序服务等）服务产生的费用。
模型定制：用户结合自有数据对AI搜索开放平台提供的模型进行模型定制（如向量降维服务定制训练）产生的费用。
模型部署：将不同渠道的模型独立部署至AI搜索开放平台所产生的部署和调用费用。
服务开发：AI搜索开放平台集成PAI DSW功能，开发者可以在平台内通过Notebook完成服务开发与执行。

说明

AI搜索开放平台可免费开通，不使用不计费。

计费方式

除搜索引擎服务外，AI搜索开放平台均采用按量付费模式，按照服务调用量与模型定制训练实际消耗的计算时（CU）计费。每小时生成一个计费账单，所有的分时账单归属于一个订单，并按照生成订单时的账单从阿里云账号扣费。

重要

自2024-07-04 17:00起，部分服务采用阶梯计费，具体请参见以下计费规则文档。

计费规则

模型调用

在大语言模型中，Token是模型处理和理解文本的最小单位。通常表示单词、字词、字符或符号等文本片段，不同模型可能有自己的切分方法，字符数目和Token数目不一定一一对应。

AI搜索开放平台模型调用涉及的Token计费单位为元/千tokens，部分服务采用阶梯计费，部分服务按输入与输出token计费。

说明

部分模型支持Token计算预估调用产生的Token数。

阶梯计费示例：

调用文本稀疏向量服务，产生了1000000个token，共计为1000个计费单位，则计费为：500*0.006+500*0.0006=3.3元

输入输出计费示例：

调用大语言模型qwen3-235b-a22b，产生了输入与输出各1000个token，则计费为：

1*0.004+1*0.04=0.044元

模型名称	模型ID	计费单位	0-500个单位定价	超出500个单位定价
文档内容解析	ops-document-analyze-001	元/千tokens	0.005	0.002
		元/张图片	0.006
		元/个表格	0.012
文档内容解析-基于语义理解的文档层级结构提取说明调用文档内容解析服务时通过参数控制是否启用基于语义理解的文档层级结构提取功能，启用后，除产生文档解析费用以外，该功能按照0.002元/千tokens计费。		元/千tokens	0.002
图片文本识别	ops-image-analyze-ocr-001	元/次	0.08	0.02
图片内容理解	ops-image-analyze-vlm-001	元/千tokens	0.02
文档切片	ops-document-split-001	元/千tokens	0.005	0.00002
文本向量	ops-text-embedding-001	元/千tokens	0.005	0.0001
	ops-text-embedding-002		0.005	0.0005
	ops-text-embedding-zh-001		0.005	0.00005
	ops-text-embedding-en-001		0.005	0.00005
	ops-gte-sentence-embedding-multilingual-base		0.005	0.0002

	ops-qwen3-embedding-0.6b		0.005	0.0005
多模态向量用于文本和图片向量化	ops-m2-encoder 文本向量化	元/千tokens	0.005	0.0002
	ops-m2-encoder 图片向量化	元/张图片	0.005	0.0001
	ops-m2-encoder-large 文本向量化	元/千tokens	0.005	0.0005
	ops-m2-encoder-large 图片向量化	元/张图片	0.005	0.0002
	ops-gme-qwen2-vl-2b-instruct 文本向量化	元/千tokens	0.005	0.0006
	ops-gme-qwen2-vl-2b-instruct 图片向量化	元/张图片	0.005	0.0005
文本稀疏向量	ops-text-sparse-embedding-001	元/千tokens	0.006	0.0006
向量降维服务	ops-embedding-dim-reduction-001	元/个docs	0.005	0.00005
排序服务	ops-bge-reranker-larger	元/个docs	0.001	0.00003
	ops-text-reranker-001		0.001	0.00015

	ops-qwen3-reranker-0.6b		0.001	0.0001
视频截帧	ops-video-snapshot-001	元/千张	0.1
语音识别	ops-audio-asr-001	元/小时	0.57
搜索引擎	阿里云Elasticsearch：基于开源Elasticsearch构建的全托管云服务，100%兼容开源功能的同时，支持开箱即用、按需付费，详情请参见阿里云ES。
	OpenSearch-向量检索版：计费详情请参见向量检索版。
大语言模型（LLM）	qwen3-235b-a22b	元/千tokens	输入：0.004 输出：0.04
	qwq-32b		输入：0.002 输出：0.006
	ops-qwen-turbo		输入：0.0004 输出：0.0007
	qwen-turbo		输入：0.0003 输出：0.0006
	qwen-plus		输入：0.0008 输出：0.002
	qwen-max		输入：0.0024 输出：0.0096
	deepseek-r1		输入：0.004 输出：0.016
	deepseek-r1-distill-qwen-7b		输入：0.0005 输出：0.001
	deepseek-r1-distill-qwen-14b		输入：0.001 输出：0.003
	deepseek-v3		输入：0.002 输出：0.008
联网搜索	联网搜索费用为：调用次数费用+Query改写费用联网搜索时默认使用qwen-max模型进行Query改写。使用方式：支持通过以下两种方式使用联网搜索：直接调用联网搜索API 使用LLM模型时可启用联网搜索。	元/次	0.0048
		元/千tokens	Query改写：输入：0.0024 输出：0.0096
查询分析	ops-query-analyze-001	元/千tokens	意图理解、相似问题扩展：输入：0.007 输出：0.027
			NL2SQL生成：输入：0.002 输出：0.006
效果测评	通过效果评测模块对AI搜索开放平台提供的RAG开发链路进行效果测评，从用户提出问题开始，到RAG系统召回内容，再到LLM生成回答的整个流程进行综合评测。	元/千tokens	输入：0.04 输出：0.12

模型定制

模型名称

说明

价格

向量降维模型定制训练

向量降维模型定制训练支持结合用户提供的向量数据，定制向量降维模型。实际业务场景中，先通过向量化模型对文本或者Query向量化，然后结合向量降维模型进一步降低向量维度。

按照实际消耗的计算资源CU数计费，每CU价格为3.87元。

实际消耗的CU数取决于训练的数据量和维度，按照最小化训练10万条1024维数据，需消耗约250个CU，产生费用为250*3.87=967.5元。

模型部署

计费公式为：CU单价*机型消耗的CU数量*购买机器台数

具体计费规则如下表所示：

机型	CU单价（元/小时）	单台机器消耗CU数量	单台机器单价（元/小时）
gpu.v100.16g.x1	1.07	30.14	32.25
gpu.t4.16g.x1		16.07	17.195
gpu.a10.24g.x1		11.01	11.781

例如某用户购买2台gpu.a10.24g.x1部署模型服务，计费为：1.07*11.01*2=23.56元/小时。

服务开发

实例启动后按照机型、消耗的CU数以及使用时长按量计费，计费公式为：CU单价*机型消耗的CU数量*购买机器台数。

具体计费规则如下表所示：

机型	CU单价（元/小时）	单台机器消耗CU数量	单台机器单价（元/小时）
gpu.t4.16g.x1	1.07	16.07	17.195
ops.basic1.gi.large	1.07	0.61	0.65

例如某用户的实例中选择1台ops.basic1.gi.large，计费为：1.07*0.61*1=0.65元/小时。

注意事项

服务名称与服务ID以及服务的API参数一一对应，详情请参见服务概览。
计费账单按照调用服务请求的实际使用量推送，每小时生成一个计费账单。
涉及阶梯计费的服务，系统按照阶梯推送账单。
部分服务以千tokens作为计费单位，统计用量时可能出现小数。
请确保阿里云账号处于未欠费状态，避免影响搜索服务的正常使用。

计费示例

假设某用户调用了1000个单位的文档切片服务，产生的费用如下：

500个单位（含500）的费用：0.005元*500=2.5元
500个单位以上的费用：0.00002元*500=0.01元
总费用：2.5+0.01=2.51元

计费方式和计费项

计费项