计费方式和计费项

通过阅读本文,您可以快速了解AI搜索开放平台的计费项组成、计费方式、计费规则信息。

计费项

AI搜索开放平台涉及以下计费项:

  • 模型调用:调用模型(如文档内容解析服务、文本向量化服务、排序服务等)服务产生的费用。

  • 模型定制:用户结合自有数据对AI搜索开放平台提供的模型进行模型定制(如向量降维服务定制训练)产生的费用。

  • 服务部署:将不同渠道的模型独立部署至AI搜索开放平台所产生的部署和调用费用。

  • 服务开发:AI搜索开放平台集成PAI DSW功能,开发者可以在平台内通过Notebook完成服务开发与执行。

说明

AI搜索开放平台可免费开通,不使用不计费。

计费方式

  • 按量付费

    除搜索引擎服务外,AI搜索开放平台均采用按量付费模式(服务部署与服务开发同时支持购买计算资源包抵扣),按照服务调用量与模型定制训练实际消耗的计算时(CU)计费。每小时生成一个计费账单,所有的分时账单归属于一个订单,并按照生成订单时的账单从阿里云账号扣费。

    重要

    2024-07-04 17:00起,部分服务采用阶梯计费,具体请参见以下计费规则文档。

  • 计算资源包

    购买计算资源包,可用于抵扣服务部署服务开发所消耗的CU资源(购买成功后自动抵扣)。不同容量的资源包对应着不同的折扣,用户可通过预付费购买包含一定计算资源的套餐,以更低价格获取计算资源。

计费规则

模型调用

在大语言模型中,Token是模型处理和理解文本的最小单位。通常表示单词、字词、字符或符号等文本片段,不同模型可能有自己的切分方法,字符数目和Token数目不一定一一对应。

AI搜索开放平台模型调用涉及的Token计费单位为元/千tokens,部分服务采用阶梯计费,部分服务按输入与输出token计费。

说明

部分模型支持Token计算预估调用产生的Token数。

上海

模型名称

模型ID

计费单位

0-500个单位定价

超出500个单位定价

文档内容解析

ops-document-analyze-001

元/千tokens

0.005

0.002

元/张图片

0.006

元/个表格

0.012

文档内容解析-基于语义理解的文档层级结构提取

说明

调用文档内容解析服务时通过参数控制是否启用基于语义理解的文档层级结构提取功能,启用后,除产生文档解析费用以外,该功能按照0.002元/千tokens计费。

元/千tokens

0.002

图片文本识别

ops-image-analyze-ocr-001

元/次

0.08

0.02

图片内容理解

ops-image-analyze-vlm-001

元/千tokens

0.02

文档切片

ops-document-split-001

元/千tokens

0.005

0.00002

文本向量

ops-text-embedding-001

元/千tokens

0.005

0.0001

ops-text-embedding-002

0.005

0.0005

ops-text-embedding-zh-001

0.005

0.00005

ops-text-embedding-en-001

0.005

0.00005

ops-gte-sentence-embedding-multilingual-base

0.005

0.0002

ops-qwen3-embedding-0.6b

0.005

0.0005

多模态向量

用于文本和图片向量化

ops-m2-encoder

文本向量化

元/千tokens

0.005

0.0002

ops-m2-encoder

图片向量化

元/张图片

0.005

0.0001

ops-m2-encoder-large

文本向量化

元/千tokens

0.005

0.0005

ops-m2-encoder-large

图片向量化

元/张图片

0.005

0.0002

ops-gme-qwen2-vl-2b-instruct

文本向量化

元/千tokens

0.005

0.0006

ops-gme-qwen2-vl-2b-instruct

图片向量化

元/张图片

0.005

0.0005

文本稀疏向量

ops-text-sparse-embedding-001

元/千tokens

0.006

0.0006

向量降维服务

ops-embedding-dim-reduction-001

元/个docs

0.005

0.00005

排序服务

ops-bge-reranker-larger

元/个docs

0.001

0.00003

ops-text-reranker-001

0.001

0.00015

ops-qwen3-reranker-0.6b

0.001

0.0001

视频截帧

ops-video-snapshot-001

元/千张

0.1

语音识别

ops-audio-asr-001

元/小时

0.57

搜索引擎

阿里云Elasticsearch:基于开源Elasticsearch构建的全托管云服务,100%兼容开源功能的同时,支持开箱即用、按需付费,详情请参见阿里云ES

OpenSearch-向量检索版:计费详情请参见向量检索版

大语言模型(LLM)

qwen3-235b-a22b

元/千tokens

输入:0.004

输出:0.04

qwq-32b

输入:0.002

输出:0.006

ops-qwen-turbo

输入:0.0004

输出:0.0007

qwen-turbo

输入:0.0003

输出:0.0006

qwen-plus

输入:0.0008

输出:0.002

qwen-max

输入:0.0024

输出:0.0096

deepseek-r1

输入:0.004

输出:0.016

deepseek-r1-distill-qwen-7b

输入:0.0005

输出:0.001

deepseek-r1-distill-qwen-14b

输入:0.001

输出:0.003

deepseek-v3

输入:0.002

输出:0.008

联网搜索

  • 联网搜索费用为:调用次数费用+Query改写费用

    联网搜索时默认使用qwen-max模型进行Query改写。
  • 使用方式:支持通过以下两种方式使用联网搜索:

    • 直接调用联网搜索API

    • 使用LLM模型时可启用联网搜索。

元/次

0.0048

元/千tokens

Query改写:

输入:0.0024

输出:0.0096

查询分析

ops-query-analyze-001

元/千tokens

意图理解、相似问题扩展:

  • 输入:0.007

  • 输出:0.027

NL2SQL生成:

  • 输入:0.002

  • 输出:0.006

效果测评

通过效果评测模块对AI搜索开放平台提供的RAG开发链路进行效果测评,从用户提出问题开始,到RAG系统召回内容,再到LLM生成回答的整个流程进行综合评测。

元/千tokens

输入:0.04

输出:0.12

德国(法兰克福)

模型名称

模型ID

计费单位

0-500个单位定价

超出500个单位定价

文档内容解析

ops-document-analyze-001

元/千tokens

0.0065

0.00195

元/张图片

0.005

元/个表格

0.0113

文档内容解析-基于语义理解的文档层级结构提取

说明

调用文档内容解析服务时通过参数控制是否启用基于语义理解的文档层级结构提取功能,启用后,除产生文档解析费用以外,该功能按照0.0037元/千tokens计费。

元/千tokens

0.0037

图片文本识别

ops-image-analyze-ocr-001

元/次

0.086

0.0223

图片内容理解

ops-image-analyze-vlm-001

元/千tokens

0.079

文档切片

ops-document-split-001

元/千tokens

0.0065

0.000022

文本向量

ops-text-embedding-001

元/千tokens

0.0065

0.000517

ops-text-embedding-002

0.0065

0.00039

ops-gte-sentence-embedding-multilingual-base

0.0065

0.00022

多模态向量

ops-gme-qwen2-vl-2b-instruct

文本向量化

元/千tokens

0.0065

0.0012

ops-gme-qwen2-vl-2b-instruct

图片向量化

元/张图片

0.0065

0.001

文本稀疏向量

ops-text-sparse-embedding-001

元/千tokens

0.007

0.0029

排序服务

ops-bge-reranker-larger

元/个docs

0.0036

0.00035

ops-text-reranker-001

0.0036

0.0012

视频截帧

ops-video-snapshot-001

元/千张

0.2

语音识别

ops-audio-asr-001

元/小时

1.44

搜索引擎

阿里云Elasticsearch:基于开源Elasticsearch构建的全托管云服务,100%兼容开源功能的同时,支持开箱即用、按需付费,详情请参见阿里云ES

OpenSearch-向量检索版:计费详情请参见向量检索版

大语言模型(LLM)

qwen3-235b-a22b

元/千tokens

输入:0.005

输出:0.02

qwen-turbo

输入:0.00036

输出:0.0014

qwen-plus

输入:0.0029

输出:0.0086

qwen-max

输入:0.012

输出:0.046

查询分析

ops-query-analyze-001

元/千tokens

意图理解、相似问题扩展:

  • 输入:0.029

  • 输出:0.13

模型定制

模型名称

说明

价格

向量降维模型定制训练

向量降维模型定制训练支持结合用户提供的向量数据,定制向量降维模型。实际业务场景中,先通过向量化模型对文本或者Query向量化,然后结合向量降维模型进一步降低向量维度。

重要

当前仅上海地域支持模型定制。

按照实际消耗的计算资源CU数计费,每CU价格为3.87元。

实际消耗的CU数取决于训练的数据量和维度,按照最小化训练10万条1024维数据,需消耗约250CU,产生费用为250*3.87=967.5元。

服务部署

重要

当前仅上海地域支持服务部署。

  • 按量付费:

    计费公式为:CU单价*机型消耗的CU数量*购买机器台数

    具体计费规则如下表所示:

    机型

    CU单价(元/小时)

    单台机器消耗CU数量

    单台机器单价(元/小时)

    gpu.v100.16g.x1

    1.07

    30.14

    32.25

    gpu.t4.16g.x1

    16.07

    17.195

    gpu.a10.24g.x1

    11.01

    11.781

    例如某用户购买2gpu.a10.24g.x1部署模型服务,计费为:1.07*11.01*2=23.56元/小时。

  • 资源包抵扣:

    购买计算资源包成功后,会自动抵扣服务部署产生的CU资源。

    计算资源包规格(万CU)

    CU单价(元)

    原价(元)

    折扣

    现售价(元)

    1

    1.07

    10700

    100%

    10700

    10

    107000

    90%

    96300

    25

    267500

    85%

    227375

    70

    749000

    80%

    599200

    例如某用户成功购买了1CU的计算资源包,配置1gpu.a10.24g.x1部署模型服务,可用时长为:10000/11.01(该机型单台机器消耗CU数量)=908.26小时。

服务开发

重要

当前仅上海地域支持服务开发。

  • 按量付费:

    实例启动后按照机型、消耗的CU数以及使用时长按量计费,计费公式为:CU单价*机型消耗的CU数量*购买机器台数。

    具体计费规则如下表所示:

    机型

    CU单价(元/小时)

    单台机器消耗CU数量

    单台机器单价(元/小时)

    gpu.t4.16g.x1

    1.07

    16.07

    17.195

    ops.basic1.gi.large

    0.61

    0.65

    例如某用户的实例中选择1ops.basic1.gi.large,计费为:1.07*0.61*1=0.65元/小时。

  • 资源包抵扣:

    购买计算资源包成功后,会自动抵扣服务开发产生的CU资源。

注意事项

  • 服务名称与服务ID以及服务的API参数一一对应,详情请参见服务概览

  • 计费账单按照调用服务请求的实际使用量推送,每小时生成一个计费账单。

  • 涉及阶梯计费的服务,系统按照阶梯推送账单。

  • 部分服务以千tokens作为计费单位,统计用量时可能出现小数。

  • 请确保阿里云账号处于未欠费状态,避免影响搜索服务的正常使用。

计费示例

假设某用户调用了1000个单位的文档切片服务,产生的费用如下:

  • 500个单位(含500)的费用:0.005元*500=2.5

  • 500个单位以上的费用:0.00002元*500=0.01

  • 总费用:2.5+0.01=2.51

相关文档

查看消费明细