文档

计费方式和计费项

更新时间:

通过阅读本文,您可以快速了解AI搜索开放平台的付费方式、计费组成、定价等主要计费信息。

计费方式

除搜索引擎服务外,AI搜索开放平台提供的服务均采用按量付费模式,按照服务实际调用与消耗计费。每小时生成一个计费账单,所有的分时账单归属于一个订单,并按照生成订单时的账单从阿里云账号扣费。

重要
  • 首次开通AI搜索开放平台,按照云账号赠送100次的服务免费调用额度,免费额度不含搜索引擎服务。

  • 自2024-07-04 17:00起,部分服务采用阶梯计费,具体计费规则参见以下计费项。

计费项

除搜索引擎外的服务

阶梯计费

计费项

说明

价格

文档内容解析

ops-document-analyze-001:支持从非结构化文档(不含表格/图片等)中提取标题、分段等逻辑层级结构,以结构化格式输出。

按照文档解析内容计费:

  • (0, 500个单位]:0.005元/千tokens

  • 500个单位以上:0.002元 / 千tokens

文档切片

ops-document-split-001:支持基于文档段落、文本语义、指定规则,对HTML、Markdown、txt格式的结构化文档进行拆分,同时支持以富文本形式提取文档中的代码、图片以及表格。

按照文档切片的token数计费:

  • (0, 500个单位]:0.005元/千tokens

  • 500个单位以上:0.00002元 / 千tokens

文本向量化

(包含文档向量化和用户Query向量化)

ops-text-embedding-001:提供多语言(40+)文本向量化服务,输入文本最大长度300,输出向量维度1536维。

按照文档切片的token数计费:

  • (0, 500个单位]:0.005元/千tokens

  • 500个单位以上:0.0001元 / 千tokens

ops-text-embedding-002:提供多语言(100+)文本向量化服务,输入文本最大长度8192,输出向量维度1024维。

按照文档向量化和用户Query向量化的token数计费:

  • (0, 500个单位]:0.005元/千tokens

  • 500个单位以上:0.0005元 / 千tokens

ops-text-embedding-zh-001:提供中文文本向量化服务,输入文本最大长度1024,输出向量维度768维。

按照文档向量化和用户Query向量化的token数计费:

  • (0, 500个单位]:0.005元/千tokens

  • 500个单位以上:0.00005元 / 千tokens

ops-text-embedding-en-001:提供英文文本向量化服务,输入文本最大长度512,输出向量维度768维。

按照文档向量化和用户Query向量化的token数计费:

  • (0, 500个单位]:0.005元/千tokens

  • 500个单位以上:0.00005元 / 千tokens

文本稀疏向量化

ops-text-sparse-embedding-001:提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间较小,常用于表达关键词和词频信息,可与稠密向量搭配进行混合检索,提升最终检索效果。

按照文档向量化和用户Query向量化的token数计费:

  • (0, 500个单位]:0.006元/千tokens

  • 500个单位以上:0.0006元 / 千tokens

排序服务

ops-bge-reranker-larger:提供基于BGE模型的文档打分服务,可根据query与文档内容的相关性,按分数由高到低对doc进行排序,并输出对应的打分结果。

支持中英双语,最大输入token长度512(Query+doc长度)。

按照参与排序的文档数量计费:0.00003元 / 个docs

  • (0, 500个单位]:0.001元/个docs

  • 500个单位以上:0.00003元 / 个docs

ops-text-reranker-001:OpenSearch自研重排模型,融合多行业数据集训练,提供高水准的重排服务,可根据Query及doc的语义相关性从高到低对doc进行排序。

支持中英双语,最大输入token长度512(Query+doc长度)。

按照参与排序的文档数量计费:0.00015元 / 个docs

  • (0, 500个单位]:0.001元/个docs

  • 500个单位以上:0.00015元 / 个docs

图片文本识别

ops-image-analyze-ocr-001:可基于OCR能力对图片文字进行识别,将文字信息提取出来,用于图片检索及问答等场景。

按照调用次数计费:

  • (0, 500个单位]:0.08元/次

  • 500个单位以上:0.02元 / 次

非阶梯计费

计费项

说明

价格

文档内容解析

ops-document-analyze-001:支持从非结构化文档(文档内容为表格、图片等)中提取标题、分段等逻辑层级结构,以结构化格式输出。

按照文档解析内容计费:

  • 0.006元 / 张图片

  • 0.012元 / 个表格

大模型

ops-qwen-turbo:以qwen-turbo大规模语言模型为模型底座,进行有监督的模型微调,强化检索增强,减少有害性。

按照输入(input)和输出(output)的token数计费:

  • 输入,针对用户向模型提交的请求数据进行计费:0.002元 / 千tokens

  • 输出,针对模型返回给用户的输出结果进行计费:0.006元 / 千tokens

qwen-turbo:通义千问超大规模语言模型,支持中文、英文等不同语言输入,详情请参见通义千问大语言模型介绍

qwen-plus:通义千问超大规模语言模型的增强版,支持中文、英文等不同语言输入,详情请参见通义千问大语言模型介绍

按照输入(input)和输出(output)的token数量计费:

  • 输入,针对用户向模型提交的请求数据进行计费:0.004元 / 千tokens

  • 输出,针对模型返回给用户的输出结果进行计费:0.012元 / 千tokens

qwen-max:通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入,详情请参见通义千问大语言模型介绍

按照输入(input)和输出(output)的token数量计费:

  • 输入,针对用户向模型提交的请求数据进行计费:0.04元 / 千tokens

  • 输出,针对模型返回给用户的输出结果进行计费:0.12元 / 千tokens

qwen-max-longcontext:通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。模型支持30k tokens上下文,API限定用户输入为28k tokens,详情请参见通义千问大语言模型介绍

图片内容理解解析

ops-image-analyze-vlm-001:基于多模态大模型对图片内容进行解析理解以及文字识别,解析后的文本可用于图片检索、问答场景。

按照输出的token数量计费:0.02元 / 千tokens

查询分析

ops-query-analyze-001:基于大语言模型对用户输入的Query进行意图理解,以及相似问题扩展。

按照输入(input)和输出(output)的token数量计费:

  • 输入,针对用户向模型提交的请求数据进行计费:0.04元 / 千tokens

  • 输出,针对模型返回给用户的输出结果进行计费:0.12元 / 千tokens

ops-query-analyze-001:基于大语言模型对用户输入的Query进行NL2SQL处理。

  • 输入,针对用户向模型提交的请求数据进行计费:0.013元 / 千tokens

  • 输出,针对模型返回给用户的输出结果进行计费:0.04元 / 千tokens

效果测评

通过效果评测模块对AI搜索开放平台提供的RAG开发链路进行效果测评,从用户提出问题开始,到RAG系统召回内容,再到LLM生成回答的整个流程进行综合评测。

按照输入(input)和输出(output)的token数量计费:

  • 输入,针对用户向模型提交的评测数据进行计费:0.04元 / 千tokens

  • 输出,针对模型返回给用户的输出结果进行计费:0.12元 / 千tokens

搜索引擎服务

计费项

说明

价格

搜索引擎

提供向量检索、文本检索引擎,可进行向量&文本内容存储、构建索引、以及在线向量&文本检索,开通引擎服务后,可与AI搜索开放平台丰富的API服务组合使用。

  • 阿里云Elasticsearch:基于开源Elasticsearch构建的全托管云服务,100%兼容开源功能的同时,支持开箱即用、按需付费。

    重要

    使用Elasticsearch 8.5及以上版本,可在RAG场景中进行向量检索。 8.15及以上版本,已集成AI搜索开放平台模型服务,可通过Inference API使用,详情请参见阿里云Elasticsearch Inference API介绍

  • OpenSearch-向量检索版:阿里巴巴自主研发的大规模分布式搜索引擎,支持了淘宝、天猫、菜鸟、优酷乃至海外电商在内整个集团的搜索业务。在满足业务高可用、高时效性、低成本的同时,提供一套自动化运维系统,用户可根据业务特点构建搜索服务。

注意事项

  • 服务名称与服务ID以及服务的API参数一一对应,详情请参见服务概览

  • 计费账单按照调用服务请求的实际使用量推送,每小时生成一个计费账单。

  • 涉及阶梯计费的服务,系统按照阶梯推送账单。

  • 计费规则以本文计费项为准,除部分文档内容解析服务按照解析图片、表格数量计费,排序服务按照文档数量计费以外,其他服务均以千token作为计费单位,统计用量时可能出现小数。

  • 请确保阿里云账号处于未欠费状态,避免影响搜索服务的正常使用。

计费示例

假设某用户调用了1000个单位的文档切片服务,产生的费用如下:

  • 500个单位(含500)的费用:0.005元*500=2.5元

  • 500个单位以上的费用:0.00002元*500=0.01元

  • 总费用:2.5+0.01=2.51元

相关文档

查看消费明细