通过阅读本文,您可以快速了解AI搜索开放平台的付费方式、计费组成、定价等主要计费信息。
计费方式
除搜索引擎服务外,AI搜索开放平台提供的服务均采用按量付费模式,按照服务实际调用与消耗计费。每小时生成一个计费账单,所有的分时账单归属于一个订单,并按照生成订单时的账单从阿里云账号扣费。
首次开通AI搜索开放平台,按照云账号赠送100次的服务免费调用额度,免费额度不含搜索引擎服务。
自2024-07-04 17:00起,部分服务采用阶梯计费,具体计费规则参见以下计费项。
计费项
除搜索引擎外的服务
阶梯计费
计费项 | 说明 | 价格 |
文档内容解析 | ops-document-analyze-001:支持从非结构化文档(不含表格/图片等)中提取标题、分段等逻辑层级结构,以结构化格式输出。 | 按照文档解析内容计费:
|
文档切片 | ops-document-split-001:支持基于文档段落、文本语义、指定规则,对HTML、Markdown、txt格式的结构化文档进行拆分,同时支持以富文本形式提取文档中的代码、图片以及表格。 | 按照文档切片的token数计费:
|
文本向量化 (包含文档向量化和用户Query向量化) | ops-text-embedding-001:提供多语言(40+)文本向量化服务,输入文本最大长度300,输出向量维度1536维。 | 按照文档切片的token数计费:
|
ops-text-embedding-002:提供多语言(100+)文本向量化服务,输入文本最大长度8192,输出向量维度1024维。 | 按照文档向量化和用户Query向量化的token数计费:
| |
ops-text-embedding-zh-001:提供中文文本向量化服务,输入文本最大长度1024,输出向量维度768维。 | 按照文档向量化和用户Query向量化的token数计费:
| |
ops-text-embedding-en-001:提供英文文本向量化服务,输入文本最大长度512,输出向量维度768维。 | 按照文档向量化和用户Query向量化的token数计费:
| |
文本稀疏向量化 | ops-text-sparse-embedding-001:提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间较小,常用于表达关键词和词频信息,可与稠密向量搭配进行混合检索,提升最终检索效果。 | 按照文档向量化和用户Query向量化的token数计费:
|
排序服务 | ops-bge-reranker-larger:提供基于BGE模型的文档打分服务,可根据query与文档内容的相关性,按分数由高到低对doc进行排序,并输出对应的打分结果。 支持中英双语,最大输入token长度512(Query+doc长度)。 | 按照参与排序的文档数量计费:0.00003元 / 个docs
|
ops-text-reranker-001:OpenSearch自研重排模型,融合多行业数据集训练,提供高水准的重排服务,可根据Query及doc的语义相关性从高到低对doc进行排序。 支持中英双语,最大输入token长度512(Query+doc长度)。 | 按照参与排序的文档数量计费:0.00015元 / 个docs
| |
图片文本识别 | ops-image-analyze-ocr-001:可基于OCR能力对图片文字进行识别,将文字信息提取出来,用于图片检索及问答等场景。 | 按照调用次数计费:
|
非阶梯计费
计费项 | 说明 | 价格 |
文档内容解析 | ops-document-analyze-001:支持从非结构化文档(文档内容为表格、图片等)中提取标题、分段等逻辑层级结构,以结构化格式输出。 | 按照文档解析内容计费:
|
大模型 | ops-qwen-turbo:以qwen-turbo大规模语言模型为模型底座,进行有监督的模型微调,强化检索增强,减少有害性。 | 按照输入(input)和输出(output)的token数计费:
|
qwen-turbo:通义千问超大规模语言模型,支持中文、英文等不同语言输入,详情请参见通义千问大语言模型介绍。 | ||
qwen-plus:通义千问超大规模语言模型的增强版,支持中文、英文等不同语言输入,详情请参见通义千问大语言模型介绍。 | 按照输入(input)和输出(output)的token数量计费:
| |
qwen-max:通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入,详情请参见通义千问大语言模型介绍。 | 按照输入(input)和输出(output)的token数量计费:
| |
qwen-max-longcontext:通义千问千亿级别超大规模语言模型,支持中文、英文等不同语言输入。模型支持30k tokens上下文,API限定用户输入为28k tokens,详情请参见通义千问大语言模型介绍。 | ||
图片内容理解解析 | ops-image-analyze-vlm-001:基于多模态大模型对图片内容进行解析理解以及文字识别,解析后的文本可用于图片检索、问答场景。 | 按照输出的token数量计费:0.02元 / 千tokens |
查询分析 | ops-query-analyze-001:基于大语言模型对用户输入的Query进行意图理解,以及相似问题扩展。 | 按照输入(input)和输出(output)的token数量计费:
|
ops-query-analyze-001:基于大语言模型对用户输入的Query进行NL2SQL处理。 |
| |
效果测评 | 通过效果评测模块对AI搜索开放平台提供的RAG开发链路进行效果测评,从用户提出问题开始,到RAG系统召回内容,再到LLM生成回答的整个流程进行综合评测。 | 按照输入(input)和输出(output)的token数量计费:
|
搜索引擎服务
计费项 | 说明 | 价格 |
搜索引擎 | 提供向量检索、文本检索引擎,可进行向量&文本内容存储、构建索引、以及在线向量&文本检索,开通引擎服务后,可与AI搜索开放平台丰富的API服务组合使用。
|
注意事项
服务名称与服务ID以及服务的API参数一一对应,详情请参见服务概览。
计费账单按照调用服务请求的实际使用量推送,每小时生成一个计费账单。
涉及阶梯计费的服务,系统按照阶梯推送账单。
计费规则以本文计费项为准,除部分文档内容解析服务按照解析图片、表格数量计费,排序服务按照文档数量计费以外,其他服务均以千token作为计费单位,统计用量时可能出现小数。
请确保阿里云账号处于未欠费状态,避免影响搜索服务的正常使用。
计费示例
假设某用户调用了1000个单位的文档切片服务,产生的费用如下:
500个单位(含500)的费用:0.005元*500=2.5元
500个单位以上的费用:0.00002元*500=0.01元
总费用:2.5+0.01=2.51元