您可以通过服务广场查阅AI搜索开放平台提供的各类服务的详情。
操作步骤
登录AI搜索开放平台控制台。
选择上海地域,切换到AI搜索开放平台。
目前仅支持在上海开通AI搜索开放平台功能。
支持杭州、深圳、北京、张家口、青岛地域的用户,通过VPC地址跨地域调用AI搜索开放平台的服务。
在左侧导航栏选择服务广场。
服务类别
服务说明
服务类别
服务说明
文档内容解析
文档内容解析服务:通用文档解析服务,支持从非结构化文档(文本、表格、图片等)中提取标题、分段等逻辑层级结构,以结构化格式输出。
图片内容解析
图片内容理解服务:基于多模态大模型对图片内容进行解析理解以及文字识别,解析后的文本可用于图片检索、问答场景。
图片文本识别服务:OCR图片文本识别,识别后的文本可用于图片检索问答场景。
文档切片
文档切片服务:提供通用文本切片服务,支持基于文档段落、文本语义、指定规则,对HTML、Markdown、TXT格式的结构化数据进行拆分,同时支持以富文本形式提取文档中的代码、图片以及表格。
文本向量化
OpenSearch文本向量化服务-001:提供多语言(40+)文本向量化服务,输入文本最大长度300 token,输出向量维度1536维。
OpenSearch通用文本向量化服务-002:提供多语言(100+)文本向量化服务,输入文本最大长度8192 token,输出向量维度1024维。
OpenSearch文本向量化服务-中文-001:提供中文文本向量化服务,输入文本最大长度1024 token,输出向量维度768维。
OpenSearch文本向量化服务-英文-001:提供英文文本向量化服务,输入文本最大长度512 token,输出向量维度768维。
文本稀疏向量化
提供将文本数据转化为稀疏向量形式表达的服务,稀疏向量存储空间更小,常用于表达关键词和词频信息,可与稠密向量搭配进行混合检索,提升检索效果。
OpenSearch文本稀疏向量化服务:提供多语言(100+)文本向量化服务,输入文本最大长度8192 token。
向量微调
向量微调embedding-tuning:提供向量模型调优服务,可通过定制训练向量降维等模型,在不带来过多检索效果损失的情况下,辅助将高维度向量降低维度,以便提升性价比。
查询分析
提供Query内容分析服务,基于大语言模型及NLP能力,可对用户输入的查询内容进行意图识别、相似问题扩展、NL2SQL处理等,有效提升RAG场景中检索问答效果。
查询分析服务001:通用Query分析服务,基于大语言模型对用户输入Query进行意图理解以及相似问题扩展。
排序服务
BGE重排模型:提供基于BGE模型的文档打分服务,可根据Query与文档内容的相关性,按分数由高到低对DOC进行排序,并输出对应的打分结果。支持中英双语,最大输入token长度512(Query+Doc长度)。
OpenSearch自研重排模型:融合多行业数据集训练,提供高水准的重排服务,可根据Query及DOC的语义相关性从高到低对Doc进行排序。支持中英双语,最大输入token长度512(Query+doc长度)。
大模型
OpenSearch-通义千问-Turbo:以qwen-turbo大规模语言模型为模型底座,进行有监督的模型微调,强化检索增强,减少有害性。
通义千问-Turbo:通义千问系列速度最快、成本极低的模型,适合简单任务,详情请参见通义千问-Turbo。
通义千问-Plus:能力均衡,推理效果、成本和速度介于通义千问-Max和通义千问-Turbo之间,适合中等复杂任务,详情请参见通义千问-Plus。
通义千问-Max:通义千问系列效果最好的模型,适合复杂、多步骤的任务,详情请参见通义千问-Max。
DeepSeek-R1:专注于复杂推理任务的大语言模型,在复杂指令理解、结果准确性等方面表现较突出。
DeepSeek-V3:MoE模型,在长文本、代码、数学、百科、中文能力上表现优秀。
DeepSeek-R1-distill-qwen-7b:基于知识蒸馏技术,通过使用DeepSeek-R1生成的训练样本对Qwen-7B微调训练的模型。
DeepSeek-R1-distill-qwen-14b:基于知识蒸馏技术,通过使用DeepSeek-R1生成的训练样本对Qwen-14B微调训练的模型。
选择服务卡片左下角查看详情,查看当前服务的服务名称、服务ID、服务简介以及收费方式。
选择服务卡片右上角体验,可跳转至体验中心,对服务进行测试和效果预览,详情请参见体验中心。
- 本页导读 (1)
- 操作步骤