文档

OpenSearch产品选型

更新时间:

场景与优势

产品版本

目标场景

版本优势

搜索开发工作台

  • 客服问答、电商导购、内容答疑 等RAG检索增强生成场景

  • 电商、内容、医疗、游戏等智能检索场景

搜索开发工作台将各项服务能力组件化,串联业务专属RAG链路。您可以选择服务中不同的模型或策略,同时也可结合业务情况进行部分能力的替换。

  • 文档解析服务:可针对通用场景,如书籍、论文等复杂场景进行文本解析。

  • 文本切片服务:可基于文档段落、语义及指定规则,对Html, MarkDown, Txt格式的结构化数据进行拆分,同时支持富文本形式提取Code、Image、Table。

  • 文本向量模型+文本稀疏向量模型组成混合检索方案:混合检索Embedding模型荣获C-MTEB榜单第一。

  • 内置SFT大模型及通义千问系列多款大模型:支持多种通义千问系列不同参数量大模型,可在RAG链路中将检索系统返回的段落组成prompt,直接调用大模型得到答案,SFT后的大模型回答幻觉率下降20%。

LLM智能问答版

智能客服、企业知识库、内容、电商、教育等对话式搜索场景

  • 企业专属问答搜索:基于业务数据生成问答结果,更加安全、稳定。

  • 内置LLM模型:无需额外访问LLM模型,内置搜索、问答全链路服务。

  • 丰富的NLP模型:内置文档切片、文本向量化、图片向量化等丰富的NLP算法模型。

  • 多模态搜索:支持文本、链接、图片等多模态问答结果展示,满足个性化问答搜索需求。

  • 一站式快速接入:只需导入业务数据,即可一站式快速构建企业专属问答搜索服务

  • 零部署、全托管、免运维:全托管服务,无需部署运维,更低开发、运维成本。

行业算法版

对搜索效果有更高的要求,可快速一站式搭建行业智能搜索系统,需要行业最佳实践行业查询分析算法、行业排序模型、定制调优模型的企业及开发者建议接入此类型;目前重点覆盖行业:电商零售、游戏、内容社区、教育

  • 内含电商、内容、游戏等行业智能搜索算法模型,提供行业搜索最佳实践

  • 根据业务需求及特点,可轻量化定制专属分词、NLP算法模型

  • 提供下拉提示、热搜、底纹丰富的搜索引导服务,并支持人工干预运营

  • 开箱即用,无需运维,可一键式完成行业智能搜索全链路配置

高性能检索版

有订单、优惠券、物流、保单等高性能大数据检索场景需求,需低成本一站式快速搭建搜索系统的企业及开发者,可接入此类型

  • 基于自研搜索引擎实现千亿数据毫秒级响应,提供订单、物流、保单等场景检索方案

  • 支持RDS、MaxCompute、PolarDB阿里云系统一键对接、支持API/SDK接入自建数据库

  • 提供多种查询方式,支持组合查询,含强大的全文检索、前后中缀模糊查询

  • 支持一键扩缩容,无需担心底层集群,无运维成本,可灵活应对业务场景

向量检索版

有图片/文本检索、音视频检索、NLP、问答、推荐、风险监测等场景在线向量检索诉求,同时对性能、效果、稳定性比较关注的企业及开发者,可接入此类型

  • 向量检索场景深度优化,支持图搜、音视频搜索、个性化搜推、问答等场景

  • 最低规格即可支持10亿128维向量,或千级别QPS毫秒级查询响应

  • 内置多种向量检索算法,支持主键检索、向量检索、基于命名空间的向量检索

  • 采用高可用工程架构,数据可水平拓展,保障数据实时性、高并发检索可靠性

召回引擎版

大规模文本召回检索场景,同时有高性能低成本诉求,需支持灵活定制搜索服务的企业及开发者,可接入此类型

  • 内置灵活的索引策略及搜索策略,支持海量大数据高性能检索场景

  • 扩展支撑千亿级数据规模,查询毫秒级响应,数据毫秒级更新

  • 内置多种向量检索算法,支持标签、文本倒排索引与向量索引混合检索

  • 支持丰富的SQL自定义函数、引擎插件、算法模型,可以灵活定制业务处理逻辑

  • 可使用标准化SQL开发语言和IDE,降低引擎学习和开发成本

功能对比

功能/产品版本

行业算法版

高性能检索版

召回引擎版

向量检索版

LLM智能问答版

数据源

RDS/MaxCompute/PolarDB/API

RDS/MaxCompute/PolarDB/API

OSS/MaxCompute/API

OSS/MaxCompute/API

MaxCompute/API

表结构

多表离线left join

多表在线join(独享存储-集群)

多表在线join

多表独立查询

内置固定表结构/自定义表结构多表离线join

数据更新

API/SDK更新,和订阅DTS自动同步更新

API/SDK更新,或订阅DTS自动同步更新

API/SDK更新

API/SDK更新

API/SDK更新

数据备份

应用无数据源时,支持继承线上应用数据

不支持

API数据源,支持从历史索引恢复数据

API数据源,支持从历史索引恢复数据

不支持

索引类型

文本、向量

文本

文本、向量

向量

文本、向量

分析器

行业分析器、多语言分析器、通用分析器、轻量化定制分析器

多语言分析器、通用分析器

行业分析器、多语言分析器、通用分析器

主键、向量索引

文本、向量分析器

分词干预

支持

支持

支持

不支持

不支持

查询语义理解

停用词、拼写纠错、词权重、同义词、实体识别、定制化查询分析

不支持

不支持

不支持

不支持

排序方式

排序表达式、排序插件(cava脚本)、排序算法(CTR模型、类目预测)

排序表达式、排序插件(cava脚本)

排序表达式

按向量相似度得分排序

排序表达式

搜索引导:下拉提示、热搜底纹

支持

不支持

不支持

不支持

不支持

SQL语法

不支持

支持(独享存储-集群)

支持

不支持

不支持

A/B Test

支持

不支持

不支持

不支持

不支持

业务报表

支持

支持

不支持

不支持

不支持

监控报警

支持

支持

支持

支持

不支持

慢查询优化

支持

支持

不支持

不支持

不支持

自动化程度

免运维

免运维

根据系统提供的监控指标自助运维

根据系统提供的监控指标自助运维

免运维

各区域支持情况

区域

行业算法版

高性能检索版

向量检索版

召回引擎版

LLM智能问答版

搜索开发工作台

华东1(杭州)

华东2(上海)

华北1(青岛)

华北2(北京)

华北3(张家口)

华南1(深圳)

中国(香港)

新加坡

德国(法兰克福)

美国(弗吉尼亚)

说明
  • OpenSearch版本规格已迭代升级,原标准版已升级为高性能检索版,原高级版已升级为行业算法版;

  • OpenSearch开源兼容版暂不支持新用户创建使用。