OpenSearch LLM智能问答版内置非结构化数据处理、向量模型、文本&向量检索、LLM,提供一站式开箱即用的检索增强生成(RAG)方案,支持丰富数据格式的快速导入,构建包含对话、链接、图片在内的多模态对话式搜索服务,帮助开发者快速搭建RAG系统。
产品简介
LLM智能问答版面向行业搜索场景,提供企业专属问答搜索服务。基于内置的LLM大模型,一站式快速搭建问答搜索系统。 LLM智能问答版可以基于客户自身的业务数据,自动生成问答结果、参考图片、参考链接等内容,提供更智能、优质的问答搜索服务。
产品架构
产品功能
多模态RAG:支持图片内容理解,可通过OCR、LLM等构建多模态知识库,多样化输出返回结果。
RAG效果评测:支持全链路效果评测,对比不同模型、参数配置下的RAG效果,方便进行效果对比与选型。
丰富模型能力与定制化模型训练:内置丰富的向量、重排、大语言模型等,可基于业务数据训练专属大模型。
数据实时更新:支持实时构建增量向量索引,数据实时同步更新。
表格问答:支持基于NL2SQL的表格问答,通过企业结构化数据库实现对话式搜索问答。
零部署、全托管、免运维:全托管云上MaaS服务,无需进行任何部署和运维。
产品优势
一站式快速接入:内置全链路RAG流程,只需控制台上传业务数据即可分钟级构建RAG系统。
更优RAG效果:内置丰富的向量、重排、大语言模型等,模型能力多次登顶行业榜单,保障95%以上RAG准确率。
灵活调优方式:支持自定义Prompt、参数修改、搜索排序、定制化模型训练等多种效果调优方式,内置全链路RAG效果评估模型。
完善的相关功能:支持多模态内容理解、结构化数据与非结构化数据解析、多轮对话、流式输出、意图识别、Agent等完善的RAG相关功能。
便捷的接入方式:支持钉钉机器人、飞书等多种生态零代码快速接入,支持API/SDK等多样灵活的接入方式,可使用API-Key嵌入多种开源大模型应用开发框架。
企业级能力完善:支持企业级文档权限隔离,增量数据实时更新。
版本选择
OpenSearch-LLM智能问答版有两个版本选择:标准版与专业版,下表介绍了这两个版本的功能以及相互之间的差异。
对比项 | 标准版 | 专业版 |
定制模型训练 | 不支持。 | 支持基于自身业务数据进行SFT。 |
LLM选择 | 支持Qwen系列、开源模型、外部模型。 | 支持Qwen系列、开源模型、外部模型、定制模型。 |
使用限制 | 最高10QPS限流。 | 无限流,购买的GPU资源支持足够的推理请求即可。 |
计算资源计费 | 按照调用时消耗的计算资源按量付费。 | 按照购买的GPU规格计费,无需支持额外的计算资源费用。 |
适用场景 | 适用于通用智能客服、企业知识库、电商导购等场景。 | 适用于业务数据相对特殊,需要训练使用专属LLM的智能客服、企业知识库、电商导购等场景。 |
应用场景
智能客服:
在APP、小程序、网站中提供智能售前、售后客服,根据用户不同的输入,进行意图分类判断,并提供相应的支持解答。
支持基于人工干预的固定问答对。
支持图片、视频等多模态内容返回。
支持NL2SQL基于数据库查询用户订单、物流信息等。
企业知识库:
在企业内部门户网站、聊天软件中搭建企业知识库,为员工、用户提供知识支持、快捷导航入口等。
支持企业级文档权限隔离。
支持实时数据更新与索引构建。
支持多种非机构化数据解析理解。
电商导购:
在电商、零售类APP、网站中,在原有搜索框或导购客服中,增加智能导购能力,可结合用户对话信息,为用户智能推荐相关商品。
支持图片等多模态内容理解,可包含商品图片等信息。
支持返回商品搜索原始链接,快捷抵达目标商品。
支持基于运营需求调整商品搜索排序。
内容、社区总结:
在内容、社区类APP、网站中,基于内部内容数据,在原有搜索框基础上,增加智能总结能力,可针对用户对话信息,返回用网站内容总结生成的攻略、参考等。
支持网页、网站内容快速导入。
支持基于OCR、大模型等理解图片等多模态内容。
支持返回原始文档参考链接。
表格问答:
针对工商、金融等多行业场景下的结构化数据信息,基于NL2SQL能力快速进行相关内容的搜索,并通过LLM快速总结、返回相关信息。
支持自定义表结构。
支持MaxCompute数据源数据自动同步。
支持基于NL2SQL的信息提取、总结、聚合。