什么是LLM智能问答版

OpenSearch LLM智能问答版内置非结构化数据处理、向量模型、文本&向量检索、LLM,提供一站式开箱即用的检索增强生成(RAG)方案,支持丰富数据格式的快速导入,构建包含对话、链接、图片在内的多模态对话式搜索服务,帮助开发者快速搭建RAG系统。

产品简介

LLM智能问答版面向行业搜索场景,提供企业专属问答搜索服务。基于内置的LLM大模型,一站式快速搭建问答搜索系统。 LLM智能问答版可以基于客户自身的业务数据,自动生成问答结果、参考图片、参考链接等内容,提供更智能、优质的问答搜索服务。

快速接入教程

产品架构

什么是LLM智能问答版-流程图

产品功能

  • 多模态RAG:支持图片内容理解,可通过OCR、LLM等构建多模态知识库,多样化输出返回结果。

  • RAG效果评测:支持全链路效果评测,对比不同模型、参数配置下的RAG效果,方便进行效果对比与选型。

  • 丰富模型能力与定制化模型训练:内置丰富的向量、重排、大语言模型等,可基于业务数据训练专属大模型。

  • 数据实时更新:支持实时构建增量向量索引,数据实时同步更新。

  • 表格问答:支持基于NL2SQL的表格问答,通过企业结构化数据库实现对话式搜索问答。

  • 零部署、全托管、免运维:全托管云上MaaS服务,无需进行任何部署和运维。

产品优势

  • 一站式快速接入:内置全链路RAG流程,只需控制台上传业务数据即可分钟级构建RAG系统。

  • 更优RAG效果:内置丰富的向量、重排、大语言模型等,模型能力多次登顶行业榜单,保障95%以上RAG准确率。

  • 灵活调优方式:支持自定义Prompt、参数修改、搜索排序、定制化模型训练等多种效果调优方式,内置全链路RAG效果评估模型。

  • 完善的相关功能:支持多模态内容理解、结构化数据与非结构化数据解析、多轮对话、流式输出、意图识别、Agent等完善的RAG相关功能。

  • 便捷的接入方式:支持钉钉机器人、飞书等多种生态零代码快速接入,支持API/SDK等多样灵活的接入方式,可使用API-Key嵌入多种开源大模型应用开发框架。

  • 企业级能力完善:支持企业级文档权限隔离,增量数据实时更新。

版本选择

OpenSearch-LLM智能问答版有两个版本选择:标准版与专业版,下表介绍了这两个版本的功能以及相互之间的差异。

对比项

标准版

专业版

定制模型训练

不支持。

支持基于自身业务数据进行SFT。

LLM选择

支持Qwen系列、开源模型、外部模型。

支持Qwen系列、开源模型、外部模型、定制模型。

使用限制

最高10QPS限流。

无限流,购买的GPU资源支持足够的推理请求即可。

计算资源计费

按照调用时消耗的计算资源按量付费。

按照购买的GPU规格计费,无需支持额外的计算资源费用。

适用场景

适用于通用智能客服、企业知识库、电商导购等场景。

适用于业务数据相对特殊,需要训练使用专属LLM的智能客服、企业知识库、电商导购等场景。

应用场景

智能客服:

在APP、小程序、网站中提供智能售前、售后客服,根据用户不同的输入,进行意图分类判断,并提供相应的支持解答。

  • 支持基于人工干预的固定问答对。

  • 支持图片、视频等多模态内容返回。

  • 支持NL2SQL基于数据库查询用户订单、物流信息等。

企业知识库:

在企业内部门户网站、聊天软件中搭建企业知识库,为员工、用户提供知识支持、快捷导航入口等。

  • 支持企业级文档权限隔离。

  • 支持实时数据更新与索引构建。

  • 支持多种非机构化数据解析理解。

电商导购:

在电商、零售类APP、网站中,在原有搜索框或导购客服中,增加智能导购能力,可结合用户对话信息,为用户智能推荐相关商品。

  • 支持图片等多模态内容理解,可包含商品图片等信息。

  • 支持返回商品搜索原始链接,快捷抵达目标商品。

  • 支持基于运营需求调整商品搜索排序。

内容、社区总结:

在内容、社区类APP、网站中,基于内部内容数据,在原有搜索框基础上,增加智能总结能力,可针对用户对话信息,返回用网站内容总结生成的攻略、参考等。

  • 支持网页、网站内容快速导入。

  • 支持基于OCR、大模型等理解图片等多模态内容。

  • 支持返回原始文档参考链接。

表格问答:

针对工商、金融等多行业场景下的结构化数据信息,基于NL2SQL能力快速进行相关内容的搜索,并通过LLM快速总结、返回相关信息。

  • 支持自定义表结构。

  • 支持MaxCompute数据源数据自动同步。

  • 支持基于NL2SQL的信息提取、总结、聚合。