本文将介绍如何通过OpenSearch-LLM智能问答版控制台上传数据,快速实现企业知识库问答。
创建实例
您首先需要创建一个OpenSearch-LLM智能问答版实例,请参考:创建LLM智能问答版实例。
企业知识库配置
要实现企业知识库问答您首先需要上传企业相关知识。在操作栏下单击管理按钮,可以查看实例详情。选择配置中心->数据配置开始进行企业知识库配置。您可以根据实际需求选择导入文件、网页链接或是网站网址,具体介绍请参考:数据配置。
-
文件导入
单击文件导入按钮,单击“+”上传本地文件,然后单击上传文件按钮,即可完成文件导入。
支持上传 doc、docx、pdf、html、txt、ppt 等格式的非结构化文件,也支持上传 JSON、EXCEL(编码为 UTF-8)等结构化数据文件。
-
网页链接导入
单击网页链接导入按钮,选择网页导入并输入网址链接,每个网址各占一行,然后点击导入按钮,即可完成网页导入。
-
网站导入
-
单击网页链接导入按钮,选择网站导入,单击新建任务,输入网站链接以及category类目名称,可根据需求设置URL过滤、Xpath选择器及CSS选择器。
-
运行完成后可查看网页爬取条数,单击确定按钮即可完成网站导入。
说明可使用示例网站链接进行测试:https://help.aliyun.com/zh/open-search/product-overview
-
导入企业知识库数据后,您可以在数据配置界面的数据查询栏下查看导入的文档,此时您就成功构建了一个企业专属知识库。
此时页面左上角的文档总数(如23)即表示已成功导入的文档条数。
效果测试
单击左侧导航栏中的问答测试,可以快速对这个知识库进行问答效果测试。在对话框中输入企业相关问题,模型就会在知识库中匹配到相关信息,然后根据知识库中的信息生成对应回答。
测试界面分为左侧对话区和右侧参数配置面板。对话区展示用户提问与模型生成的回答及橙色参考链接;右侧面板可配置模型选择(如 opensearch-qwen)、多轮对话开关、流式输出开关,以及 Prompt参数(attitude、rule、noanswer、language、role 等)、文档召回参数、Query改写参数等标签页。
您还可以针对具体场景和期望效果设置相应参数,请参考:问答测试。
总结
至此,您已经通过控制台实现企业知识库问答,后续只要将OpenSearch相应的接口接入到业务中,就可以支持企业知识库问答。通过构建不同类型的知识库、还能够支持智能文档、电商导购、教育问答等多种多样的场景。
-
您可以使用公开数据集进行测试,具体请参考:测试数据集。
-
了解更多LLM智能问答版内容,可参考:https://www.aliyun.com/activity/bigdata/opensearch/llmsearch
-
如有其它关于RAG系统或数据构建的相关问题,欢迎加入OpenSearch-LLM智能问答版钉钉支持群,了解更多技术细节和使用详情。