文档

知识管理和检索增强

更新时间:

通义灵码提供了基于企业私域数据检索增强的能力,在开发者使用通义灵码 IDE 插件时,可以结合企业上传的文档、文件等内容作为上下文进行回答,使得通义灵码生成的回答更加贴合企业特点。

通义灵码管理员可以在通义灵码管理控制台中进行知识文件添加或删除、开启或关闭检索增强功能。

image

研发智能问答的检索增强

上传文档

管理员可在通义灵码管理控制台,单击侧边导航知识管理,单击添加数据按钮,即刻进入添加数据页面。选择数据类型为文档,单击或拖拽文件到上传区域(灰色区域)即可上传知识库文档。

上传和文件格式要求:

  • 一次最多上传10个文件;

  • 文件格式支持:pdf、docx、txt、markdown;

  • 单个文件大小不超过 5MB;

  • 文件名称不得超过 200 个字符,文件编码仅支持utf-8、gbk编码;

  • 推荐使用有层级的结构化文档,避免检索信息内容的缺失;

image

上传完成后,单击确认添加即可成功添加,相关文档会进入数据处理流程。

开启或关闭智能问答的检索增强

image

在知识管理-文档分类下,如果有文件的数据处理完成,即可开启智能问答的检索增强的开关。开启后,已授权的开发者在 IDE 客户端中使用通义灵码智能问答的功能时,将结合上传的数据进行回答。反之,如需关闭检索增强可关闭开关。

image

查看文档的数据处理进展

文档上传后,系统将进行数据的向量化持久化处理,以将文档处理成可以供用户检索增强的格式,可在文档列表中查看数据处理的进展。文档处理的状态分别为:

  • 等待处理:系统将有序对上传的文件进行处理,未开始处理的进入排队状态;

  • 处理中:正在对文件进行分析和向量化处理;

  • 已完成:该文档已完成分析并向量持久化;

  • 异常:文档处理出现异常,聚焦在状态标记上可查看原因,此时可结合不同的情况进行重新处理或删除异常文件;

  • 重复文件:文件内容重复,不进行重复处理,可删除重复文件;

更新文档

如果文档有更新,可直接通过添加数据的操作上传新的文档,上传后将进行重新处理。

删除文档

处理异常的文档、重复文档、或不再需要的文档,可单击删除操作进行单个文档的删除。如需批量删除,可在文档列表中勾选后进行批量删除。

  • 本页导读