知识上传格式规范

知识库的知识上传格式规范

文档内容格式建议

为了尽可能提升知识库的使用效果,建议您按照规范格式上传知识文档,以保证文档解析效果:

  1. 文档没有大面积水印(水印可能被识别为文本,覆盖内容的水印还可能影响内容文本解析)

  2. 全篇层级清晰,各层级标题序号统一规范(否则可能导致文档层级解析错误)

  3. 列表项下不再嵌套子列表(否则可能导致文档层级解析错误)

  4. 对于相对独立的不同内容,尽量使用多个独立文档而不是单个汇总文档(否则若文档不规范则可能导致内容混淆)

不规范文档问题示例

文档包含水印

image.png

如图所示,水印可能被识别为文本,覆盖内容的水印还可能影响内容文本解析。

标题序号不规范

image.png

如图所示,二级标题的序号不规范,可能导致文档层级解析错误,建议将“例1:”、“例2:”修改为“1. ”、“2. ”或“1.1.”、“1.2.”等。

列表项下有子列表

image.png

如图所示,第一个列表项下又嵌套了一个子列表,这可能导致第一个列表项被当成二级标题,从而导致之后的所有内容都被当成该二级标题下的内容。建议不要在列表项下再嵌套子列表,如有必要,请在最后一个列表项下嵌套子列表,以减少层级解析错误的影响。

多条独立内容使用一个汇总文档

image.png

如图所示,由于商品A和商品B的内容标题并没有规范序号,可能导致商品B的内容都可能被识别为商品A下的内容,从而导致商品A和商品B的内容信息混淆。