企业知识库管理

知识库用于配置企业内知识和用词偏好,配置后,模型会学习该知识并将其用于数据获取和分析。本文为您介绍如何进行知识库配置。

操作入口

您可以按照图示方式进入企业知识库管理界面。

image

支持对业务逻辑正则匹配数据集选择规则进行配置。

业务逻辑

企业知识库管理界面,单击业务逻辑并进行以下配置。

添加业务逻辑

image

  1. 企业知识库管理-业务逻辑界面右上角单击添加业务逻辑

  2. 添加业务定义数据解释同义词,并设置生效范围应用方式

    • 业务定义:定义企业内通用概念(如“销售进展”),最多 100 字符。常用词汇可填写在此。

    • 数据解释:详细说明该业务定义,关联数据指标,帮助模型理解,最多 300 字符。

    • 同义词:用于定义该业务的在企业内的不同叫法,以便模型识别不同的问法。

    • 生效范围,支持选择企业内全部数据仅对部分数据生效。当用户在生效的数据范围内进行提问,模型将在推理时引用该条知识。

      说明

      请在添加知识时确认好生效范围,保存后不支持修改。

      • 企业内全部数据:对企业内所有问数资源生效。

      • 仅对部分数据生效:选择部分问数资源生效,支持搜索问数资源名称。

        image

    • 应用方式中选择是否开启强制改写

      说明

      开启强制改写后,用户提问中匹配到业务定义同义词时,将会被改写为数据解释中的内容,请谨慎开启。

  3. 单击保存

    若您想继续添加,可单击保存并继续添加

批量导入

  1. 单击批量导入,进入批量导入业务逻辑界面。

    image

  2. 单击企业知识库-业务逻辑模板可将模板下载到本地,供您参考。

    image

  3. 点击或拖拽文件进行上传。image

    说明

    仅支持 .xls .xlsx .csv 类型文件,大小限制为5M以内。

  4. 上传文件后单击确定

    image

  5. 上传成功后,您可以看到对应的知识库。

正则匹配

企业知识库管理界面,单击正则匹配并进行以下配置。

添加正则匹配

image

  1. 企业知识库管理-正则匹配界面右上角单击添加正则匹配

  2. 添加业务定义正则表达式数据解释,并设置生效范围应用方式

    • 业务定义:标识正则表达式的名称,不参与问题匹配,最多 100 字符。

    • 正则表达式:用于识别用户问题,依据【应用方式】要求执行操作,请使用 Python 风格编写,最多100字符。

      您可以输入待匹配文本,进行测试,并获得匹配结果

    • 数据解释:对该业务定义进行详细说明,关联数据指标,帮助模型识别和理解,最多 300 字符。

    • 生效范围,支持选择企业内全部数据仅对部分数据生效。当用户在生效的数据范围内进行提问,模型将在推理时引用该条知识。

      说明

      请在添加知识时确认好生效范围,保存后不支持修改。

      • 企业内全部数据:对企业内所有问数资源生效。

      • 仅对部分数据生效:选择部分问数资源生效,支持搜索问数资源名称。

    • 应用方式中选择是否开启强制改写

      说明

      开启强制改写后,用户提问中匹配到业务定义时,将会被改写为数据解释中的内容,请谨慎开启。

  3. 单击保存

    若您想继续添加,可单击保存并继续添加

批量导入

  1. 单击批量导入,进入批量导入正则表达式界面。

    image

  2. 单击企业知识库-正则表达式模板可将模板下载到本地,供您参考。

    image

  3. 点击或拖拽文件进行上传。image

    说明

    仅支持 .xls .xlsx .csv 类型文件,大小限制为5M以内。

  4. 上传文件后单击确定

    image

  5. 上传成功后,您可以看到对应的知识库。

数据集选择

企业知识库管理界面,单击数据集选择并进行以下配置。

添加数据集选择

image

  1. 企业知识库管理-数据集选择界面右上角单击添加数据集选择规则

  2. 添加业务定义数据集选择同义词

    • 业务定义:定义匹配用户问题的关键词,命中时指定数据集,最多 100 字符。

    • 数据集选择:关联该业务及同义词的回答数据集,最多 10 个。

    • 同义词:定义该业务的不同叫法,便于模型识别不同问法。

  3. 单击保存

    若您想继续添加,可单击保存并继续添加

批量导入

  1. 单击批量导入,进入批量导入数据集范围界面。

    image

  2. 单击企业知识库-数据集范围模板可将模板下载到本地,供您参考。

    image

  3. 点击或拖拽文件进行上传。image

    说明

    仅支持 .xls .xlsx .csv 类型文件,大小限制为5M以内。

  4. 上传文件后单击确定

    image

  5. 上传成功后,您可以看到对应的知识库。

知识库管理

启用/禁用

您可以在启用栏查看知识的启用状态。

image

  • 当启用栏对应的知识图标为image时,表示该知识为启用状态,您可以单击该图标进行禁用。

  • 当启用栏对应的知识图标为image时,表示该知识为禁用状态,您可以单击该图标进行启用。

编辑

单击目标知识右边的image图标,可编辑对应知识。image

删除

单击目标知识右边image的图标,可删除对应知识。

image

知识库配置建议

  1. 对于业务定义及同义词:

    1. 避免定义过于简短的常用词,如“看一下”“最近”“生成”“对比”“分布”“趋势”等 。

    2. 避免定义BI领域常用定义,比如“时间”最大”“预览”“数据”“柱状图”等。

  2. 对于数据解释:

    1. 建议使用描述清晰、语义明确的表述,如以下对应。

      1. “业务定义:攻坚时期” -“数据解释:20203月到20213月”。

      2. “业务定义:业务进展” - “数据解释:月销售额和客户数”。

    2. 避免使用模糊的时间范围说明,如“次年”“x月底”等。

  3. 知识库暂不进行模糊识别与推理,提问内容中须提到业务定义或近义词,才可生效。