知识库用于配置企业内知识和用词偏好,配置后,模型会学习该知识并将其用于数据获取和分析。本文为您介绍如何进行知识库配置。
操作入口
您可以按照图示方式进入问数知识管理界面。

支持对业务逻辑、正则匹配、数据集选择、智能选表规则进行配置。
业务逻辑
在问数知识管理界面,单击业务逻辑并进行以下配置。
添加业务逻辑

在问数知识管理-业务逻辑界面右上角单击添加业务逻辑。
添加业务定义、数据解释和同义词,并设置生效范围和应用方式。
业务定义:定义企业内通用概念(如“销售进展”),最多 100 字符。常用词汇可填写在此。
数据解释:详细说明该业务定义,关联数据指标,帮助模型理解,最多 300 字符。
同义词:用于定义该业务的在企业内的不同叫法,以便模型识别不同的问法。
生效范围,支持选择企业内全部数据或仅对部分数据生效。当用户在生效的数据范围内进行提问,模型将在推理时引用该条知识。
企业内全部数据:对企业内所有问数资源生效。
仅对部分数据生效:选择部分问数资源生效,支持搜索问数资源名称。

在应用方式中选择是否开启强制改写。
说明开启强制改写后,用户提问中匹配到业务定义及同义词时,将会被改写为数据解释中的内容,请谨慎开启。
单击保存。
若您想继续添加,可单击保存并继续添加。
批量导入
单击批量导入,进入批量导入业务逻辑界面。

单击企业知识库-业务逻辑模板可将模板下载到本地,供您参考。

点击或拖拽文件进行上传。
说明仅支持 .xls .xlsx .csv 类型文件,大小限制为5M以内。
上传文件后单击确定。

上传成功后,您可以看到对应的知识库。
批量导出
单击
图标,可批量导出全部业务逻辑。

正则匹配
在问数知识管理界面,单击正则匹配并进行以下配置。
添加正则匹配

在问数知识管理-正则匹配界面右上角单击添加正则匹配。
添加业务定义、正则表达式和数据解释,并设置生效范围和应用方式。
业务定义:标识正则表达式的名称,不参与问题匹配,最多 100 字符。
正则表达式:用于识别用户问题,依据【应用方式】要求执行操作,请使用 Python 风格编写,最多100字符。
您可以输入待匹配文本,进行测试,并获得匹配结果。
数据解释:对该业务定义进行详细说明,关联数据指标,帮助模型识别和理解,最多 300 字符。
生效范围,支持选择企业内全部数据或仅对部分数据生效。当用户在生效的数据范围内进行提问,模型将在推理时引用该条知识。
企业内全部数据:对企业内所有问数资源生效。
仅对部分数据生效:选择部分问数资源生效,支持搜索问数资源名称。
在应用方式中选择是否开启强制改写。
说明开启强制改写后,用户提问中匹配到业务定义时,将会被改写为数据解释中的内容,请谨慎开启。
单击保存。
若您想继续添加,可单击保存并继续添加。
批量导入
单击批量导入,进入批量导入正则表达式界面。

单击企业知识库-正则表达式模板可将模板下载到本地,供您参考。

点击或拖拽文件进行上传。
说明仅支持 .xls .xlsx .csv 类型文件,大小限制为5M以内。
上传文件后单击确定。

上传成功后,您可以看到对应的知识库。
批量导出
单击
图标,可批量导出全部正则匹配规则。

数据集选择
在问数知识管理界面,单击数据集选择并进行以下配置。
添加数据集选择

在问数知识管理-数据集选择界面右上角单击添加数据集选择规则。
添加业务定义、数据集选择和同义词。
业务定义:定义匹配用户问题的关键词,命中时指定数据集,最多 100 字符。
数据集选择:关联该业务及同义词的回答数据集,最多 10 个。
同义词:定义该业务的不同叫法,便于模型识别不同问法。
单击保存。
若您想继续添加,可单击保存并继续添加。
批量导入
单击批量导入,进入批量导入数据集范围界面。

单击企业知识库-数据集范围模板可将模板下载到本地,供您参考。

点击或拖拽文件进行上传。
说明仅支持 .xls .xlsx .csv 类型文件,大小限制为5M以内。
上传文件后单击确定。

上传成功后,您可以看到对应的知识库。
若数据集选择规则难以覆盖复杂问题,您可以使用智能选表作为补充。
批量导出
单击
图标,可批量导出全部数据集选择规则。

智能选表
当数据集选择规则无法明确命中数据集时,可通过智能判断,由大模型根据问题语义选择合适的数据集。
添加智能选表Prompt

在问数知识管理-智能选表界面右上角单击添加智能选表Prompt。
设置生效范围。
全部可问数据选数据集:全部数据集应用此Prompt。
分析主题选数据集:支持选择要应用此Prompt的分析主题。

设置Prompt。
可以参考以下内容设置智能选表Prompt:
• 业务口径与术语解释(行业黑话/别名/默认口径)。
• 表的业务定位说明(每张表代表的事实、粒度、时点/期间、与其他表关系)。
• 典型问题的选表约束(哪些问题必须用哪类表/允许组合/禁止混用)。
单击仅保存或保存并启用。
仅保存:保存当前智能选表Prompt。
保存并启用:保存并启用智能选表Prompt。启用后,您也可以在状态栏进行关闭。

知识库管理
启用/禁用
您可以在启用栏查看知识的启用状态。

当启用栏对应的知识图标为
时,表示该知识为启用状态,您可以单击该图标进行禁用。当启用栏对应的知识图标为
时,表示该知识为禁用状态,您可以单击该图标进行启用。
编辑
单击目标知识右边的
图标,可编辑对应知识。
删除
单击目标知识右边
的图标,可删除对应知识。

知识库配置建议
对于业务定义及同义词:
避免定义过于简短的常用词,如“看一下”“最近”“生成”“对比”“分布”“趋势”等 。
避免定义BI领域常用定义,比如“时间”“最大”“预览”“数据”“柱状图”等。
对于数据解释:
建议使用描述清晰、语义明确的表述,如以下对应。
“业务定义:攻坚时期” -“数据解释:2020年3月到2021年3月”。
“业务定义:业务进展” - “数据解释:月销售额和客户数”。
避免使用模糊的时间范围说明,如“次年”“x月底”等。
知识库暂不进行模糊识别与推理,提问内容中须提到业务定义或近义词,才可生效。











