常规数据表

本文用于介绍表格问答表格数据导入与管理功能使用方法。

概述

数据问答能力是系统算法运用“给定表格”的基础上形成的,数据表管理则是用于“给定表格”。在表格数据管理中,集合了有关表格数据的新增、编辑、删除与更新等功能,以方便高效地管理相关表格数据。

功能入口

进入有关机器人空间后,选择表格管理>数据表管理后,选择常规数据表,即可进入表格数据管理界面。具体如下图所示:

image

常规数据表

添加数据表

重要
  • 产品功能上,支持新增单个表格最大100列,1万行,大小为50M。批量表格上传最大数量为20个,大小为400M。

  • 购买智能对话机器人(通义版)的版本不同,具有的配额资源不同,如企业版(通义版)导入表格数量上限为50个,具体有关版本资源的详情可参考《产品计费》。

绑定已有数据表

绑定已有数据表是指将业务空间下的表格数据绑定在机器人上。

  1. 单击绑定已有数据按钮;

  2. 在弹窗中选中需绑定的表格,单击确定按钮完成表格绑定。具体操作如下图所示:

image

新建数据表

本地Excel表格文件上传
  1. 进入常规数据表页面后,点击新建数据表按钮;

  2. 在新建数据表窗口选择数据来源为Excel表格

  3. 根据实际业务需求,填写数据表名称并点击上传本地文件导入Excel表格文件;

image

从MySQL数据库导入
  1. 进入常规数据表页面后,点击新建数据表按钮;

  2. 在新建数据表窗口选择数据来源为数据库>MySQL

  3. 根据实际业务需求,填写数据表名称、更新时间列信息,选择数据源和物理表等:

  • 数据源:即在表格管理>数据源管理中创建的数据源,当前数据源类型仅支持为MySQL数据库。

  • 物理表:即数据库下的具体表格。

  • 更新时间列:即数据库的物理表中关于数据更新时间的列。

说明
  • “更新时间列”用于系统实时检测有关数据是否有更新,若对查询的数据实时性要求较高,建议表中含有最后更新时间列,并在“选择更新时间列”下拉框中选中该列名称,方便系统及时读取最新数据。

  • 当物理表中有“更新时间列”,若数据库中更新时间列中的数据有更新,系统自动同步更新元数据。

imageimage

编辑数据表

重要
  • 当前仅支持对有关表格中表头字段的编辑配置,不支持在控制台中直接编辑表格中具体单元格中的数值。

  • 从本地上传的表格和从编辑从数据库导入的表格编辑界面略有差异,但表头字段的编辑操作一致,此处以从编辑本地上传的表格为例进行介绍。

  1. 完成表格新增后,点击编辑按钮后,选择字段配置标签即可进入有关表头编辑界面;

说明
  • 问答配置包括反问顺序环境参数的配置,用于表格的回复与识别效果干预,具体含义和配置可参考《数据问答干预》。

  • 表头表值干预包括表头同义词表值同义词环境参数配置,用于表头的识别效果干预,具体作用与配置请参考《数据问答干预》。

imageimage

  1. 根据实际业务需求,编辑有关表头字段:

    1. 编辑字段:包括表头字段的英文名、中文名、字段类型/输出格式、字段描述、近似查询、误差范围。

      • 字段英文名:若数据源为数据库,即数据库中的字段名称;若数据源为表格文件,系统根据表格中字段中文名称自动翻译的英文名称。

      • 字段中文名:是对字段所表示的含义进行解释,将直接影响召回信息,对问答效果有影响,建议根据字段含义认真填写。

      • 字段类型/输出格式:字段在机器人回复答案中的输出格式。当前支持的字段类型有:

        • 数字范围型格式:第一个数字必须小于第二个数字,必须为数字或者小数,不支持千分位数字;示例[10000, 20000]。

        • 数字数组型格式:必须为数字或者小数,不支持千分位数字;示例[3000, 10000, 20000]。

        • 日期范围型格式:第一个日期必须小于第二个日期,日期格式为"yyyy-MM-dd HH:mm:ss"、"yyyy-MM-dd"、"yyyy/MM/dd"、"yyyy年MM月dd日",对同一个字段,两种格式不能同时存在;示例:["2023-11-01 00:00:00", "2023-11-11 00:00:00"]。

        • 日期数组型格式:日期格式为"yyyy-MM-dd HH:mm:ss"、"yyyy-MM-dd"、"yyyy/MM/dd"、"yyyy年MM月dd日",对同一个字段,两种格式不能同时存在;示例["2023-11-01", "2023-11-11", "2023-10-22"]。

        • 文本数组型格式:所有元素必须为文本,并使用双引号括起来;示例["性能卓越", "稳定可靠", "即开即用","弹性扩展"]。

      • 字段描述:是对表头字段所表示的含义、用途注意事项等内容进行解释,该项对问答有影响,建议认真填写。

      • 关联字段:支持通过外键关联其他表,即一个问题通过多个数据表来查询,数据可存储在不同的数据表中,通过字段的关联关系实现跨数据表的查询,例如:查询学生A的学号(基本信息表)和保险号(保险表)。

      • 全文索引:启用索引后,用户输入的问题会与字段内容对比,查询出相关的内容。

        image

  1. 删除表头:即删除有关列;

  2. 表头表值干预:对指定表头的识别能力的干预,针对所选表头生效。包括:表头同义词、表值同义词和环境参数,有关具体介绍可参考《数据问答干预》。

image

更新表格

更新从本地上传的数据表

进入有关表格更新界面后,点击更新数据按钮后,上传待更新表格即可。

重要

上传更新数据表格时,系统会校验当前上传表格的第一个sheet名称和产品页面上的数据表名称是否一致,如不同则无法上传。

image

image

更新从数据库导入的数据表
  • 字段同步

当数据库中新增或删除有关列的字段后,通过同步字段功能,系统会自动检测数据库中的字段变更内容,并可根据实际业务需求选择是否对有关元数据做字段变更同步。具体操作如下:

  1. 选择表格管理>数据表管理后,单击编辑按钮,进入有关表格编辑界面;

image

  1. 单击同步字段按钮后,根据实际业务需求确认同步字段的变更。

imageimage

  • 增量数据更新

当绑定的数据库中的有关数据表有变化更新时,通过配置“更新时间列”,系统快速自动同步更新有关数据。具体配置步骤如下:

  1. 数据库中有关物理表配置“更新时间列”,当有关行数据变更时,在此列中进行变更时间记录;

    说明

    此步骤需要用户在自己的数据库中的物理表中进行配置操作。

  2. 进入有关表格编辑界面,绑定有关更新时间列。

image

  • 全量数据更新

全量数据更新是指全量读取配置的数据库表,可通过全量同步功能完成。具体操作如下:选择表格管理>数据表管理,单击有关数据表右侧全量同步按钮并确定即可。

重要

全量同步适用于数据库内容进行了大量更新的场景,所需时间较长,对资源消耗也较大,建议必要时才使用。

image

表格生效状态管理

  • 失效:表示数据表不参与问答,有关失效状态如下图所示:

image

  • 生效:表示数据表可以参与问答,有关生效状态如下图所示:

image