数据问答功能概述

概念说明

数据问答,是指根据给定的表格数据,针对表格相关内容的查询推理等问题,提供对应智能问答能力。从技术层面上看,表格问答是基于自然语言处理(NLP)技术,把用户的问句话术转换成SQL语句,去执行对有关表格数据的查询推理,并基于此对用户问句进行回复。具体如下图所示:

image.png

功能适用场景

数据问答功能适合有较多业务表格数据,且用户咨询问题通过表格可获取到对应答案的场景。具体如下表所示:

有表格用数据问答

属性查询、复杂推理用数据问答

对接数据库用数据问答

  • 有现成业务表格的

  • 有类表格数据能简单转换成表格的

  • 经过简单梳理形成表格的

  • 需要单/多实例,单/多属性查询能力的

  • 需要最值、比较、分组排序等推理计算能力的

  • 超大规模表格数据量(百万级)

  • 表格数据需要经常更新

  • 在上述场景中,您仅需导入表格即可自动应答。通过优化问答设置,可进一步提升效果。

具体功能说明

具体的,数据问答支持如下核心能力:

能力

解释

示例问题

单/多列查询

SELECT多column

列出油耗大于8但是功率低于200的名称和价格

聚合函数查询

SELECT子句支持选择不同的聚合函数,包括:COUNT、SUM、AVG、MAX、MIN等

金奖的获奖记录是什么,获奖时间的最晚值是多少

值比较条件

WHERE子句支持等于、大于、小于、不等于运算符

学位为学士,审查通过人数大于20小于30的招考人数是多少

多条件并存

WHERE子句支持多个条件以AND或OR的形式组合查询

长江流域和珠江流域的水库库容总量是多少?

自动补充列名

查询列名=值的情况下,用户可以省略列名

计算机或者成绩优秀的同学有哪些?学号是多少?

泛化能力

对于列名的询问不要求完全匹配表格中的列名

油耗低于5的suv有哪些?

TOP N

排名最好或最差的N个排名

2023年销售最好的10个省份

环比

当前周期与上一个周期的数据变化情况

经销商"毛龙"今年第一季度的销售总额环比增长了多少

同比

当前周期相对于历史同一时间段的数据变化情况

经销商"毛龙"今年第一季度的销售总额同比增长了多少