本文介绍如何使用自然语言描述生成SQL查询语句(NL2SQL)。
前提条件
已登录DataV-Note智能分析平台。
已进入项目编辑器页面。
AI助手介绍
在每个 SQL单元中,嵌入了一个随时可唤醒的 AI 助手。该助手支持多轮对话,以更好地理解和满足用户的需求。当用户首次进行查询时,AI 助手通过分析提出的问题,从用户选择的数据集中挑选出合适的表来生成 SQL 语句。
在选表的过程中,考虑了表信息的完备性以及其他多种因素,以确保高准确性。如果生成的 SQL 语句并非用户期望的结果,用户可以继续提出问题,AI 助手会对 SQL 进行修改和优化。同时,用户可以通过点击“中断上下文记忆”按钮来清除会话历史,这意味着 AI 助手将忘记之前的交互,使得下一次提问会开启一个全新的对话环境。
AI助手支持的操作
每个由AI生成的SQL语句,都可以通过右上角的三个按钮“添加到当前单元”、“拷贝当前代码”、“插入到新单元”进行相应操作。
选择CSV文件
在左侧目录树单击图标,进入元数据页签。
单击右上角的导入,打开上传文件窗口。
拖拽文件到虚线框或浏览本地文件后,单击打开。
说明文件名称不能重复。
文件格式为
.CSV
格式。文件大小不能超过500MB。
为了确保生成的SQL准确无误,请确认上传的CSV文件包含正确的表头。数据源中的表名称、注释、列名称和注释必须完整准确,并且文件编码应为 UTF-8。
创建SQL查询,将CSV文件加载到项目结果数据集中:
对结果创建新的SQL查询
在新创建的SQL单元中使用AI助手生成SQL
选择数据库中的表
创建SQL查询单元
选择数据集
AI助手使用
每个SQL单元里都有一个AI助手,可随时唤醒,支持进行多轮对话。
第一次会话时,AI助手会根据用户问题从用户选择的数据集中选择适当的表来生成SQL语句。选表的准确性受到表信息的完备性,以及问题等多种因素影响。
如果生成的SQL不正确,可继续提问对SQL进行修正
点击“中断上下文记忆”按钮后,将遗忘会话历史。下次提问时,将开启新的对话。
执行SQL
如果一个单元格里有多条SQL,只运行最后一条SQL。
多轮对话修正SQL
如果生成的SQL不正确,可通过多轮对话,将SQL和错误信息提供给AI助手,让AI助手重新生成SQL。
示例:分析'双十一购物节'活动效果数据
1. 数据准备
创建一份示例数据源。
2. 表信息介绍
创建的示例电商数据表包含以下字段信息。
activity_info | 活动信息表 |
activity_rule | 活动规则表 |
activity_sku | 活动商品关联表 |
base_attr_info | 平台属性表 |
base_attr_value | 平台属性值表 |
base_category1 | 一级品类 |
base_category2 | 二级品类 |
base_category3 | 三级品类 |
base_dic | 字典表 |
base_province | 省份表 |
base_region | 地区表 |
base_trademark | 品牌表 |
cart_info | 购物车表 |
comment_info | 评价表 |
coupon_info | 优惠券信息表 |
coupon_range | 优惠券优惠范围表 |
coupon_use | 优惠券领用表 |
favor_info | 收藏表 |
order_detail | 订单明细表 |
order_detail_activity | 订单明细活动关联表 |
order_detail_coupon | 订单明细优惠券关联表 |
order_info | 订单表 |
order_refund_info | 退单表 |
order_status_log | 订单状态流水表 |
payment_info | 支付表 |
refund_payment | 退款表 |
sku_attr_value | SKU平台属性表 |
sku_info | SKU信息表 |
sku_sale_attr_value | SKU销售属性表 |
spu_info | 商品信息表 |
spu_sale_attr | 商品销售属性表 |
spu_sale_attr_value | 商品销售属性值表 |
user_address | 用户地址表 |
user_info | 用户信息表 |
3. 分析主题
要评估哪种类型的活动更能吸引消费者参与,我们需要先定义“参与度”和选择适合的数据来分析。通常,可以通过以下几个指标来评估活动的吸引力:
订单数量:活动期间产生的订单数量。
用户数量:参与活动的独立用户数量。
客单价(每个顾客平均订单金额):这可以帮助我们理解顾客在活动中的消费水平。