文档

如何使用AI辅助生成SQL语句进行分析

更新时间:

本文介绍如何使用自然语言描述生成SQL查询语句(NL2SQL)。

前提条件

  • 已登录DataV-Note智能分析平台。

  • 已进入项目编辑器页面。

AI助手介绍

在每个 SQL单元中,嵌入了一个随时可唤醒的 AI 助手。该助手支持多轮对话,以更好地理解和满足用户的需求。当用户首次进行查询时,AI 助手通过分析提出的问题,从用户选择的数据集中挑选出合适的表来生成 SQL 语句。

说明

在选表的过程中,考虑了表信息的完备性以及其他多种因素,以确保高准确性。如果生成的 SQL 语句并非用户期望的结果,用户可以继续提出问题,AI 助手会对 SQL 进行修改和优化。同时,用户可以通过点击“中断上下文记忆”按钮来清除会话历史,这意味着 AI 助手将忘记之前的交互,使得下一次提问会开启一个全新的对话环境。image

AI助手支持的操作

每个由AI生成的SQL语句,都可以通过右上角的三个按钮“添加到当前单元”、“拷贝当前代码”、“插入到新单元”进行相应操作。

image.png

选择CSV文件

  1. 在左侧目录树单击image图标,进入元数据页签。

  2. 单击右上角的导入,打开上传文件窗口。image

  3. 拖拽文件到虚线框或浏览本地文件后,单击打开

    说明
    • 文件名称不能重复。

    • 文件格式为.CSV格式。

    • 文件大小不能超过500MB。

    • 为了确保生成的SQL准确无误,请确认上传的CSV文件包含正确的表头。数据源中的表名称、注释、列名称和注释必须完整准确,并且文件编码应为 UTF-8。

  4. 创建SQL查询,将CSV文件加载到项目结果数据集中:

image.jpeg

  1. 对结果创建新的SQL查询

image.jpeg

  1. 在新创建的SQL单元中使用AI助手生成SQL

image.jpeg

选择数据库中的表

  1. 创建SQL查询单元

image.png

  1. 选择数据集

image.png

AI助手使用

    说明
    • 每个SQL单元里都有一个AI助手,可随时唤醒,支持进行多轮对话。

    • 第一次会话时,AI助手会根据用户问题从用户选择的数据集中选择适当的表来生成SQL语句。选表的准确性受到表信息的完备性,以及问题等多种因素影响。

    • 如果生成的SQL不正确,可继续提问对SQL进行修正

    • 点击“中断上下文记忆”按钮后,将遗忘会话历史。下次提问时,将开启新的对话。

执行SQL

如果一个单元格里有多条SQL,只运行最后一条SQL。

image.png

多轮对话修正SQL

如果生成的SQL不正确,可通过多轮对话,将SQL和错误信息提供给AI助手,让AI助手重新生成SQL。

image.png

示例:分析'双十一购物节'活动效果数据

1. 数据准备

创建一份示例数据源。

2. 表信息介绍

创建的示例电商数据表包含以下字段信息。

activity_info

活动信息表

activity_rule

活动规则表

activity_sku

活动商品关联表

base_attr_info

平台属性表

base_attr_value

平台属性值表

base_category1

一级品类

base_category2

二级品类

base_category3

三级品类

base_dic

字典表

base_province

省份表

base_region

地区表

base_trademark

品牌表

cart_info

购物车表

comment_info

评价表

coupon_info

优惠券信息表

coupon_range

优惠券优惠范围表

coupon_use

优惠券领用表

favor_info

收藏表

order_detail

订单明细表

order_detail_activity

订单明细活动关联表

order_detail_coupon

订单明细优惠券关联表

order_info

订单表

order_refund_info

退单表

order_status_log

订单状态流水表

payment_info

支付表

refund_payment

退款表

sku_attr_value

SKU平台属性表

sku_info

SKU信息表

sku_sale_attr_value

SKU销售属性表

spu_info

商品信息表

spu_sale_attr

商品销售属性表

spu_sale_attr_value

商品销售属性值表

user_address

用户地址表

user_info

用户信息表

3. 分析主题

要评估哪种类型的活动更能吸引消费者参与,我们需要先定义“参与度”和选择适合的数据来分析。通常,可以通过以下几个指标来评估活动的吸引力:

  1. 订单数量:活动期间产生的订单数量。

  2. 用户数量:参与活动的独立用户数量。

  3. 客单价(每个顾客平均订单金额):这可以帮助我们理解顾客在活动中的消费水平。

4. 生成SQL

问题一:'双十一购物节'活动产生的订单数有多少?

image.png

问题二:'双十一购物节'参与活动的独立用户数量有多少?

image.png

问题三:'双十一购物节'活动期间每个顾客平均订单金额是多少?

image.png

image.png