ChatBI-通过自然语言生成SQL

更新时间:
复制为 MD 格式

本实验带您体验如何使用阿里云百炼析言GBI产品进行NL2SQL。

实验简介

析言GBI是一款基于AI原生的数据分析解决方案产品,通过自然语言交互实现NL2SQL、数据问答、分析、洞察等多维度的智能数据分析。支持多种数据源及Excel文件对接,提供阿里云上VPC访问方式,保障用户数据安全。

在本实验中,您将学习如何在阿里云百炼上使用析言GBI并构建一个可NL2SQL的智能数据分析应用。

实验室资源方式简介

进入实操前,请确保阿里云账号满足以下条件:

  • 个人账号资源

    • 使用您个人的云资源进行操作,资源归属于个人。

    • 所有实验操作将保留至您的账号,请谨慎操作。

    • 平台仅提供手册参考,不会对资源做任何操作。

    • 说明

      使用个人账户资源,在创建资源时,可能会产生一定的费用,请您及时关注相关云产品资源的计费概述。

  • 确保已完成云工开物300元代金券领取。

  • 已通过实名认证且账户余额≥0元。

  • 本实验费用以实际提问次数为准,析言GBI提供200次提问的免费额度,超出免费额度且要继续使用析言,需要付费购买。另外,若您在阿里云百炼调用模型来测试或者构建智能体消耗token,在免费额度之外,将产生费用。请在测试阿里云百炼模型能力前,先确认已领取云工开物300元代金券或有免费额度,以及关注您的token消耗情况。

  • 本实验产生的费用优先使用优惠券,优惠券使用完毕后需您自行承担。如果您调整了资源规格、使用时长,或执行了本方案以外的操作,可能导致费用发生变化,请以控制台显示的实际价格和最终账单为准。

  • 实操结束后,您可以选择继续付费保留资源,但这将导致持续产生费用,否则请根据实验手册释放资源。

  • 实操结束后,无需对阿里云百炼进行注销。

领取300元高校专属权益优惠券

在开始实验之前,请先点击右侧屏幕的“进入实操”再进行后续操作

image

本次实验需要您通过领取阿里云云工开物学生专属300元抵扣券兑换本次实操的云资源,如未领取请先点击领取。(若已领取请跳过)

image

重要

实验产生的费用优先使用优惠券,优惠券使用完毕后需您自行承担。

学生认证

实验步骤

  1. 登录阿里云百炼

    登录阿里云,搜索阿里云百炼进入控制台。或点击链接进入阿里云百炼

    说明

    注意:阿里云百炼的账号登录体系与其它阿里云产品保持一致,统一采用阿里云账号或RAM用户登录。目前支持一个阿里云主账号创建多个RAM用户,并且同时拥有管理多个阿里云百炼大模型的业务空间权限

    image

  2. 进入析言页面

    点击【应用开发】—【应用广场】—【解决方案】,找到析言GBI,点击【查看详情】即可进入析言页面

    image

  3. 选择析言版本

    在左下角对应着析言的版本,建议选择【试用 标准版 mix

    image

    说明

    注意:请关注免费额度

    image

  4. 使用官方预置数据库

    选定了版本后,接下来就开始析言的使用,选择【官方预置数据库】进入预置数据库内进行问答。

    image

    可以直接点击弹窗中的示例问题,也可在下方的对话框内自行输入问题。

    image

  5. 选题问答

    选择官方预置问题进行问答,点击其中一个问题,出现在问题框后,点击右下角的发送箭头进行提问。

    image

    生成过程如下,析言的结果流式输出,包括 问题改写、选表、本次推理需要参考的业务逻辑、生成的SQL,SQL执行结果以及数据解读。

    image

    image

  6. 重新生成

    问答生成结束后,如果结果不满足预期,请将问答页面滑到最下方,点击右下角的【重新生成】按钮,会再重新问答一次,页面会展示两次生成结果。

    image

  7. 生成结果下载

    如果需要把生成结果下载下来,可点击右下角的【下载结果】即可下载至本地。下载文件格式:.csv 下载文件名称:Request ID.csv

    image

  8. 企业知识

    点击【数据表管理】—【官方数据库】—【查看详情】—【查看企业数据配置】,了解如何配置企业知识。企业知识可以帮助大模型理解一些专属的名词解释,计算口径,业务逻辑等内容。

    image

    image

  9. 自定义数据库

    【首页】—【关联数据库】可以跳转至自定义数据库连接页面。

    image

    【首页】—数据文件】可以跳转至Excel文件上传界面。

    image

  10. 上传文件

    可点击【上传文件】会弹出对应的上传框,如果没有合适的Excel文件,可点击【下载模板】下载对应的Excel模板。点击【上传】按钮,把对应的文件上传后,点击【保存】即可进入提问界面

    说明

    若上传自己的excel文件,需要满足一定的行数,sheet数和文件大小限制。 为保证大模型分析的准确率,降低理解成本,excel文件需要有明确的列名称的数据文件,可参考下载模板。

    image

  11. 编辑及删除

    进入提问界面后,可以预览Excel文件内包含的数据表信息,在右下方有两个按钮,点击【编辑表信息】可以对数据表进行描述,点击【删除文件】可以删除对应的表。

    image

  12. 基于表格内容提问

    问题示例:

    • 问题1:旅行箱待发货的订单数有多少

    • 问题2:统计各产品的订单数,并按照降序排列

    image

  13. 如何提升NL2SQL的准确率

    1. 如果自行连接的数据库内包含专有名词或计算口径,可以在名词解释或者业务逻辑解释中,通过自然语言描述该专有名词/计算口径,让模型去知道这个专有性名词是什么,可以在知识名词解释模块做一个设置。

      参考配置:

      image.png

    2. 针对于表内的有些字段数据包含同义词以及简称词等情况,可以在同义词解释模块配置表内词语对应的同义词或相近词。

      参考配置:

      image.png

    3. 当对于实际业务中有特殊的业务逻辑需要模型参考,可以在业务逻辑解释模块进行配置,让模型参考学习。

      参考配置:

      image.png

    4. MIX版本的优化案例管理TURBO版本的模型输出干预,主要运用在尝试调整问题问法及数据管理后,模型依然无法输出预期结果的情况下,您可以通过添加优化案例来指导模型进行学习。

      TURBO版本的模型输出干预

      重要

      为避免设置过多干预条件产生不可预知的负向影响,请谨慎设置干预条件,并尽可能减少该功能的使用频率。

      参考配置:

      image.png

      MIX版本的优化案例管理,包含两部分,通配符管理和案例库管理。

      重要

      优化案例管理提供通配符管理与案例库管理两项能力,其中通配符需与案例库联合使用,请先添加通配符,而后添加案例库。添加完毕后,系统需要进行数据解析供模型自学习,请稍等几分钟后再使用。

      • 通配符:是一种可以被一个或多个字符进行模糊替代的高级词汇,例如某通配符为【品牌】,其枚举值为“小米”、“华为”、"vivo"、“oppo”。在实际的问题问法中可能包含某个通配符的某个枚举值,此类问法在后续进行案例管理时,无需为每个枚举值逐一添加案例,模型将根据通配符的设置内容进行智能理解。

        参考配置:

        image.png

      • 案例库:添加案例可以有效提升模型解决一类问题的准确率。一条案例包含一个问题的问法描述与其预期正确执行的完整SQL内容。在设置案例时,若该案例的问法描述中包含某通配符的某个枚举值信息,请确保已在通配符管理中完成设置。

        参考配置:

        image.png

  14. 实验资源释放

    实验结束后,阿里云百炼账号无需注销,无资源释放。

    需要注意,在阿里云百炼,模型训练部署等需要付费,请谨慎操作。模型体验、构建应用等需要消耗token,在测试前请先确认是否有免费额度。

关键步骤

本实验关键步骤总结:

  • 登录阿里云百炼应用广场,进入析言GBI

  • 通过官方预置数据库,了解析言GBI产品能力和配置方法。

  • 上传Excel或关联数据库。

  • 通过自然语言提问,根据大模型生成的SQL和结果,调整业务知识的配置方法。

通过完成本实验,您将了解阿里云百炼析言GBI的基本操作,可以利用析言来进行数据分析。

背景知识

本场景主要涉及以下云产品:阿里云百炼、阿里云百炼官方应用析言GBI。

对于析言新用户,析言提供200次问题的免费调用,超出200次提问,将收取产品订阅费。

  • 标准版mix:499元/月,包括5并发以及500次问题调用,超出部分后付费增购:1000/5并发/月,0.8元/1次调用

  • 标准版turbo:299元/月,包括5并发以及500次问题调用,超出部分后付费增购:1000/5并发/月,0.5元/1次调用

关闭实验

  • 完成实验后,点击 结束实操

    image

  • 点击 取消 回到实验页面,点击 确定 退出实验界面,关闭页面结束实验

    image