ChatBI-通过自然语言生成SQL
本实验带您体验如何使用阿里云百炼析言GBI产品进行NL2SQL。
实验简介
析言GBI是一款基于AI原生的数据分析解决方案产品,通过自然语言交互实现NL2SQL、数据问答、分析、洞察等多维度的智能数据分析。支持多种数据源及Excel文件对接,提供阿里云上VPC访问方式,保障用户数据安全。
在本实验中,您将学习如何在阿里云百炼上使用析言GBI并构建一个可NL2SQL的智能数据分析应用。
实验室资源方式简介
进入实操前,请确保阿里云账号满足以下条件:
个人账号资源
使用您个人的云资源进行操作,资源归属于个人。
所有实验操作将保留至您的账号,请谨慎操作。
平台仅提供手册参考,不会对资源做任何操作。
- 说明
使用个人账户资源,在创建资源时,可能会产生一定的费用,请您及时关注相关云产品资源的计费概述。
确保已完成云工开物300元代金券领取。
已通过实名认证且账户余额≥0元。
本实验费用以实际提问次数为准,析言GBI提供200次提问的免费额度,超出免费额度且要继续使用析言,需要付费购买。另外,若您在阿里云百炼调用模型来测试或者构建智能体消耗token,在免费额度之外,将产生费用。请在测试阿里云百炼模型能力前,先确认已领取云工开物300元代金券或有免费额度,以及关注您的token消耗情况。
本实验产生的费用优先使用优惠券,优惠券使用完毕后需您自行承担。如果您调整了资源规格、使用时长,或执行了本方案以外的操作,可能导致费用发生变化,请以控制台显示的实际价格和最终账单为准。
实操结束后,您可以选择继续付费保留资源,但这将导致持续产生费用,否则请根据实验手册释放资源。
实操结束后,无需对阿里云百炼进行注销。
领取300元高校专属权益优惠券
在开始实验之前,请先点击右侧屏幕的“进入实操”再进行后续操作

本次实验需要您通过领取阿里云云工开物学生专属300元抵扣券兑换本次实操的云资源,如未领取请先点击领取。(若已领取请跳过)

实验产生的费用优先使用优惠券,优惠券使用完毕后需您自行承担。

实验步骤
登录阿里云百炼
登录阿里云,搜索阿里云百炼进入控制台。或点击链接进入阿里云百炼
说明注意:阿里云百炼的账号登录体系与其它阿里云产品保持一致,统一采用阿里云账号或RAM用户登录。目前支持一个阿里云主账号创建多个RAM用户,并且同时拥有管理多个阿里云百炼大模型的业务空间权限

进入析言页面
点击【应用开发】—【应用广场】—【解决方案】,找到析言GBI,点击【查看详情】即可进入析言页面

选择析言版本
在左下角对应着析言的版本,建议选择【试用 标准版 mix】
说明注意:请关注免费额度

使用官方预置数据库
选定了版本后,接下来就开始析言的使用,选择【官方预置数据库】进入预置数据库内进行问答。

可以直接点击弹窗中的示例问题,也可在下方的对话框内自行输入问题。

选题问答
选择官方预置问题进行问答,点击其中一个问题,出现在问题框后,点击右下角的发送箭头进行提问。

生成过程如下,析言的结果流式输出,包括 问题改写、选表、本次推理需要参考的业务逻辑、生成的SQL,SQL执行结果以及数据解读。


重新生成
问答生成结束后,如果结果不满足预期,请将问答页面滑到最下方,点击右下角的【重新生成】按钮,会再重新问答一次,页面会展示两次生成结果。

生成结果下载
如果需要把生成结果下载下来,可点击右下角的【下载结果】即可下载至本地。下载文件格式:.csv 下载文件名称:Request ID.csv

企业知识
点击【数据表管理】—【官方数据库】—【查看详情】—【查看企业数据配置】,了解如何配置企业知识。企业知识可以帮助大模型理解一些专属的名词解释,计算口径,业务逻辑等内容。


自定义数据库
【首页】—【关联数据库】可以跳转至自定义数据库连接页面。

【首页】—【数据文件】可以跳转至Excel文件上传界面。

上传文件
可点击【上传文件】会弹出对应的上传框,如果没有合适的Excel文件,可点击【下载模板】下载对应的Excel模板。点击【上传】按钮,把对应的文件上传后,点击【保存】即可进入提问界面
说明若上传自己的excel文件,需要满足一定的行数,sheet数和文件大小限制。 为保证大模型分析的准确率,降低理解成本,excel文件需要有明确的列名称的数据文件,可参考下载模板。

编辑及删除
进入提问界面后,可以预览Excel文件内包含的数据表信息,在右下方有两个按钮,点击【编辑表信息】可以对数据表进行描述,点击【删除文件】可以删除对应的表。

基于表格内容提问
问题示例:
问题1:旅行箱待发货的订单数有多少
问题2:统计各产品的订单数,并按照降序排列

如何提升NL2SQL的准确率
如果自行连接的数据库内包含专有名词或计算口径,可以在名词解释或者业务逻辑解释中,通过自然语言描述该专有名词/计算口径,让模型去知道这个专有性名词是什么,可以在知识名词解释模块做一个设置。
参考配置:

针对于表内的有些字段数据包含同义词以及简称词等情况,可以在同义词解释模块配置表内词语对应的同义词或相近词。
参考配置:

当对于实际业务中有特殊的业务逻辑需要模型参考,可以在业务逻辑解释模块进行配置,让模型参考学习。
参考配置:

MIX版本的优化案例管理和TURBO版本的模型输出干预,主要运用在尝试调整问题问法及数据管理后,模型依然无法输出预期结果的情况下,您可以通过添加优化案例来指导模型进行学习。
TURBO版本的模型输出干预
重要为避免设置过多干预条件产生不可预知的负向影响,请谨慎设置干预条件,并尽可能减少该功能的使用频率。
参考配置:

MIX版本的优化案例管理,包含两部分,通配符管理和案例库管理。
重要优化案例管理提供通配符管理与案例库管理两项能力,其中通配符需与案例库联合使用,请先添加通配符,而后添加案例库。添加完毕后,系统需要进行数据解析供模型自学习,请稍等几分钟后再使用。
通配符:是一种可以被一个或多个字符进行模糊替代的高级词汇,例如某通配符为【品牌】,其枚举值为“小米”、“华为”、"vivo"、“oppo”。在实际的问题问法中可能包含某个通配符的某个枚举值,此类问法在后续进行案例管理时,无需为每个枚举值逐一添加案例,模型将根据通配符的设置内容进行智能理解。
参考配置:

案例库:添加案例可以有效提升模型解决一类问题的准确率。一条案例包含一个问题的问法描述与其预期正确执行的完整SQL内容。在设置案例时,若该案例的问法描述中包含某通配符的某个枚举值信息,请确保已在通配符管理中完成设置。
参考配置:

实验资源释放
实验结束后,阿里云百炼账号无需注销,无资源释放。
需要注意,在阿里云百炼,模型训练部署等需要付费,请谨慎操作。模型体验、构建应用等需要消耗token,在测试前请先确认是否有免费额度。
关键步骤
本实验关键步骤总结:
登录阿里云百炼应用广场,进入析言GBI
通过官方预置数据库,了解析言GBI产品能力和配置方法。
上传Excel或关联数据库。
通过自然语言提问,根据大模型生成的SQL和结果,调整业务知识的配置方法。
通过完成本实验,您将了解阿里云百炼析言GBI的基本操作,可以利用析言来进行数据分析。
背景知识
本场景主要涉及以下云产品:阿里云百炼、阿里云百炼官方应用析言GBI。
对于析言新用户,析言提供200次问题的免费调用,超出200次提问,将收取产品订阅费。
标准版mix:499元/月,包括5并发以及500次问题调用,超出部分后付费增购:1000/5并发/月,0.8元/1次调用
标准版turbo:299元/月,包括5并发以及500次问题调用,超出部分后付费增购:1000/5并发/月,0.5元/1次调用
关闭实验
完成实验后,点击 结束实操

点击 取消 回到实验页面,点击 确定 退出实验界面,关闭页面结束实验
























