在ChatBI中进行交互式会话之前,需要通过数据集来圈定开展分析的数据范围。数据集可以是目标数据源中的数据表,也可以是本地文件。
准备工作
已在使用ChatBI功能的对应地域创建Serverless资源组。
适用范围
数据源类型的数据集,仅支持选择Hologres、MaxCompute、StarRocks和MySQL类型的数据源。
本地文件类型的数据集,仅支持
xls
、xlsx
和csv
格式,且最多上传10个文件,每个文件不超过1GB。
新建数据集
进入ChatBI功能入口。
您需要先登录阿里云,然后通过浏览器访问ChatBI智能数据洞察页面。请根据您的DataWorks资源组、数据集等业务所在地域按需选择。
在页面左侧导航栏单击数据集,进入数据集页面,点击新建数据集。
在新建数据集页面,填写数据集相关信息:
数据集类型为数据源:
参数
描述
基本信息
名称
自定义数据集名称。
类型
数据集类型,包括:
数据源
本地文件
此处选择数据源类型。
数据源类型
数据源类型,包括:
Hologres
MaxCompute
StarRocks
MySQL
数据源相关信息
不同数据源配置参数有差异。
以Hologres为例,需要配置地域、Hologres实例、数据库名称。
资源组
选择一个DataWorks Serverless资源组名称,用于在后续会话中使用该资源组访问数据源以进行数据查询。
测试连通性
测试目标DataWorks Serverless资源组和当前数据源之间的连通性。
选择目标表
选择目标表
配置完基本信息后,单击下一步,进入选择目标表步骤。
在待选择列表中选中目标数据表,单击
,将其添加至已选择列表中,表示将目标数据表加入当前数据集。
数据集类型是本地文件:
参数
描述
基本信息
名称
自定义数据集名称。
类型
数据集类型,包括:
数据源
本地文件
此处选择本地文件类型。
上传本地文件
上传本地文件时支持
xls
、xlsx
和csv
格式,最多上传10个文件,每个文件不超过1GB。
当完成数据集配置后,点击下一步进入数据洞察步骤,将自动开始对数据集进行扫描,获取数据取值特征,有助于提升会话过程中的分析准确性。
数据洞察可能耗时较久,您可以直接单击完成,后续可在数据集中查看。
查看数据集
在页面左侧导航栏单击数据集,进入数据集页面。
找到目标数据集卡片,单击进入数据集详情页。
在数据集详情页中,顶部是数据集的基础信息(包括:类型、表/文件数量、创建者),左侧是表/文件列表,右侧是表/文件的基础信息和数据预览(可预览20条数据记录)。
编辑数据集
在页面左侧导航栏单击数据集,进入数据集页面。
找到目标数据集卡片,您可以通过两种方式进入数据集编辑页。
鼠标悬停在目标数据集卡片上,在卡片右上角单击
。单击目标数据集卡片,进入数据集详情页,在右上角单击编辑按钮。
修改数据集相关配置。相关参数解释同新建数据集。
说明编辑已有数据集配置时,类型、数据源类型不可修改。
当完成数据集编辑后,点击下一步进入数据洞察,重新对数据集中的数据进行数据洞察。
删除数据集
在页面左侧导航栏单击数据集,进入数据集页面。
鼠标悬停在目标数据集卡片上,在卡片右上角单击
。删除数据集后,相关联的会话和图表均无法正常显示数据。
后续步骤:基于数据集开始会话
您可以通过如下两种方式基于指定数据集开始会话。
在页面左侧导航栏单击数据集,进入数据集页面。鼠标悬停在目标数据集卡片上,在卡片右上角单击
开始对话。
在页面左侧导航栏单击新建会话,进入ChatBI会话窗口。然后在会话窗口中,单击选择数据集。
进入会话页面,通过输入需求或问题后,即可开始数据分析。详情请参见ChatBI会话。