DataV数据集支持多种数据源的接入,如数据库、excel表格文件等,通过对数据的结构化存储和元数据的汇集整理,提供高效实用的数据建模能力,可用的算子包括常见的数据聚合函数、按不同时间粒度划分、地理信息处理等。本文为您介绍如何在DataV中创建一个完整数据集。
前提条件
已经添加
RDS for MySQL、
RDS for PostgreSQL或
兼容MySQL数据库数据源,具体请参见
添加适配数据源。
- 登录DataV控制台。
- 选择我的数据页签,在左侧列表中单击数据集管理。
- 在数据集管理页面中,单击创建数据集。
- 选择数据源。
- 在选择数据源页面内,选择一种创建方式,可选数据源导入或本地上传。
- 数据源导入:选择数据源导入创建方式,可快速导入已添加完成的适配类型数据源中的数据表内容。添加适配数据内容的方法请参见添加适配数据源。
说明 仅支持导入兼容MySQL数据库、RDS for MySQL和RDS for PostgreSQL这三种类型的数据源。
在
选择数据源类型下拉列表中选择一个已有的数据源类型,并在右侧
选择数据源下拉列表中,选择一个对应类型下的具体的数据源实例。
说明 如果
选择数据源类型下拉列表内没有任何数据源类型可选,您可以单击下拉列表右侧的
添加数据源,进入数据源面板后添加所需类型的数据源。添加适配数据内容的方法请参见
添加适配数据源。
- 本地上传:选择本地上传创建方式,可选择上传本地电脑中的一个Excel表格中数据内容。
说明 本地上传.xls或.xlsx两种格式的Excel表格文件。
单击下方
点击选择文件,在本地电脑上选择一个已有的
Excel
文件。
- 单击页面右下角的下一步。
- 选择数据表。
- 在导入数据表页面内,您可以看到页面内所有数据表的基本信息。
- 您可以在页面左侧的搜索框列表内拖动列表右侧的滚动轴选择一个您所需的数据表,也可直接在数据表列表上方的搜索框内输入数据表的名称后单击右侧的图标,搜索到您所需的数据表。
- 选择一个数据表后,在右侧表格数据展示区域中单击表头行内某一图标,即可修改对应的字段类型。
字段类型包括以下几种:
- 数字
- 字符串
- 日期和时间
- 行政区划:包括省/自治区/直辖市/特别行政区、地级市/地区/自治区/盟和县/县级市/市辖区/自治县/旗/自治旗/特区/林区。
- adcode:城市编码。
- 双击表头行内的字段名,可对该字段重命名。
- 数据表编辑完成后,单击页面右下角的下一步。
- 保存数据集。
- 在保存数据集页面内,您可以自定义输入当前数据集的名称。
说明 数据集名称是必填项,务必填写完成后再进行下一步操作。
- 在下方描述框内,自定义输入当前数据集的描述内容及备注说明,描述部分内容非必填项。
- 数据集名称和描述编辑完成后,单击页面右下角的创建即可保存当前数据集。
创建并保存完成后的数据集会自动排列显示在
数据集管理页面中,每一个保存的数据集后面都会自动显示数据集内的数据信息数量。