本文为您详细介绍GDB Automl数据导入的方法。
操作步骤
- 数据导入。
- 进入GDB Automl。
- 在页面顶端,单击数据,选择数据导入方式。
说明 目前版本支持从图数据库GDB导入数据、从文件中导入(包括从CSV文件和压缩包文件)、从数据库SQL表导入。
- 数据解析。
数据导入后,GDB Automl提供数据解析器对数据进行解析,可以自动配置解析数据源,解析器(支持CSV、ARFF、XLS、XLSX、ORC等多种数据格式的解析)。
- 在数据解析器页面,选择导入数据对应的解析器、分离、列标题和选项。
- 单击解析以生成hex格式数据帧。
解析结果可以查看特征列类型、最大值、最小值、均值等统计数据。
- 单击Convert to enum,将特征类型转化为枚举类型,进行后续的分类任务。
- 单击特征名,可以查看特征取值分布的统计。
- 数据切分。
解析后的数据帧,可以选择切分工具,按照自定义比例进行数据切分。帮助您自动划分训练集、验证集和测试集,划分时按照种子随机切分。
- 单击切分。
- 单击创建,得到拆分后的数据帧文件。