本文为您详细介绍GDB Automl数据导入的方法。

操作步骤

  1. 数据导入。
    1. 进入GDB Automl。
    2. 在页面顶端,单击数据,选择数据导入方式。1
      说明 目前版本支持从图数据库GDB导入数据、从文件中导入(包括从CSV文件和压缩包文件)、从数据库SQL表导入。
  2. 数据解析。
    数据导入后,GDB Automl提供数据解析器对数据进行解析,可以自动配置解析数据源,解析器(支持CSV、ARFF、XLS、XLSX、ORC等多种数据格式的解析)。
    1. 数据解析器页面,选择导入数据对应的解析器分离列标题选项6
    2. 单击解析以生成hex格式数据帧。6
      解析结果可以查看特征列类型、最大值、最小值、均值等统计数据。
      • 单击Convert to enum,将特征类型转化为枚举类型,进行后续的分类任务。
      • 单击特征名,可以查看特征取值分布的统计。7
  3. 数据切分。
    解析后的数据帧,可以选择切分工具,按照自定义比例进行数据切分。帮助您自动划分训练集、验证集和测试集,划分时按照种子随机切分。
    1. 单击切分8
    2. 单击创建,得到拆分后的数据帧文件。9