文档

OSS数据导入MaxCompute表

更新时间:

OSS数据导入MaxCompute表组件主要用于将OSS中的数据导入MaxCompute表。输入为数据文件所在的OSS目录,默认会读取该目录下所有数据文件。OSS中的数据文件(JSONL格式,示例)需要符合:每一行是一个合法的JSON对象,文件由多行JSON对象组成,整个文件本身不是合法的JSON对象。

支持的计算资源

MaxCompute

配置组件

在Designer工作流页面添加OSS数据导入MaxCompute表组件,并在界面右侧配置相关参数:

参数类型

参数

是否必选

描述

默认值

字段设置

输出表名称

输出表名称。

执行调优

每个实例的cpu数目

设定map task每个instance的CPU数目,取值范围为[50,800]。

100

每个实例的memory大小,单位M

设定map task每个instance的memory大小,单位为MB,取值范围为[256,12288]。

1024

每个实例处理的数据大小,单位M

设定map task每个instance的最大处理数据量,用户可以通过控制该变量,实现对map端输入的控制。单位为MB,取值范围为[1,Integer.MAX_VALUE]。

256