OSS数据导入MaxCompute表组件主要用于将OSS中的数据导入MaxCompute表。输入为数据文件所在的OSS目录,默认会读取该目录下所有数据文件。OSS中的数据文件(JSONL格式,示例)需要符合:每一行是一个合法的JSON对象,文件由多行JSON对象组成,整个文件本身不是合法的JSON对象。
支持的计算资源
配置组件
在Designer工作流页面添加OSS数据导入MaxCompute表组件,并在界面右侧配置相关参数:
参数类型 | 参数 | 是否必选 | 描述 | 默认值 |
字段设置 | 输出表名称 | 是 | 输出表名称。 | 无 |
执行调优 | 每个实例的cpu数目 | 否 | 设定map task每个instance的CPU数目,取值范围为[50,800]。 | 100 |
每个实例的memory大小,单位M | 否 | 设定map task每个instance的memory大小,单位为MB,取值范围为[256,12288]。 | 1024 | |
每个实例处理的数据大小,单位M | 否 | 设定map task每个instance的最大处理数据量,用户可以通过控制该变量,实现对map端输入的控制。单位为MB,取值范围为[1,Integer.MAX_VALUE]。 | 256 |
文档内容是否对您有帮助?