使用Dataworks如何上传MaxCompute表资源

概述

本文主要介绍使用Dataworks如何上传MaxCompute表资源。

详细信息

阿里云提醒您:

  • 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。
  • 如果您对实例(包括但不限于ECS、RDS)等进行配置与数据修改,建议提前创建快照或开启RDS日志备份等功能。
  • 如果您在阿里云平台授权或者提交过登录账号、密码等安全信息,建议您及时修改。

Dataworks暂时不支持直接创建表类型的资源,您可以参考以下变通的方法进行上传:

  1. 登录DataWorks控制台,单击工作空间列表,然后单击目标工作空间名称操作列下的进入数据开发,选择添加图标,然后依次选择MaxCompute>资源>File
  2. 新建资源,资源名称和表名一样,资源类型选择File,且不要勾选上传为ODPS资源,在其他信息填写完成后,单击确定
  3. 通过MaxCompute客户端odpscmd执行以下SQL语句,将资源添加到MaxCompute,详情请参见MaxCompute客户端odpscmd使用说明
    说明:本文以yftable表为例进行介绍。
    add table yftable as yftable;
  4. UDF读取表资源的代码示例如下:
    • Java
      public void setup(ExecutionContext ctx) throws UDFException {
        Iterator<Object[]> iterator = ctx.readResourceTable("yftable").iterator();
      }
    • Python
      odps.distcache.get_cache_table(resource_name)

适用于

  • Dataworks
  • MaxCompute