数据传输服务是MaxCompute数据进出的最重要通道,其中包括适用批量操作的普通Tunnel和适用流式写入的Stream Tunnel,同时在所有Region提供免费限量使用的数据传输服务共享资源组,也提供数据传输服务(包年包月)独享资源组,供您采购使用。

使用分类

  • 命令。

    目前命令只能通过MaxCompute客户端(odpscmd)执行。

  • 批量操作。

    普通Tunnel可以对数据进行离线批操作,对数据进行上传与下载,包括单表数据上传下载和查询实例下载。

  • 流式操作。

    Stream Tunnel可以对流式数据做数据微批的方式写入表。

Tunnel服务

产品架构

数据传输服务产品架构图如下,目前一个Region只有一个数据传输服务共享资源组,资源被该Region所有用户共享使用,对每个租户有并发上限限制。数据传输服务(包年包月)独享资源组需要用户单独购买,您可以购买一个或者多个独享资源组,购买后独享资源组被您独享使用。同时您可以手工指定独享资源组来执行数据传输任务。如果没有特别指定,会读取项目上默认的独享资源组执行数据传输服务。数据传输服务产品架构

使用方式

数据传输服务包括数据传输服务共享资源组和数据传输服务(包年包月)独享资源组,您可以根据业务需要绑定合适的资源组进行数据传输。以下为绑定数据传输服务资源组的方式,详情请参考使用方式
  • 项目级别设置默认数据传输服务资源组,并将开启成默认数据服务资源组状态置为开启
  • 在SDK中手工指定Quota组进行使用。
说明 直接提供Quota Name优先级高于项目级别的默认设置,详情请参考数据传输服务(包年包月)使用介绍

数据传输服务使用限制

  • 批量数据通道使用限制说明。
    • 批量数据上传。
      限制项限制说明
      UploadSession生命周期24小时。
      单UploadSession写入Block个数20000个。
      单Block写入速度10 MB/s。
      单Block写入数据量100 GB。
      单表创建UploadSession数每5分钟500个。
      单表写入Block数每5分钟500个。
      单表并发提交UploadSession数32个。
      并发写入Block数受Slot并发数限制,单次Block写入占用一个Slot。
      并发写入MaxCompute会根据ACID进行并发写入的保障。关于ACID的具体语义请参见ACID语义
    • 批量数据下载。
      限制项限制说明
      DownloadSession生命周期24小时。
      InstanceDownloadSession生命周期24小时,受实例生命周期限制。
      单Project创建InstanceDownloadSession数每5分钟200个。
      单表创建DownloadSession数每5分钟200个。
      单次下载请求速度10 MB/s。
      并发创建DownloadSession数受Slot并发数限制,单次创建DownloadSession占用一个Slot。
      并发创建InstanceDownloadSession数受Slot并发数限制,单次创建InstanceDownloadSession占用一个Slot。
      并发下载请求数受Slot并发数限制,单次数据下载请求占用一个Slot。
  • 流式数据通道使用限制说明。
    限制项限制说明
    单Slot写入速度1 MB/s。
    单Slot写入请求数每秒10个。
    单表并发写入分区数64个。
    单分区最大可用Slot数32个。
    StreamUploadSession占用Slot数受Slot并发数限制,创建StreamUploadSession时指定Slot数。
  • 上传数据限制。
    • 每个字段的大小不能超过该字段本身的限制,详情请参见数据类型版本说明
      说明 STRING类型的字段大小不能超过8 MB。
    • 上传的过程中会将多条数据打包成一个Package进行上传。
  • 数据传输网络限制(独享资源组)。
    • 只支持云上VPC网络访问,暂时不支持公共网络访问。
    • 只支持同Region的数据传输服务,暂时不支持跨Region的数据传输服务。
说明 网络因素对数据传输服务上传下载速度的影响较大,正常情况下速度范围为1 MB/s~20 MB/s。如果上传数据速度太慢,可以考虑使用多线程上传方式。

数据传输服务共享资源组说明

下表数据为不同区域下免费共享资源(单位:Slot)Project级最多可用Slot数说明。
站点RegionSlot(个数)
中国华东1(杭州)300
中国华东2(上海)600
中国华东2金融云(上海)50
中国华北2(北京)300
中国华北2政务云(北京)100
中国华北3(张家口)300
中国华南1(深圳)150
中国华南1金融云(深圳)50
中国西南1(成都)150
中国中国(香港)50
亚太新加坡(新加坡)100
亚太澳大利亚(悉尼)50
亚太马来西亚(吉隆坡)50
亚太印度尼西亚(雅加达)50
亚太日本(东京)50
欧洲与美洲德国(法兰克福)50
欧洲与美洲美国(硅谷)100
欧洲与美洲美国(弗吉尼亚)50
欧洲与美洲英国(伦敦)50
中东与印度印度(孟买)50
中东与印度阿联酋(迪拜)50

数据传输服务有效状态码

状态码标识状态码名称
200HTTP_OK
201HTTP_CREATED
400HTTP_BAD_REQUEST
401HTTP_UNAUTHORIZED
403HTTP_FORBIDDEN
404HTTP_NOT_FOUND
405HTTP_METHOD_NOT_ALLOWED
409HTTP_CONFLICT
422HTTP_UNPROCESSABLE_ENTITY
429HTTP_TOO_MANY_REQUESTS
499HTTP_CLIENT_CLOSED_REQUEST
500HTTP_INTERNAL_SERVER_ERROR
502HTTP_BAD_GATEWAY
503HTTP_SERVICE_UNAVAILABLE
504HTTP_GATEWAY_TIME_OUT