MaxCompute数据源作为数据中枢,为您提供读取和写入MaxCompute双向通道的功能。

背景信息

标准模式的工作空间支持数据源隔离功能,您可以分别添加并隔离开发环境和生产环境的数据源,以保护您的数据安全。详情请参见 数据源开发和生产环境隔离

大数据计算服务MaxCompute(原名ODPS)提供完善的数据导入方案,能够更快速地解决海量数据计算问题。绑定MaxCompute实例的工作空间,系统会自动生成一个默认的数据源(odps_first)。同时,新绑定一个计算引擎实例,便会产生一个默认的计算引擎数据源,命名格式为0_regionId_引擎名称

默认的数据源和计算引擎数据源对应的MaxCompute项目名称,均为当前工作空间对应的计算引擎MaxCompute项目名称。您可以单击右上方的用户信息,在修改AccessKey信息页面切换默认数据源的访问密钥,但需要注意以下问题:
  • 仅支持阿里云账号间切换访问密钥。
  • 切换时必须没有任务在运行中(数据集成或数据开发等一切和DataWorks相关的任务),您自行添加的MaxCompute数据源可以使用子账号访问密钥。

操作步骤

  1. 进入数据源管理页面。
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的进入数据集成
    4. 在左侧导航栏,单击数据源 > 数据源列表,进入工作空间管理 > 数据源管理页面。
  2. 数据源管理页面,单击右上角的新增数据源
  3. 新增数据源对话框中,选择数据源类型为MaxCompute(ODPS)
  4. 新增MaxCompute(ODPS)数据源对话框中,配置各项参数。
    ODPS数据源
    参数 描述
    数据源名称 数据源名称必须以字母、数字、下划线(_)组合,且不能以数字和下划线(_)开头。
    数据源描述 对数据源进行简单描述,不得超过80个字符。
    适用环境 可以选择开发生产环境。
    说明 仅标准模式工作空间会显示该配置。
    ODPS Endpoint 默认只读,从系统配置中自动读取。
    Tunnel Endpoint MaxCompute Tunnel服务的连接地址,详情请参见配置Endpoint
    ODPS项目名称 MaxCompute(ODPS)项目名称。
    AccessKey ID 访问密钥中的AccessKey ID,您可以进入用户信息管理页面进行复制。
    AccessKey Secret 访问密钥中的AccessKey Secret,相当于登录密码。
  5. 选择资源组连通性类型为数据集成
  6. 在资源组列表,单击相应资源组后的测试连通性
    数据同步时,一个任务只能使用一种资源组。您需要测试每种资源组的连通性,以保证同步任务使用的数据集成资源组能够与数据源连通,否则将无法正常执行数据同步任务。如果您需要同时测试多种资源组,请选中相应资源组后,单击 批量测试连通性。详情请参见 选择网络连通方案
    说明
    • (推荐)资源组列表默认仅显示独享数据集成资源组,为确保数据同步的稳定性和性能要求,推荐使用独享数据集成资源组。
    • 如果您需要测试公共资源组或自定义资源组的连通性,请在资源组列表右下方,单击更多选项,在警告对话框单击确定,资源组列表会显示可供选择的公共资源组和自定义资源组。
  7. 测试连通性通过后,单击完成

后续步骤

现在,您已经学习了如何配置MaxCompute数据源,您可以继续下一个教程。在该教程中,您将学习如何配置MaxCompute插件。详情请参见 MaxCompute ReaderMaxCompute Writer