Dataphin仅支持开发基于Python的脚本,不支持开发依赖第三方组件的脚本。开发基于第三方组件的脚本,需要通过pip install下载第三方组件。本文为您介绍基于Dataphin如何通过构建Shell任务调用Python读取第三方文件。
前提条件
- 添加访问地址mirrors.aliyun.com和端口*至项目空间的沙箱白名单,详情请参见设置白名单。
- 已准备Python支持读取的文件,例如TXT、CSV、XLS、XLSX或PDF等格式文件。
步骤一:上传文件
步骤二:创建Shell任务
- 在数据处理页签,单击左侧导航栏计算任务图标。
- 在计算任务页面,单击计算任务后的图标,选择 。
- 编写DataX任务代码。