本文为您介绍如何创建JAR和Python类型的资源,以及如何引用和下载资源。
背景信息
如果现有的系统内置函数无法满足您的需求,DataWorks支持创建自定义函数,实现个性化处理逻辑。将实现逻辑的JAR包上传至工作空间下,便可以在创建自定义函数时进行引用。
说明
- 您可以在函数列表面板查看系统内置的函数,详情请参见查看函数列表。
- 您可以在MaxCompute函数面板查看在DataWorks提交或发布的函数,详情请参见MaxCompute函数。
您可以将文本文件、Python代码以及.zip、.tgz、.tar.gz、.tar、.jar等压缩包作为不同类型的资源上传至MaxCompute,在UDF及MapReduce的运行过程中读取、使用资源。
MaxCompute为您提供读取、使用资源的接口。目前资源包括以下类型:
- Python:您编写的Python代码,用于注册Python UDF函数。
- JAR:编译好的Java JAR包。
- Archive:通过资源名称中的后缀识别压缩类型,支持的压缩文件类型包括.zip、.tgz、.tar.gz、.tar和.jar。
- File:仅支持.zip、.so和.jar类型的File资源。
JAR和File类型的资源,区别如下:
- JAR资源是您在线下Java环境编辑Java代码,打包为JAR包上传至DataWorks。
- File类型的小文件资源可以直接在DataWorks上编辑。
- 新建File类型资源时,选中大文件,可以上传超过500 KB的本地资源文件。
说明 目前支持最大可以上传50 MB资源。超过50 MB的资源,您可以通过MaxCompute客户端上传,并使用MaxCompute资源提交至DataWorks。详情请参见MaxCompute资源。
创建JAR资源
创建Python资源并注册函数
引用和下载资源
- 在函数中引用资源请参见注册函数。
- 在节点中引用资源请参见创建ODPS MR节点。
如果您需要下载资源,请双击资源选择您需要的资源,单击下载。通过MaxCompute客户端下载资源的详情请参见资源操作。
其他操作
资源创建成功后,您还可以在对应业务流程下,选择数据开发与运行。
,右键单击对应资源,进行资源的重命名、引用及删除等操作。删除资源的具体操作请参见