MaxCompute Studio支持Python UDF开发,本文为您介绍如何开发和注册发布UDF。

开发

  1. 右键单击scripts,选择New > MaxCompute Python
    说明 如果没有MaxCompute Python选项说明没有Python插件,请确认是否安装成功。配置和安装过程请参见Python开发使用须知
  2. Create new MaxCompute python class对话框中输入类名,选择类型为Python UDF,单击OK完成。
  3. 在编辑框中编写UDF的入参出参,以及函数逻辑。

测试

UDF开发完成后,需要对代码进行测试,看其是否符合预期。我们支持下载表的部分示例数据到本地运行,进行Debug,操作如下:
  1. 右键单击已经编辑完成的UDF类,单击RUN,弹出Run/Debug Configurations对话框。
  2. 单击OK后,通过Tunnel自动下载您指定的示例数据至本地warehouse目录。
    说明
    • 如果已经下载过数据,则不会再次重复下载,如需再次下载,请在客户端使用Tunnel命令下载数据。
    • 默认下载100条数据,如果需要更多数据测试,请在客户端使用Tunnel命令或者Studio的表下载功能下载数据。
  3. 下载完成后,您可以在warehouse目录下看到下载的示例数据。您也可以使用Mock data(即warehouse中的数据自己mock),详情请参见开发和调试UDF中的本地运行的warehouse目录模块信息。
  4. 本地运行框架会根据您指定的列,获取data文件中指定列的数据,调用UDF本地运行。
    说明 本地运行是通过PyODPS的pyou脚本实现的,命令如pyou hello.Plus<data。安装完PyODPS后可以使用相应的命令检查该脚本是否存在。
    • 如果您是Windows系统,请运行${python}/../Scripts/pyou命令。
    • 如果您是MAC系统,请运行${python}/../pyou命令。

    您可以在控制台看到结果打印,也可以在UDF上打断点调试。

注册发布

Python UDF测试通过后,即可注册发布到生产上进行使用。添加资源后,创建UDF即可。详情请参见打包、上传和注册