使用UDF处理数据

如果您在表格存储中的数据有着独特的结构,希望自定义开发逻辑来处理每一行数据,例如解析特定的JSON字符串,您可以使用用户自定义函数UDF(User Defined Function)来处理表格存储中的数据。

操作步骤

  1. IntelliJ中安装MaxCompute-Java/MaxCompute-Studio插件。具体操作,请参见安装MaxCompute Studio

    插件安装完毕,即可直接开发。

    下图为一个简单的UDF定义,将两个字符串连接。MaxCompute支持更复杂的UDF,包括自定义窗口执行逻辑等。更多信息,请参见开发UDFfig_udf_001

  2. 打包之后上传JAR包到MaxCompute。具体操作,请参见打包、上传及注册

  3. 运行bin/odpscmd.bat

    -- 选出来1行数据,并将name/name传入UDF,返回两个string的连接字符串.
    select cloud_metric_extract_md5(name, name) as udf_test from test_table limit 1;                    

    返回结果如下:

    fig_udf_004