新建用户自定义函数

离线计算函数用于管理离线计算任务代码开发过程中用到的SQL函数,包括计算引擎源常用且系统默认支持的函数和用户自定义函数,前者不支持编辑操作。本文为您介绍如何新建用户自定义函数。

前提条件

完成资源的创建,详情请参见创建资源

背景信息

Dataphin系统根据函数类型定义了函数的目录,帮助您更好地管理函数。

操作步骤

  1. 在Dataphin首页,单击顶部菜单栏的研发

  2. 在数据开发页面,按照下图操作指引,进入新建函数对话框。

    gagaga系统支持新建的函数类型,根据Dataphin系统的计算引擎不同而不同:

    • 如果Dataphin系统的计算引擎为MaxCompute,则系统支持选择MAXC函数FLINK函数

    说明
    • 当前项目如果绑定的为MaxCompute外部项目,则不支持创建自定义函数。

    • 在含有实时引擎的项目下,支持实时相关功能,仅支持增加创建新的Flink函数。

  3. 新建函数对话框,配置参数。

    gaga

    参数

    描述

    名称

    填写名称。名称由字母,数字,下划线(_)组合组成,且首字符仅限字母。

    选择资源

    选择资源文件。下拉列表中提供的是匹配当前项目的资源名称。 

    说明
    • 当前,仅支持选择PYTHON、JAR格式的文件进行定义函数。

    • 选择多个资源时,仅限选择同一种资源类型。

    • 如果您还没有资源,则需创建资源。具体操作,请参见创建资源

    类名

    填写类名。针对计算类型中的资源,提取资源中类的内容,例如test_udf.UDFGETSrcId

    类型

    选择类型,下拉列表中可供选择的类型包含窗口统计数值字符串时间ip地址相关函数URL编译码业务其他

    命令格式

    填写命令格式。命令格式即函数引用格式,例如:bigintweekday (datetime date)

    使用文档

    填写函数使用描述,例如:

    select   
    get_week_date("20170810",0,2),--获取8月10日,本周周二日期。
    from  cndata.dual

    选择目录

    系统默认为当前函数类型的目录。如果您需要修改,则系统仅支持修改该函数类型目录下的子目录。

    例如,您新建的是MAXC函数,则系统自动为您选中MAXC函数为目录。如果您需要修改目录, 则系统仅支持选择MAXC函数目录下的子目录。

  4. 按照下图操作指引,提交用户自定义函数。

    gagag
    说明

    如果自定义函数引用的资源有更新,则需重新提交自定义函数,这样注册至MaxCompute或AnalyticDB for PostgreSQL的自定义函数才会更新。

    您可以通过即席查询(请参见查询并下载数据),编写SQL代码(SQL代码中引用该函数)验证函数是否符合预期效果。SQL查询语句示例如下。 

    select   
    get_week_date("20170810",0,2),--获取8月10日本周周二日期。
    from  cndata.dual
  5. 如果项目的模式为Dev-Prod,则您需要发布资源至生产环境。具体操作,请参见发布任务