离线计算函数用于管理离线计算任务代码开发过程中用到的SQL函数,包括计算引擎源常用且系统默认支持的函数和用户自定义函数,前者不支持编辑操作。本文为您介绍如何新建用户自定义函数。
前提条件
完成资源的创建,详情请参见创建资源。
背景信息
Dataphin系统根据函数类型定义了函数的目录,帮助您更好地管理函数。
操作步骤
在Dataphin首页,单击顶部菜单栏的研发。
在数据开发页面,按照下图操作指引,进入新建函数对话框。
系统支持新建的函数类型,根据Dataphin系统的计算引擎不同而不同:
如果Dataphin系统的计算引擎为MaxCompute,则系统支持选择MAXC函数或FLINK函数。
说明当前项目如果绑定的为MaxCompute外部项目,则不支持创建自定义函数。
在含有实时引擎的项目下,支持实时相关功能,仅支持增加创建新的Flink函数。
在新建函数对话框,配置参数。
参数
描述
名称
填写名称。名称由字母,数字,下划线(_)组合组成,且首字符仅限字母。
选择资源
选择资源文件。下拉列表中提供的是匹配当前项目的资源名称。
说明当前,仅支持选择PYTHON、JAR格式的文件进行定义函数。
选择多个资源时,仅限选择同一种资源类型。
如果您还没有资源,则需创建资源。具体操作,请参见创建资源。
类名
填写类名。针对计算类型中的资源,提取资源中类的内容,例如
test_udf.UDFGETSrcId
。类型
选择类型,下拉列表中可供选择的类型包含窗口、统计、数值、字符串、时间、ip地址相关函数、URL、编译码、业务、其他。
命令格式
填写命令格式。命令格式即函数引用格式,例如:
bigintweekday (datetime date)
。使用文档
填写函数使用描述,例如:
select get_week_date("20170810",0,2),--获取8月10日,本周周二日期。 from cndata.dual
选择目录
系统默认为当前函数类型的目录。如果您需要修改,则系统仅支持修改该函数类型目录下的子目录。
例如,您新建的是MAXC函数,则系统自动为您选中MAXC函数为目录。如果您需要修改目录, 则系统仅支持选择MAXC函数目录下的子目录。
按照下图操作指引,提交用户自定义函数。
说明如果自定义函数引用的资源有更新,则需重新提交自定义函数,这样注册至MaxCompute或AnalyticDB for PostgreSQL的自定义函数才会更新。
您可以通过即席查询(请参见查询并下载数据),编写SQL代码(SQL代码中引用该函数)验证函数是否符合预期效果。SQL查询语句示例如下。
select get_week_date("20170810",0,2),--获取8月10日本周周二日期。 from cndata.dual
如果项目的模式为Dev-Prod,则您需要发布资源至生产环境。具体操作,请参见发布任务。