本文为您介绍如何注册EMR(E-MapReduce)函数。

前提条件

操作步骤

  1. 进入数据开发页面。
    1. 登录DataWorks控制台
    2. 在左侧导航栏,单击工作空间列表
    3. 选择工作空间所在地域后,单击相应工作空间后的数据开发
  2. 新建业务流程,详情请参见创建周期业务流程
  3. 在本地Java环境编辑程序并生成JAR包后,再新建JAR资源,并提交发布。详情请参见创建和使用EMR资源
  4. 新建函数。
    1. 打开相应的业务流程,右键单击EMR,选择新建 > 函数
    2. 新建函数对话框中,输入函数名称,并选择EMR引擎实例目标文件夹
    3. 单击提交
    4. 注册函数对话框中,配置各项参数。
      注册函数
      参数描述
      函数类型选择函数类型,包括数学运算函数聚合函数字符串处理函数日期函数窗口函数其他函数
      EMR引擎实例默认不可以修改。
      EMR引擎类型默认不可以修改。
      EMR数据库从下拉列表中选择相应的数据库。如果您需要新建数据库,请单击新建库。在新建库对话框中,配置各项参数,单击确认
      函数名UDF函数名,即SQL中引用该函数所使用的名称。需要全局唯一,且注册函数后不支持修改。
      责任人默认显示。
      类名实现UDF的主类名,必填。
      资源列表从下拉列表中选择本工作空间中已添加的资源,必填。如果您需要新建资源,请单击新建资源。在新建资源对话框中,配置各项参数,单击确定
      描述对当前UDF进行简单描述。
      命令格式该UDF的具体使用方法示例,例如test
      参数说明支持输入的参数类型以及返回参数类型的具体说明。
      返回值返回值,例如1,非必填项。
      示例函数中的示例,非必填项。
  5. 单击工具栏中的保存图标。
  6. 提交函数。
    1. 单击工具栏中的提交图标。
      说明

      提交时,您需要选择提交函数所用的调度资源组,当使用独享调度资源组提交表时,DataWorks平台将下发对应的注册函数的任务到引擎侧执行,并打印执行过程的执行日志,如果资源提交过程中出现问题,您也可以通过日志先进行自助排查。如果您目前无可用的独享调度资源组,请购买并配置独享调度资源组便于使用,操作详情请参见新增和使用独享调度资源组

    2. 提交新版本对话框中,输入变更描述
    3. 单击确认
  7. 提交函数。
    1. 单击工具栏中的提交图标。
    2. 提交新版本对话框中,输入变更描述
    3. 单击确认