Alink是基于Flink或Blink的通用算法平台。本文介绍如何通过在E-MapReduce控制台上配置及使用PAI-Alink。

前提条件

  • 已创建E-MapReduce的Data Science集群。详情请参见创建集群
    说明 本文操作以EMR-3.31.0版本为例介绍。
  • 创建Knox账号,详情请参见管理用户
  • 已开启8443端口,详情请参见设置安全组访问

访问PAI-Alink

  1. 进入详情页面。
    1. 登录阿里云E-MapReduce控制台
    2. 在顶部菜单栏处,根据实际情况选择地域和资源组
    3. 单击上方的集群管理页签。
    4. 集群管理页面,单击相应集群所在行的详情
  2. 进入实时计算Flink页面。
    1. 在左侧导航栏中,单击访问链接与端口
    2. 单击Flink-Vvp UI所在行的链接。
    3. 在登录页面,输入已创建的Knox账号的用户名密码,单击登录
      登录成功后,进入阿里云实时计算页面。
  3. 配置Flink-VVP。
    1. 在左侧导航栏,单击flink图标。
    2. 部署目标页面,单击添加部署目标
    3. 添加部署目标对话框中,配置相关参数。
      参数 描述
      作业模板名称 作业模板的名称。
      Yarn Queue YARN资源队列。

      使用默认的default队列。

      pcores-vcores-multipliter 物理CPU和虚拟CPU之间的兑换比。

      使用默认值1,表示一个物理CPU当作一个虚拟CPU使用。

      add-target
    4. 单击OK
  4. 配置Alink。
    1. 在E-MapReduce控制台左侧导航栏中,单击访问链接与端口
    2. 单击PAI-Alink UI所在行的链接。
    3. 在左侧导航栏,单击设置
    4. 切换运行的Deployment Target列表,选择已创建的Deployment Target,单击Submit

使用Alink

在Alink产品首页,可以单击对应模板下方的从模板创建,体验首页模板。Alink
使用过程中,您可以选择需要的组件并拖拽到画布上。以首页的评分卡功能模板为例,读取本地HDFS数据,您只需要在读取CSV组件处配置好本地HDFS数据的路径即可。hdfs_data