新建Flink计算源并配置Yarn或Kubernetes部署模式-智能数据建设与治理Dataphin-阿里云-智能数据建设与治理 Dataphin(Dataphin)-阿里云帮助中心

Flink计算源用于承载Dataphin项目下基于Flink的计算资源，只有绑定了Flink计算源的项目，才支持基于Flink引擎研发计算任务。本文将为您介绍如何新建Flink计算源。

前提条件

当前租户已经启用Apache Flink作为实时计算引擎。更多信息，请参见设置实时计算引擎。
仅支持具备新建计算源权限点的自定义用户角色，以及超级管理员和项目管理员角色的账号新建计算源。更多信息，请参见数仓规划权限列表。

操作步骤

在Dataphin首页的顶部菜单栏中，选择规划 > 计算源。
在计算源页面单击新增计算源，选择Flink计算源。

在新建计算源页面，配置参数。

计算源基本信息

参数	描述
计算类型	选择为Flink。
计算源名称	填写计算源的名称。命名规则如下：包含中文、数字、字母及下划线（_）或短划线（-）。不能超过64个字符。
计算源描述	填写计算源的描述，128个字符以内。

选择部署模式并配置相应信息

Dataphin支持集群的不同部署模式，包括Yarn和Kubernetes部署模式。不同部署模式需要配置的参数不同。

Yarn部署模式

集群基本信息

参数	描述
配置文件	上传集群的配置文件。yarn-site.xml、core-site.xml和hdfs-site.xml配置文件必须上传。
集群Kerberos	Kerberos是一种基于对称密钥技术的身份认证协议，可以为其他服务提供身份认证功能，且支持SSO（即客户端身份认证后，可以访问多个服务，例如HBase和HDFS）。如果集群有Kerberos认证，则需要开启集群Kerberos并上传Krb5认证文件或配置KDC Server地址。 Krb5认证文件：需要上传Krb5文件进行Kerberos认证。 KDC Server地址：KDC服务器地址，辅助完成Kerberos认证。支持配置多个KDC Server服务地址，使用半角逗号（,）分隔。
集群类型（非必选）	选择集群的类型，用于测试连接。包括Aliyun E-MapReduce5.x、CDH5.x Hadoop、CDH6.x Hadoop、Cloudera Data Platform 7.x、亚信DP5.3 Hadoop、星环TDH 6.x Hadoop。重要通常情况下，未选择集群类型也能够测试连接通过；个别情况未选择可能导致测试连接失败，建议进行选择。

Flink计算资源

参数	描述
计算资源类型	可选择资源队列和Session集群。
资源队列	当计算资源类型选择资源队列时，可填写资源队列名称，即Flink任务提交到YARN的队列名称。命名规范及限制说明如下：长度限制：队列名称长度不能超过256个字符。字符限制：队列名称只能包含英文、数字、部分特殊字符`-_.@'()`以及空格。大小写敏感：队列名称区分英文字母大小写，即名称中的大小写字母为不同的字符。唯一性：队列名称必须是计算源唯一，不能与其他队列名称重复。若需配置多个任务队列，您可单击+添加进行新增。说明至多支持10个资源队列。若需删除多余的资源队列，您可单击进行删除，但至少需保留1个资源队列。删除后，已有作业将无法正常提交。
Session集群	当计算资源类型选择Session集群时，可选择一个或多个Session集群。下拉列表中包含所有在Session集群中创建的集群，不分区集群状态。

Flink Kerberos认证
说明
仅当计算资源类型选中了资源队列时，支持配置Flink Kerberos认证。
- Flink Kerberos：如果Flink集群有Kerberos认证，您可开启Flink Kerberos并上传Keytab File认证文件与配置Principal。
  - Keytab File：上传keytab文件，您可以在Flink Server上获取keytab文件。
  - Principal：填写Flink Keytab File文件对应的Kerberos认证用户名。
- 用户名：Flink Kerberos关闭时，需填写提交Flink任务的集群用户名。
CheckPoint存储
文件系统：支持HDFS、OSS-HDFS和Aliyun OSS（仅Flink 1.14及1.15支持）。不同文件系统需配置不同参数。
说明
OSS-HDFS文件系统仅支持Aliyun E-MapReduce5.x Hadoop计算引擎。
- 当文件系统为HDFS时需配置如下参数：
  目录路径：输入CheckPoint集群存储的目录路径，并确保Flink有访问该路径的权限。例如hdfs://cdh-cluster-00001:8020/openflink/savepoint/。若您的HDFS为HA高可用集群，支持填写高可用路径，即hdfs://服务名（nameservice）/路径。
- 当文件系统为OSS-HDFS时需配置如下参数：
  - 目录路径：输入CheckPoint集群存储的目录路径，并确保Flink有访问该路径的权限。例如hdfs://cdh-cluster-00001:8020/openflink/savepoint/。若您的HDFS为HA高可用集群，支持填写高可用路径，即hdfs://服务名（nameservice）/路径。
  - AccessKey ID、AccessKey Secret：需填写访问集群OSS的AccessKey ID和AccessKey Secret。请使用已有AccessKey或者参考创建AccessKey重新创建。
    说明
    为降低AccessKey泄露的风险，AccessKey Secret只在创建时显示一次，后续无法查看。请务必妥善保管。
- 当文件系统为Aliyun OSS时需配置如下参数：
  - Endpoint：填写OSS服务的连接地址。
  - 目录路径：填写格式为oss://{Bucket}/{Object}。
  - AccessKey ID、AccessKey Secret：需填写访问集群OSS的AccessKey ID和AccessKey Secret。请使用已有AccessKey或者参考创建AccessKey重新创建。
    说明
    为降低AccessKey泄露的风险，AccessKey Secret只在创建时显示一次，后续无法查看。请务必妥善保管。
重要
此处填写的配置优先级高于core-site.xml中配置的AccessKey。

Kubernetes部署模式

集群基本信息
Kubernetes部署模式无需配置集群基本信息。

Flink计算引擎配置信息

Kubernetes部署模式下，Flink计算引擎的文件系统可选择NFS、S3、Azure Blob Storage三种类型，选择不同类型的文件系统后所需配置的参数不同。

NFS

参数	描述
Server	填写NFS服务器的域名。
版本	选择NFS的版本。支持NFSv3和NFSv4版本。
目录	填写NFS上CheckPoint的存储路径目录。例如，`/data/checkpoint`。
最大容量	输入NFS支持存储的最大容量，超出后将影响Checkpoint存储。单位（Gi）。

S3

参数	描述
Endpoint（非必填）	输入正确地址，例如`http://s3.us-east-2.amazonaws.com`。说明若为AmazonS3则无需填写Endpoint，其他情况下，此项为必填。
目录路径	输入存储路径，默认为`s3://{YOUR-BUCKET}/{path}`。建议为Checkpoint存储提供专属目录，且定期清理。
Access Key、Secret Key	输入访问Amazon S3的AccessKey和AccessKey Secret，单击图标可查看明文。

Azure Blob Storage

参数	描述
协议	当前仅支持选择ABDS。
认证方式	当前仅支持选择Shared Key。
目录路径	输入存储路径，默认为`abfs://{YOUR-CONTAINER}@${YOUR-AZURE-ACCOUNT}.dfs.core.windows.net/{object-path}`。
访问密钥	输入访问Azure Blob Storage账户的访问密钥，单击图标可查看明文。

单击测试连接，测试Dataphin与集群的连通性。
Kubernetes部署模式不支持测试连接，您可以直接单击提交。
测试成功后，单击提交。

后续步骤

完成创建Flink计算源后，即可为项目绑定Flink计算源。更多信息，请参见创建通用项目。