创建Gateway集群时必须关联到一个已经存在的集群。Gateway集群可以作为一个独立的作业提交点,以便您更好的对关联集群进行操作。

Gateway集群通常是一个独立的集群,由多台相同配置的节点组成,集群上会部署Hadoop(HDFS+YARN)、Hive、Spark和Sqoop等客户端。

未创建Gateway集群时,Hadoop等集群的作业是在本集群的Master或Core节点上提交的,会占用本集群的资源。创建Gateway集群后,您可以通过Gateway集群来提交其关联的集群的作业,这样既不会占用关联集群的资源,又可以提高关联集群Master或Core节点的稳定性,尤其是Master节点。

每一个Gateway集群均支持独立的环境配置。例如,在多个部门共用一个集群的场景下,您可以为这个集群创建多个Gateway集群,以满足不同部门的业务需求。

创建Gateway集群的具体操作请参见以下文档。
集群类型文档链接
Hadoop创建Gateway集群
DataLake、DataFlow和OLAP使用EMR-CLI自定义部署Gateway环境