混合云集群指混合部署在本地和云上的集群,调度节点、域账号节点都在本地,计算节点在本地和云上。您可以利用本地的HPC集群在阿里云扩容计算节点资源,统一调度云上资源和您的本地资源进行高性能计算。本文介绍如何通过E-HPC管理控制台创建混合云集群。
前提条件
背景信息
本地HPC集群管控节点的环境要求如下:
-
操作系统:CentOS 7.2、7.3、7.4、7.5、7.6、8.0
-
调度集群类型:custom、deadline、PBS 18.1.1、SGE(Open Grid Scheduler)
说明PBS和SGE集群仅支持操作系统CentOS 7.x。
-
账号管理类型:custom
使用流程
创建并使用混合云集群的流程如下所示:
-
创建混合云集群时,您需要配置集群计算节点的硬件配置、软件配置、基础配置等信息。
-
创建混合云集群后,集群中并没有任何计算节点,若需要使用混合云集群,还需要进行扩容。
扩容前,请根据业务需要准备好自定义镜像,该自定义镜像中须安装有deadline或custom调度器。关于如何创建自定义镜像,请参见使用实例创建自定义镜像。
步骤一:创建混合云集群
-
登录弹性高性能计算控制台。
-
在顶部菜单栏左上角处,选择地域。
-
在左侧导航栏,选择集群。
-
在集群页面右上角,单击创建混合云集群。
-
配置硬件信息。
-
填写基本配置信息。
配置项
说明
可用区
集群计算节点的可用区。
付费类型
集群计算节点的计费方式,其中不包括弹性公网IP、NAS存储的费用。
-
包年包月:按周、月或年购买及续费,为预付费模式。
-
按量付费:按实际开通时长以小时为单位进行收费,为后付费模式。
-
抢占式实例:相对于按量付费实例价格有一定的折扣,价格随供求波动,按实际使用时长进行收费,后付费模式。
更多信息,请参见计费方式概述。
计算节点
用于执行高性能计算作业的节点,其配置决定了E-HPC集群的总体性能。
使用代理模式
开启后,在云上创建代理节点,用于管理云上集群资源。
云上代理节点
开启使用代理模式时,配置云上代理节点的实例规格。
-
-
展开高级配置,按需设置参数。
配置项
说明
资源组配置
资源组
集群节点所在资源组。您可以使用资源组对您账号下的集群资源进行分组管理。
网络配置
VPC、交换机
集群所在的专有网络,不同的专有网络之间逻辑上彻底隔离。您可以在专有网络内创建和管理集群。
默认选择第一个已创建的VPC和交换机,请确保交换机下的IP地址空间足够(可用IP数大于集群所有节点的数量)。
新建安全组、安全组名称
目前仅支持新建安全组,请输入新建的安全组名称。
共享存储
文件存储位置
选择文件存储位置。支持不挂载文件存储、使用本地文件存储和使用云上存储
本地集群存储挂载地址
使用本地文件存储时,本地存储的地址。
挂载路径
使用本地文件存储时,要挂载存储的集群路径。
本地路径
使用本地文件存储时,要挂载到集群的本地路径。
按文件夹配置
使用云上文件存储时,选择是否为各个文件夹分别挂载不同的文件系统。
文件系统类型
使用云上文件存储时,选择文件系统的类型。
文件系统ID、挂载点
默认选择第一个已创建的文件系统ID和挂载点,请确保该文件系统还有可用的挂载点余量。
挂载选项
挂载通用型NAS时,可选择挂载协议,支持使用NFS v3协议或NFS v4协议挂载。
远程目录
要挂载的文件系统的远程目录。
-
-
单击下一步,配置软件信息。
配置项
说明
镜像类型、镜像
按需选择镜像类型和对应的镜像,用于部署计算节点环境。
调度器
本地集群的调度器类型。
调度器节点IP
本地集群中部署了调度器的节点的IP地址。
调度器节点主机名
本地集群中部署了调度器的节点的主机名称。
账号系统
本地集群中域账号服务的类型。
本地集群域名
本地集群的域名。
账号节点IP
本地集群中部署了域账号服务的节点的IP地址。
账号节点主机名
本地集群中部署了域账号服务的节点的主机名称。
-
单击下一步,配置基础信息。
配置项
说明
名称
集群名称,该名称将会在集群列表中显示,便于您查找识别。
登录密码
集群的登录密码。该密码用于远程SSH访问集群登录节点,对应的用户名为root。
说明当开启代理模式时,集群登录密码必须与本地集群root密码保持一致。
确认密码
再次输入登录密码。
-
在右侧配置清单查看创建的集群配置,阅读并选中《E-HPC服务条款》,单击确认。
创建完成后,在E-HPC集群页面,当新创建的集群状态为运行中,则混合云集群已创建。
步骤二:扩容混合云集群
-
在集群页面,选择需要扩容的混合云集群,单击扩容。
-
在集群扩容面板,完成基本配置。
具体操作,请参见手动扩容集群。请注意以下配置参数:
-
镜像类型:选择自定义镜像。
-
镜像:选择已创建好的自定义镜像。
-
-
确认当前配置,阅读并选中《E-HPC服务条款》,单击立即购买。
扩容后,您可以单击资源管理 > 节点与队列,在集群列表中选择已扩容的混合云集群,在节点类型列表中选择计算节点,即可查看已扩容节点的状态。当该节点状态为运行中,说明扩容混合云集群已完成。