集群概述

集群是运行高性能计算的节点集合,可以提供单节点不能提供的强大计算能力,拥有高性能、弹性扩展、稳定可靠等优点。本文介绍集群的定义、E-HPC支持的集群类型和组成部分,以及集群相关的功能。

支持的集群类型

E-HPC集群根据部署环境、集群架构、调度器等分为以下几种:

部署模式

系列

说明

创建集群文档

公共云

标准版

由ECS实例组成的云上HPC集群,创建集群后,E-HPC会安装调度器、服务组件等,您需要自行维护集群服务可用性。

根据调度器类型可分为以下几种:

  • Slurm

  • OpenPBS

  • Grid Engine

创建标准版集群

托管版

由ECS实例组成的云上HPC托管集群,管理节点由E-HPC负责维护。调度器为Slurm,计算节点为ECS实例。

创建托管版集群

如何选择集群类型?

您可以参考以下几种使用场景,判断需要创建的集群类型,以便更好地满足业务需求。

管理集群