阿里云首页 弹性高性能计算E-HPC

基本概念

本文汇总使用弹性高性能计算E-HPC过程中涉及的基本概念,方便您查询和了解相关概念。

使用弹性高性能计算涉及的相关概念如下表所示。

概念

说明

集群

集群指运行高性能计算的节点集合,可以提供单节点不能提供的强大计算能力,拥有高性能、弹性扩展、稳定可靠等优点。集群包含弹性公网IP、集群节点、调度器、域账号、集群用户、运行软件等资源。

节点

每个集群包含管控节点、计算节点和登录节点。每个节点是一台ECS实例。

镜像

镜像提供集群所有节点所需的信息。包含了操作系统、预装软件,以及部署的业务或应用数据。

用户

用户用于在集群中提交作业时标识身份。E-HPC支持创建两种权限的用户:

  • 普通权限组:适用于只有提交、调试作业需求的普通用户。

  • sudo权限组:适用于需要管理集群的管理员,除提交、调试作业外,还可以执行sudo命令进行安装软件、重启节点等操作。

作业

作业指提交到E-HPC集群进行高性能计算的基本工作单元,包括Shell脚本、可执行文件等。

调度器

调度器指集群上调度作业的软件。

域账号

E-HPC支持创建NIS和LDAP两种域账号服务。

  • NIS:网络信息服务(Network Information Service),是一种集中身份管理的方式。您可以在NIS服务器上建立用户,当新节点加入到NIS中时,便可以使用NIS服务器中的用户来登录这个节点,而不需要在每个节点上都建立同样的用户。

  • LDAP:轻型目录访问协议(Lightweight Directory Access Protocol),在E-HPC中,LDAP被用来对用户进行身份权限认证。您可以在LDAP中对用户进行授权,分组,以创建具有不同的访问权限的用户。

可视化服务

创建可视化服务后,您可以通过E-HPC管理控制台远程打开云桌面或APP,进行高性能计算的图形化前后处理工作。

高性能容器应用

通过高性能容器应用,您可以在E-HPC集群上通过容器应用完成高性能计算作业,利用E-HPC集群的强大算力和容器的便捷部署等优势提高作业效率。

自动伸缩

E-HPC自动伸缩可以根据您配置的伸缩策略动态分配计算节点,系统可以根据实时负载自动增加或减少计算节点。可以帮您合理利用资源,减少使用成本。