基本概念

本文汇总使用弹性高性能计算E-HPC过程中涉及的基本概念,方便您查询和了解相关概念。

使用弹性高性能计算涉及的相关概念如下表所示。

概念

说明

集群

集群指运行高性能计算的节点集合,可以提供单节点不能提供的强大计算能力,拥有高性能、弹性扩展、稳定可靠等优点。集群包含弹性公网IP、集群节点、调度器、域账号、集群用户、运行软件等资源。

节点

每个集群包含管理节点、计算节点和登录节点。每个节点是一台ECS实例。

队列

队列是E-HPC中用于分类计算节点,以便更高效地管理和筛选不同作业和任务的计算节点集合。

镜像

镜像提供集群所有节点所需的信息。包含了操作系统、预装软件,以及部署的业务或应用数据。

用户

用户用于在集群中提交作业时标识身份。E-HPC支持创建两种权限的用户:

  • 普通权限组:适用于只有提交、调试作业需求的普通用户。

  • sudo权限组:适用于需要管理集群的管理员,除提交、调试作业外,还可以执行sudo命令进行安装软件、重启节点等操作。

作业

作业指提交到E-HPC集群进行高性能计算的基本工作单元,包括Shell脚本、可执行文件等。

调度器

调度器指集群上调度作业的软件。

自动伸缩

E-HPC自动伸缩可以根据您配置的伸缩策略动态分配计算节点,系统可以根据实时负载自动增加或减少计算节点。这可以帮您合理利用资源,减少使用成本。

自定义服务

支持安装自定义服务组件,能与集群服务联通,提供额外附加功能和使用界面,以类SaaS化方案帮助用户使用集群资源。

域账号

域账号是指在域管理环境中创建的用户账号,它允许用户在加入到域的多个设备和资源上进行统一的身份验证。在E-HPC集群中,域账号可以用于管理和控制用户对集群资源的访问。

E-HPC Portal

E-HPC Portal是E-HPC提供的用于日常管理作业的Web门户,支持作业提交和查询、数据管理等功能,可以方便不同的用户进行操作。

可视化服务

登录节点配置Web Portal服务后,您可以通过E-HPC管理控制台或打开对应网址进入E-HPC Portal,进行高性能计算的图形化前后处理工作。