什么是弹性高性能计算E-HPC

弹性高性能计算E-HPC(Elastic High Performance Computing)是阿里云提供的性能卓越、稳定可靠、弹性扩展的高性能计算服务。弹性高性能计算将计算能力积聚,用并行计算方式解决更大规模的科学、工程和商业问题,在科研机构、石油勘探、金融市场、气象预报、生物制药、基因测序、图像处理等行业均有广泛的应用。

产品架构

弹性高性能计算的产品架构如下图所示。

架构图

弹性高性能计算和其他产品的关系如下表所示。

产品

说明

相关文档

云服务器ECS

ECS是集群的组成部分,根据使用功能作为集群的登录节点、管控节点和计算节点。

  • 登录节点:可以进行软件安装、编译和调试,作业提交等操作。

  • 管控节点:包括调度器服务器和域账号服务器。

    • 调度器服务器:运行调度器客户端,管理调度节点,处理作业提交。

    • 域账号服务器:管理集群内的用户。

  • 计算节点:运行高性能计算作业,其配置决定了E-HPC集群的总体性能。

安全组是一种虚拟防火墙,具备集群节点状态检测和数据包过滤能力,用于在云端划分安全域。

专有网络VPC

您自己专有的云上私有网络,不同的专有网络之间逻辑上彻底隔离。您可以在专有网络内创建和管理集群。

什么是专有网络VPC

弹性公网IP(EIP)

集群内的登录节点默认会绑定EIP,并开启一定量的公网带宽,用于访问公网。

什么是弹性公网IP

阿里云文件存储NAS(Apsara File Storage)

文件存储服务为集群中所有节点提供文件共享路径。

什么是文件存储NAS

对象存储OSS(Object Storage Service)

对象存储服务可以存储您的作业数据及执行文件,您可以将对象存储服务内的作业数据及执行文件导入E-HPC集群。

什么是对象存储OSS

功能特性

弹性高性能计算E-HPC主要提供以下功能。

功能

功能描述

参考

创建计算资源

进行E-HPC计算前,需要先创建E-HPC计算集群,用于后续提交、运行作业,查看作业结果。

配置计算资源

E-HPC支持计算资源的多种配置管理,包括集群用户管理、节点管理、调度器队列管理、集群自动伸缩等配置。

提交作业

通过控制台即可提交作业,小型作业脚本可以在控制台直接编辑提交,大型作业可通过OSS上传提交。您也可以直接通过远程SSH命令行的方式访问集群提交作业。

性能分析

通过E-HPC优化器功能,您可以监控作业运行时的集群性能数据,包括实时数据和历史数据,同时您还可以选择所需进程进行性能剖析。

E-HPC优化器

可视化处理

通过E-HPC的远程可视化功能,您在控制台上即可直观地处理作业。

远程可视化