什么是弹性高性能计算E-HPC

弹性高性能计算E-HPC(Elastic High Performance Computing)是阿里云提供的性能卓越、稳定可靠、弹性扩展的高性能计算服务。弹性高性能计算将计算能力积聚,用并行计算方式解决更大规模的科学、工程和商业问题,在科研机构、石油勘探、金融市场、气象预报、生物制药、基因测序、图像处理等行业均有广泛的应用。

为什么选择弹性高性能计算E-HPC

相较于其他HPC集群,阿里云弹性高性能计算E-HPC产品具有灵活部署、弹性资源、数据安全、高可用性、结果可视等特点。

弹性高性能计算E-HPC的优势

  • 灵活部署

    您可以在E-HPC控制台快速创建高性能计算集群。一键部署需要的高性能计算环境和应用软件,帮助您快速创建出处理能力出色的集群,创建完成后即可提交作业开始计算。

  • 弹性资源

    根据需求或任务队列使用率,E-HPC自动识别节点的负载情况,动态调整云上资源。没有作业排队时,自动缩容到配置的最小节点数量,当有作业提交到调度器队列后,自动创建相应数量的节点进行计算,充分有效地利用资源。

  • 数据安全

    • 基于专有网络VPC实现的网络访问隔离,专有网络内的集群节点使用安全组防火墙进行三层网络访问控制。充分保证了集群网络的安全性。

    • 集群数据保存在阿里云文件存储NAS中,利用NAS的传输加密与存储加密特性,保障集群数据不被窃取或篡改。NAS的数据在后端进行多副本存储,能够有效地降低数据安全风险。

  • 高可用性

    E-HPC集群节点基于云服务器ECS、超级计算集群SCC和GPU云服务器组建,大大提高了集群的可用性

  • 结果可视

    E-HPC提供可视化服务功能,您可以通过可视化服务功能将计算结果转换为可读的图形化数据。例如您可以直接观看渲染后的动画效果,或者直接查看天气变化的动态图。

  • 快速上云

    E-HPC支持主流的HPC调度器和工具,确保用户能够保留原有的作业脚本和命令习惯,无需对作业脚本或命令进行适配调整,大幅降低了迁移到云平台的学习成本。

E-HPC与传统计算集群对比的优势

对比项

E-HPC

传统计算集群

部署

  • 无需排期,即买即用,快速得到计算结果。

  • 产品规格丰富,可根据使用场景灵活选择适用规格。

  • 由于传统计算集群资源有限,多用户使用时需排队等待。

  • 线下扩容采购周期长,部署周期长。

安全

数据保存在云端,高可靠存储,安全无忧。

数据保存在客户端,用户行为不可控,安全难以保障。

成本

  • 按需自动扩容缩容资源,在保证服务可靠可用的前提下,有效降低成本。

  • 使用E-HPC无需顾虑硬件升级换代。

  • 提供优化的软件许可证和调度机制,节约成本。

  • 按使用峰值购买设备,利用率较低。

  • 需一次性购置基础硬件设施,成本压力大。

  • 需要考虑硬件设施的升级换代,增加集群成本。

运维

  • 自动运维,弹性伸缩自动替换不健康的节点。

  • E-HPC提供了高性能计算领域的多款软件,并且跟随E-HPC产品一起升级。

  • 资源采购和交付周期长,升级、变配困难。

  • 需配备专业运维人员。

应用场景

您可以根据不同的应用场景配置不同的资源类型。

气象预报

E-HPC结合数值模型计算分析气象数据与环境数据,可以预测天气、环境等气象信息。

能源勘探

E-HPC可以帮助勘探行业进行勘探数据分析,分析并模拟出勘测区域的地质构造,从而精确寻找资源位置。

生命科学

  • 生物信息学:使用E-HPC对大量生物基因组进行测序等处理,从而获取基因组信息和数据分析结果,来解决生物和医学领域的难题。

  • 动力学模拟:使用E-HPC进行大规模的分子动力模拟,来预测分析生物蛋白质分子、脂质分子间的相互作用和变化。

  • 新药研发:E-HPC帮助研发人员实现大量小分子库的快速并发处理。

科研教育

E-HPC可以给政府、高校和超算中心提供超算服务,用于研究过程中的数值模拟、仿真验证等工作。让教育专家和科学研究者专注于本学科的基础研究,省去了学习和掌握处理器和超算知识的时间。

仿真制造

制造业能够利用高性能且弹性的计算集群,来辅助分析复杂工程架构和力学结构,通过大量数据仿真模拟优化产品结构和性能。E-HPC涉及到的仿真制造有智能汽车,航天航空,机械建筑等方面。

动画渲染

E-HPC支持大规模多机并发业务,应用于影视动画行业进行图形渲染。

如何使用弹性高性能计算E-HPC

集群

功能描述

参考

创建用户

用户用于在集群中提交作业时标识身份。E-HPC集群支持创建具有不同权限的用户,方便区分管理员和普通用户。

用户

配置计算资源

E-HPC支持计算资源的多种配置管理,包括集群节点管理、调度器队列管理、集群自动伸缩等配置。

节点与队列

提交作业

通过控制台即可提交作业,小型作业脚本可以在控制台直接编辑提交,大型作业可通过OSS上传提交。您也可以直接通过远程SSH命令行的方式访问集群提交作业。

性能分析

通过E-HPC Portal,您可以监控作业运行时的集群性能数据,包括实时数据和历史数据,同时您还可以选择所需进程进行性能剖析。

E-HPC Portal功能概述

可视化处理

您在E-HPC Portal上使用应用即可直观地处理作业。

运行VNCViewer可视化访问集群