通过高性能容器应用,您可以在E-HPC集群上通过高性能容器应用启动高性能计算作业,从而降低业务部署的复杂性。高性能容器应用在支持E-HPC全部原有能力(如弹性伸缩、性能监控等)的基础上,可为您提供更加高效和便捷的计算解决方案。本文介绍如何使用高性能容器应用。
本功能默认不开放使用,如需使用,请提交工单申请。
功能优势
高便捷性:提供多种操作系统(如Ubuntu、CentOS等)和各类应用框架(如TensorFlow、Intel oneAPI等)的系统镜像,并且支持Docker和Singularity主流容器镜像,实现了高性能容器应用的开箱即用。
高兼容性:在软件方面,高性能容器应用支持开箱即用的MPI集群计算,并且可以通过PBS、Slurm等HPC调度器对任务进行编排,可支持E-HPC的自动伸缩、用户管理等平台已有功能。在硬件方面,高性能容器应用支持RoCE、InfiniBand network等高性能网络,GPU等异构计算资源,CPFS、NAS等高性能存储的使用。
高性能:借助可执行文件方式提供,其容器化应用在性能上略优于传统部署方式。
操作步骤
步骤一:选择容器应用镜像
高性能容器应用提供四种镜像获取方式,包括常用镜像、用户镜像、远程镜像和自建镜像。能够覆盖大多数集群计算场景。
登录弹性高性能计算控制台。
在顶部菜单栏左上角处,选择地域。
在左侧导航栏,选择高性能容器应用。
在高性能容器应用页面左侧镜像管理区域,选择所需的镜像页签。
常用镜像:E-HPC为您提供的优化后的镜像,包括多种操作系统(如Ubuntu,CentOS等)和各类应用框架(如TensorFlow、Intel oneAPI等)的系统镜像。
用户镜像:您可以将存储容器应用镜像的OSS地址配置在E-HPC上,以便于获取自带应用。
远程镜像:远程镜像库的容器应用获取。
自建镜像:您可以通过容器镜像定义文件,构建高性能容器应用镜像。
步骤二:拉取镜像
选择了所需镜像后,可将镜像拉取至其启动任务的集群上。
在高性能容器应用页面右侧本地镜像区域,从集群列表中选择目标集群。
在镜像管理区域对应的镜像页签下,选择要拉取的镜像,单击所在操作列的镜像获取。
在本地镜像区域,查看拉取的镜像信息。
当镜像列表显示拉取的镜像后,说明拉取镜像成功。
配置项
说明
镜像类型
容器应用的类型,目前支持Singularity、Docker。
说明Docker类型会自动转化为Singularity类型。
容器应用镜像inspect信息
容器的构建信息,便于您了解该容器应用镜像的构建规则。
步骤三:部署容器应用
拉取镜像后,您可以在容器应用中运行作业。
登录集群,将作业文件放到集群中。
具体操作,请参见导入OSS作业文件到集群中。
在高性能容器应用页面右侧本地镜像区域,从集群列表中选择目标集群。
选择目标容器应用镜像,单击操作列的启动作业。
在启动作业对话框,完成作业参数配置。
更多作业参数信息,请参见通过控制台创建作业。
单击创建作业。
删除容器应用镜像
当您不需要该容器应用镜像时,可以删除容器应用镜像。
登录弹性高性能计算控制台。
在顶部菜单栏左上角处,选择地域。
在左侧导航栏,选择高性能容器应用。
在高性能容器应用页面右侧本地镜像区域,从集群列表中选择目标集群。
在容器应用镜像列表选择要删除的容器应用镜像,单击操作列的删除。
在删除本地镜像对话框,单击确定。