阿里云首页 弹性高性能计算E-HPC 相关技术圈

使用高性能容器应用

通过高性能容器应用,您可以在E-HPC集群上通过高性能容器应用启动高性能计算作业,从而降低业务部署的复杂性。高性能容器应用在支持E-HPC全部原有能力(如弹性伸缩、性能监控等)的基础上,可为您提供更加高效和便捷的计算解决方案。本文介绍如何使用高性能容器应用。

优势

  • 高便捷性:提供多种操作系统(如Ubuntu、CentOS等)和各类应用框架(如TensorFlow、Intel oneAPI等)的系统镜像,并且支持Docker和Singularity主流容器镜像,实现了高性能容器应用的开箱即用。

  • 高兼容性:在软件方面,高性能容器应用支持开箱即用的MPI集群计算,并且可以通过PBS、Slurm等HPC调度器对任务进行编排,可支持E-HPC的自动伸缩、用户管理等平台已有功能。在硬件方面,高性能容器应用支持RoCE、InfiniBand network等高性能网络,GPU等异构计算资源,CPFS、NAS等高性能存储的使用。

  • 高性能:借助可执行文件方式提供,其容器化应用在性能上略优于传统部署方式。

操作步骤

步骤一:选择容器应用镜像

高性能容器应用提供四种镜像获取方式,包括常用镜像、用户镜像、远程镜像和自建镜像。能够覆盖大多数集群计算场景。

  1. 登录弹性高性能计算控制台

  2. 在顶部菜单栏左上角处,选择地域。

  3. 在左侧导航栏,选择资源管理 > 高性能容器应用

  4. 高性能容器应用页面,在集群列表选择集群,然后单击镜像管理页签。

  5. 选择所需的镜像页签。

    • 常用镜像:E-HPC为您提供的优化后的镜像,包括多种操作系统(如Ubuntu,CentOS等)和各类应用框架(如TensorFlow、Intel oneAPI等)的系统镜像。

    • 用户镜像:您可以将存储容器应用镜像的OSS地址配置在E-HPC上,以便于获取自带应用。

    • 远程镜像:远程镜像库的容器应用获取。

    • 自建镜像:您可以通过容器镜像定义文件,构建高性能容器应用镜像。

步骤二:拉取镜像

您在选择了所需镜像后,可将镜像拉取至其启动任务的集群上。

  1. 镜像管理对应的镜像页签下,选择要拉取的镜像,单击所在操作列的镜像获取

  2. 单击本地镜像页签。

    当镜像列表显示拉取的镜像后,说明拉取镜像成功。

    配置项

    说明

    镜像类型

    容器应用的类型,目前支持Singularity、Docker。

    说明

    Docker类型会自动转化为Singularity类型。

    容器应用镜像inspect信息

    容器的构建信息,便于您了解该容器应用镜像的构建规则。

步骤三:部署容器应用

拉取镜像后,您可以在容器应用中运行作业。

  1. 登录集群,将作业文件放到集群中。

    具体操作,请参见导入OSS作业文件到集群中

  2. 高性能容器应用页面,单击本地镜像页签。

  3. 选择目标容器应用镜像,单击操作列的启动作业

  4. 启动作业对话框,完成作业参数配置。

    更多作业参数信息,请参见通过控制台创建作业

  5. 单击创建作业

删除容器应用镜像

当您不需要该容器应用镜像时,可以删除容器应用镜像。

  1. 登录弹性高性能计算控制台

  2. 在顶部菜单栏左上角处,选择地域。

  3. 在左侧导航栏,选择资源管理 > 高性能容器应用

  4. 高性能容器应用页面,单击本地镜像页签。

  5. 在容器应用镜像列表选择要删除的容器应用镜像,单击操作列的删除

  6. 删除本地镜像对话框,单击确定

首页 弹性高性能计算E-HPC 用户指南 使用高性能容器应用