快速开启GROMACS分析任务

本文以在E-HPC集群中使用GROMACS软件运行水分子算例进行高性能计算为例,介绍如何利用E-HPC Portal快速运行作业。

更多关于E-HPC Portal信息,请参见E-HPC Portal功能概述

准备工作

  • 已创建服务关联角色。首次登录E-HPC控制台,系统会提示您创建E-HPC服务关联角色。

  • 已创建专有网络VPC和交换机。具体操作,请参见创建专有网络创建交换机

  • 已创建存储资源。E-HPC集群支持挂载NAS和CPFS文件系统,可按需选择。

步骤一:使用模板创建集群

  1. 进入集群列表页面。

    1. 登录弹性高性能计算控制台

    2. 在顶部菜单栏左上角处,选择地域。

    3. 在左侧导航栏,单击集群

  2. 单击集群模板,在弹出对话框中,找到生命科学集群区域,在Gromacs中单击创建集群按钮。

    image

    说明

    该模板默认包含1个管理节点、1个登录节点和1个计算节点,规格如下:

    • 管理节点和登录节点:均采用ecs.c8y.xlarge实例规格,该规格配置为4 vCPU,8 GiB内存。

    • 计算节点:采用ecs.c8y.16xlarge实例规格,该规格配置为64 vCPU、128 GiB内存。

  3. 完成集群名称、密码设置,并确认配置信息无误,然后单击创建集群

步骤二:使用E-HPC Portal提交作业

  1. 在集群中提交作业前,您需要为集群新增用户。本文以创建testuser用户为例。

    具体操作,请参见用户管理

  2. 使用testuser用户登录E-HPC Portal。

    具体操作,请参见登录E-HPC Portal

  3. 上传数据。

    1. 单击页面右上角image图标,通过Workbench远程连接集群。

    2. 执行以下命令,下载并解压算例。

      说明

      本算例为模拟大量水分子在给定空间、温度内的运动过程。

      cd /home/testuser;
      wget https://public-ehpc-package.oss-cn-hangzhou.aliyuncs.com/water_GMX50_bare.tar.gz;
      tar xzvf water_GMX50_bare.tar.gz;
      chown -R testuser water-cut1.0_GMX50_bare;
      chgrp -R users water-cut1.0_GMX50_bare
    3. 执行以下命令,创建脚本文件。

      vim /home/testuser/testjob.slurm

      添加以下内容至脚本文件中:

      说明

      本示例使用名为testuser的用户提交作业,在一个包含8 vCPU、128 GiB内存的计算节点compute000上运行。在实际使用场景中您可根据集群配置情况做出适当修改。

      #!/bin/sh
      #SBATCH --job-name=testjob
      #SBATCH --nodes=1
      #SBATCH --ntasks-per-node=1
      
      export MODULEPATH=/opt/ehpcmodulefiles/   #module命令依赖的环境变量
      module load gromacs/2024.1 
      module load mpich/4.0.3
      module load armpl/24.04
      module load libfabric/1.20.0
      module load gcc/12.3.0 
      
      cd /home/testuser/water-cut1.0_GMX50_bare/0096
      
      gmx_mpi grompp -f pme.mdp -c conf.gro -p topol.top -o topol_pme.tpr  
      mpirun -np 32  gmx_mpi mdrun -ntomp 1 -nsteps 100000  -pin on -s topol_pme.tpr 
  4. 在顶部导航栏,选择任务管理

  5. 在页面上方,单击submitter

  6. 创建作业页面,填写以下作业信息。

    参数

    示例

    说明

    作业名称

    testjob

    作业的名称。

    作业队列

    comp

    运行作业的队列。

    执行命令

    选择本地文件/home/testuser/testjob.slurm

    向调度器提交的作业执行命令,可以是脚本文件,也可以是一段命令文本。

  7. 单击提交作业

步骤三:查看作业结果

  1. 在顶部导航栏,选择任务管理

  2. 在作业列表页面,找到目标作业。

    当作业状态为COMPLETED时,表示作业已执行完成。

    image

  3. 单击作业ID查看作业详情。

(可选)步骤四:释放集群

当您不再需要该集群提供服务时,您可以释放该集群,以免产生额外的费用。

重要

集群释放后,无法恢复数据,请谨慎操作。

  1. 进入集群列表页面。

    1. 登录弹性高性能计算控制台

    2. 在顶部菜单栏左上角处,选择地域。

    3. 在左侧导航栏,单击集群

  2. 集群列表页面,找到目标集群,在右上角选择集群更多按钮.png > 释放集群

  3. 在弹出的删除集群对话框中,单击确认