作业是E-HPC集群进行高性能计算的基本工作单元,包括Shell脚本、可执行文件等。本文介绍如何使用E-HPC客户端提交作业。
准备工作
提交作业前,您需要准备好作业文件,并上传到E-HPC集群中。
E-HPC客户端支持以下两种方式上传作业文件:
方式一:通过客户端直接提交作业
登录E-HPC客户端。
具体操作,请参见登录客户端。
在左侧导航栏,选择作业提交。
单击提交作业。
在弹出面板,配置作业相关参数,然后单击提交作业。
参数
描述
队列
运行作业的队列。如果计算节点已加入到指定队列中,则必须将作业提交到对应的队列,否则作业会执行失败;如果计算节点没有加入队列,则默认将作业提交到调度器所在的默认队列中。
作业名称
作业的名称。
如果需要自动下载解压作业文件,解压目录也将以作业名称进行命名。
执行命令
向调度器提交的作业执行命令,可以是脚本文件(如
/home/test
目录下的job.pbs文件),也可以是一段命令文本。有以下两种情况:脚本文件可执行,可填写相对路径,如
./job.pbs
。脚本文件没有可执行权限,则需要填写执行命令,如:
/opt/mpi/bin/mpirun /home/test/job.pbs
。如果是PBS调度器,还需要在命令前加--
,如:--/opt/mpi/bin/mpirun /home/test/job.pbs
。
优先级
作业运行的优先级。取值范围为0~9,取值越大,优先级越高。如果集群的调度策略设置为根据优先级调度,高优先级的作业会被优先调度运行。
计算节点数
用来运行此作业的计算节点数。
任务数
每个计算节点运行此作业使用的任务数,即进程数。
最大内存
每个计算节点运行此作业可使用的最大内存。默认为空,表示不限制内存大小。
执行时间
作业最长运行时间,超时作业将执行失败,默认为空,表示不限制运行时间。
线程数
每个任务所使用的线程数。默认为空,表示线程数为1。
GPU数
每个计算节点运行此作业使用的GPU数。配置该参数时请确保计算节点为GPU实例。
标准输出路径、错误输出路径
定义Linux系统的stderr、stdout输出重定向路径,包含输出文件名。
stdout:标准文件输出路径。
stderr:错误文件输出路径。
集群用户必须有该路径的可写权限,默认按照调度器设置生成输出文件。
添加环境变量
可根据需要添加环境变量。
方式二:通过命令行提交作业
通过Terminal远程登录集群。
在左侧导航栏,选择会话管理。
在右侧页面单击terminal。
在弹出窗口,根据调度器类型执行相关命令提交作业。
以PBS调度器为例,假设作业文件为test.pbs,则执行
qsub test.pbs
命令提交作业。更多信息,请参见通过命令行提交作业。
方式三:通过作业模板提交作业
创建作业模板。
在作业提交页面,单击提交作业。
在新建作业面板,配置作业相关参数。
参数说明请参见作业参数说明表。
单击保存为模板。
在弹出的对话框中输入模板名称,单击确定。
在作业提交页面的作业提交模板区域,找到目标作业模板,单击对应的图标。
说明作业模板区域以卡片的形式展示作业模板,您可以根据需要单击卡片底部的图标进行提交作业、编辑或者删除作业模板操作。
在弹出面板,确认作业相关参数,单击提交作业。
方式四:通过应用中心提交作业
E-HPC客户端提供了可视化的界面来配置GROMACS、Fluent等软件应用,方便您配置应用相关的作业参数,可以快速提交作业。更多信息,请参见运行应用。