对于节点为ECS实例的集群,在E-HPC Portal上,您可以通过submitter提交作业。本文介绍如何通过submitter提交作业。
前提条件
集群状态处于运行中。
准备工作
提交作业前,您需要准备好作业文件,并上传到E-HPC集群中。
E-HPC Portal支持以下方式上传作业文件:
通过数据管理功能:支持直接在集群文件夹下新建并编辑作业文件,或者从本地上传作业文件到集群,也可以从OSS Bucket中下载文件到集群。
通过远程连接功能:在右上角单击图标可以远程连接集群,然后执行命令创建作业文件。
操作步骤
打开并登录E-HPC Portal。
具体操作,请参见登录E-HPC Portal。
在顶部导航栏,选择任务管理。
在页面上方,单击submitter。
在创建作业页面,填写以下作业信息。
说明如果后续需要重复提交相同的作业,可以在配置完作业信息后,单击另存为模板,将当前配置信息保存为模板。在下一次提交作业时,可以在页面左侧选择模板。
基本参数
参数
说明
用户名称
如果您的集群类型为SLURM,并且以root用户登录E-HPC Portal,则您可以选择以root或者其他指定的普通用户身份提交作业。
重要指定非root用户时,请确保目标用户已登录并使用E-HPC Portal提交过作业任务。
作业名称
作业的名称。
如果需要自动下载解压作业文件,解压目录也将以作业名称进行命名。
输入文件
作业的输入文件。请先输入命令行标记(例如
-input
),然后选择输入文件(例如/home/testuser/in.txt
)。输出文件
作业的输出文件。请先输入命令行标记(例如
-output
),然后输入输出文件的路径(例如/home/testuser/out.txt
)。作业队列
运行作业的队列。
如果计算节点已加入到指定队列中,则必须将作业提交到对应的队列,否则作业会执行失败;如果计算节点没有加入队列,则默认将作业提交到调度器所在的默认队列中。
执行命令
向调度器提交的作业执行命令,可以是脚本文件,也可以是一段命令文本。您可以通过以下三种方式提交:
在线编辑
本地文件
上传文件
说明如果脚本文件可执行,可以填写相对路径,如
./job.pbs
。如果脚本文件没有可执行权限,则需要填写执行命令,如:
/opt/mpi/bin/mpirun /home/test/job.pbs
。
优先级
作业运行的优先级。取值范围为0~9,取值越大,优先级越高。
如果集群的调度策略设置为根据优先级调度,高优先级的作业会被优先调度运行。
计算节点数
用来运行此作业的计算节点数。
任务数
每个计算节点运行此作业使用的任务数,即进程数。
线程数
每个任务所使用的线程数。默认为空,表示线程数为1。
Gpu数
每个计算节点运行此作业使用的GPU数。配置该参数时请确保计算节点为GPU实例。
高级参数
参数
说明
MPI性能剖析
选择是否开启MPI性能剖析。
最大内存
每个计算节点运行此作业可使用的最大内存。默认为空,表示不限制内存大小。格式为
数量+单位
,例如1GB,200MB等。最大执行时间
作业最长运行时间,超时作业将执行失败,默认为空,表示不限制运行时间。例如1小时可填写
01:00:00
。日志文件
作业相关日志的保存路径,确保拥有可写权限的路径,默认按照调度器行为输出文件。
添加环境变量
根据需要添加环境变量。
单击提交作业。
后续步骤
提交作业后,您可以在任务管理页面下方查询作业。具体操作,请参见查询作业。