通过submitter提交作业

对于节点为ECS实例的集群,在E-HPC Portal上,您可以通过submitter提交作业。本文介绍如何通过submitter提交作业。

前提条件

集群状态处于运行中

准备工作

提交作业前,您需要准备好作业文件,并上传到E-HPC集群中。

E-HPC Portal支持以下方式上传作业文件:

  • 通过数据管理功能:支持直接在集群文件夹下新建并编辑作业文件,或者从本地上传作业文件到集群,也可以从OSS Bucket中下载文件到集群。

  • 通过远程连接功能:在右上角单击连接.png图标可以远程连接集群,然后执行命令创建作业文件。

操作步骤

  1. 打开并登录E-HPC Portal。

    具体操作,请参见登录E-HPC Portal

  2. 在顶部导航栏,选择任务管理

  3. 在页面上方,单击submitter

  4. 创建作业页面,填写以下作业信息。

    说明

    如果后续需要重复提交相同的作业,可以在配置完作业信息后,单击另存为模板,将当前配置信息保存为模板。在下一次提交作业时,可以在页面左侧选择模板。

    • 基本参数

      参数

      说明

      用户名称

      如果您的集群类型为SLURM,并且以root用户登录E-HPC Portal,则您可以选择以root或者其他指定的普通用户身份提交作业。

      重要

      指定非root用户时,请确保目标用户已登录并使用E-HPC Portal提交过作业任务。

      作业名称

      作业的名称。

      如果需要自动下载解压作业文件,解压目录也将以作业名称进行命名。

      输入文件

      作业的输入文件。请先输入命令行标记(例如-input),然后选择输入文件(例如/home/testuser/in.txt)。

      输出文件

      作业的输出文件。请先输入命令行标记(例如-output),然后输入输出文件的路径(例如/home/testuser/out.txt)。

      作业队列

      运行作业的队列。

      如果计算节点已加入到指定队列中,则必须将作业提交到对应的队列,否则作业会执行失败;如果计算节点没有加入队列,则默认将作业提交到调度器所在的默认队列中。

      执行命令

      向调度器提交的作业执行命令,可以是脚本文件,也可以是一段命令文本。您可以通过以下三种方式提交:

      • 在线编辑

      • 本地文件

      • 上传文件

      说明
      • 如果脚本文件可执行,可以填写相对路径,如./job.pbs

      • 如果脚本文件没有可执行权限,则需要填写执行命令,如:/opt/mpi/bin/mpirun /home/test/job.pbs

      优先级

      作业运行的优先级。取值范围为0~9,取值越大,优先级越高。

      如果集群的调度策略设置为根据优先级调度,高优先级的作业会被优先调度运行。

      计算节点数

      用来运行此作业的计算节点数。

      任务数

      每个计算节点运行此作业使用的任务数,即进程数。

      线程数

      每个任务所使用的线程数。默认为空,表示线程数为1。

      Gpu数

      每个计算节点运行此作业使用的GPU数。配置该参数时请确保计算节点为GPU实例。

    • 高级参数

      参数

      说明

      MPI性能剖析

      选择是否开启MPI性能剖析。

      最大内存

      每个计算节点运行此作业可使用的最大内存。默认为空,表示不限制内存大小。格式为数量+单位,例如1GB,200MB等。

      最大执行时间

      作业最长运行时间,超时作业将执行失败,默认为空,表示不限制运行时间。例如1小时可填写01:00:00

      日志文件

      作业相关日志的保存路径,确保拥有可写权限的路径,默认按照调度器行为输出文件。

      添加环境变量

      根据需要添加环境变量。

  5. 单击提交作业

后续步骤

提交作业后,您可以在任务管理页面下方查询作业。具体操作,请参见查询作业