提交作业

作业是E-HPC集群进行高性能计算的基本工作单元,包括Shell脚本、可执行文件等。本文介绍如何使用E-HPC客户端提交作业。

准备工作

提交作业前,您需要准备好作业文件,并上传到E-HPC集群中。

E-HPC客户端支持以下两种方式上传作业文件:

  • 通过数据管理功能,您可以新建并编辑作业文件,或者直接将本地的作业文件上传到集群。具体操作,请参见管理文件

  • 通过会话管理功能,您可以远程登录到集群,执行命令创建作业文件。具体操作,请参见管理会话

方式一:通过客户端直接提交作业

  1. 登录E-HPC客户端。

    具体操作,请参见登录客户端

  2. 在左侧导航栏,选择作业提交

  3. 单击提交作业

  4. 在弹出面板,配置作业相关参数,然后单击提交作业

    新建作业

    参数

    描述

    队列

    运行作业的队列。如果计算节点已加入到指定队列中,则必须将作业提交到对应的队列,否则作业会执行失败;如果计算节点没有加入队列,则默认将作业提交到调度器所在的默认队列中。

    作业名称

    作业的名称。

    如果需要自动下载解压作业文件,解压目录也将以作业名称进行命名。

    执行命令

    向调度器提交的作业执行命令,可以是脚本文件(如/home/test目录下的job.pbs文件),也可以是一段命令文本。有以下两种情况:

    • 脚本文件可执行,可填写相对路径,如./job.pbs

    • 脚本文件没有可执行权限,则需要填写执行命令,如:/opt/mpi/bin/mpirun /home/test/job.pbs。如果是PBS调度器,还需要在命令前加--,如:--/opt/mpi/bin/mpirun /home/test/job.pbs

    优先级

    作业运行的优先级。取值范围为0~9,取值越大,优先级越高。如果集群的调度策略设置为根据优先级调度,高优先级的作业会被优先调度运行。

    计算节点数

    用来运行此作业的计算节点数。

    任务数

    每个计算节点运行此作业使用的任务数,即进程数。

    最大内存

    每个计算节点运行此作业可使用的最大内存。默认为空,表示不限制内存大小。

    执行时间

    作业最长运行时间,超时作业将执行失败,默认为空,表示不限制运行时间。

    线程数

    每个任务所使用的线程数。默认为空,表示线程数为1。

    GPU数

    每个计算节点运行此作业使用的GPU数。配置该参数时请确保计算节点为GPU实例。

    标准输出路径、错误输出路径

    定义Linux系统的stderr、stdout输出重定向路径,包含输出文件名。

    • stdout:标准文件输出路径。

    • stderr:错误文件输出路径。

    集群用户必须有该路径的可写权限,默认按照调度器设置生成输出文件。

    添加环境变量

    可根据需要添加环境变量。

方式二:通过命令行提交作业

  1. 通过Terminal远程登录集群。

    1. 在左侧导航栏,选择会话管理

    2. 在右侧页面单击terminal

  2. 在弹出窗口,根据调度器类型执行相关命令提交作业。

    以PBS调度器为例,假设作业文件为test.pbs,则执行qsub test.pbs命令提交作业。

    更多信息,请参见通过命令行提交作业

方式三:通过作业模板提交作业

  1. 创建作业模板。

    1. 作业提交页面,单击提交作业

    2. 新建作业面板,配置作业相关参数。

      参数说明请参见作业参数说明表

    3. 单击保存为模板

    4. 在弹出的对话框中输入模板名称,单击确定

  2. 作业提交页面的作业提交模板区域,找到目标作业模板,单击对应的提交作业图标图标。

    作业模板

    说明

    作业模板区域以卡片的形式展示作业模板,您可以根据需要单击卡片底部的图标进行提交作业、编辑或者删除作业模板操作。

  3. 在弹出面板,确认作业相关参数,单击提交作业

方式四:通过应用中心提交作业

E-HPC客户端提供了可视化的界面来配置GROMACS、Fluent等软件应用,方便您配置应用相关的作业参数,可以快速提交作业。更多信息,请参见运行应用