快速使用E-HPC Instant计算服务

本文介绍E-HPC Instant计算服务的使用流程,帮助您快速上手使用E-HPC Instant计算服务。

前提条件

开通E-HPC Instant计算服务

使用流程

image

步骤:添加应用

E-HPC公共应用中提供了业界主流的科学计算应用、编译器运行时库、MPI通信库等软件。如果公共应用列表中没有您需要的应用和版本,您需要添加应用。

  1. 登录Instant 计算服务控制台-我的应用页面。

  2. 在顶部菜单栏左上角处,选择地域。

  3. 在弹出的对话框中,完成以下参数配置。

    参数

    是否必选

    说明

    镜像名称

    填写应用名称。

    版本

    填写应用版本。

    描述

    填写待添加应用的描述信息,字符数限制为0~100个字符。

    镜像类型

    根据实际情况选择镜像类型:

    • 虚拟机镜像:包含完整操作系统和应用程序的独立单元。

    • 容器镜像:仅包含运行特定应用程序所需的最小环境。

    镜像

    根据所选镜像类型,进行相应操作:

    • 若选择虚拟机镜像,则从下拉列表中选择相应的镜像。

    • 若选择容器镜像,则需填写容器镜像的地址。

  4. 单击确定

    单击右上角的image图标刷新列表,如果应用列表中出现目标名称的应用,说明您已经成功添加应用。

步骤:创建作业

  1. 单击已上传的应用下的使用

    系统会自动跳转到创建作业页面,并默认选择该应用。您也可以在Instant 计算服务控制台-作业列表页面,单击创建作业

    image

  2. 创建作业页面,完成以下参数配置。

    • 作业信息

      参数项

      是否必选

      说明

      作业名称

      填写作业任务的名称。需满足以下条件:

      • 长度为2~64个字符。

      • 必须以英文字母开头。

      • 仅支持使用英文字母、数字和短划线(-)。

      区域

      选择作业执行所在的地域,以便优化网络延迟和成本。

      调度策略

      选择运行作业的调度策略,当前仅支持标准型调度策略。

      说明

      如需使用经济型调度策略,请提交工单申请。

      网络及可用区

      选择专有网络和交换机后,E-HPC Instant计算服务会自动为作业执行节点挂载网卡,确保与您的数据存储(NAS)之间的网络交互。

      安全组

      选择安全组后,E-HPC Instant计算服务会自动为作业执行节点添加安全组。

      单节点弹性公网IP

      开启此功能后,节点将自动申请并分配弹性公网IP,从而确保节点能够通过互联网进行访问。

      重要

      启用弹性公网IP会产生额外费用,建议您根据实际需要决定是否启用单节点弹性公网IP

      标签

      选择一个或多个标签,便于后续的资源搜索和成本分析。更多信息,请参见标签

    • 任务详情

      参数项

      是否必选

      说明

      计算环境

      选择运行作业所需的计算环境。包括以下两种:

      • 云服务器

      • 容器

      应用

      选择作业任务运行的具体应用,即镜像环境。

      运行模式

      选择执行作业任务的模式,分为以下两种模式:

      • 批处理作业:执行用户命令后自动释放节点。

      • 后台服务:支持长时间运行,需手动删除作业后才释放节点。

      前处理脚本

      填写在作业开始运行之前需要执行的脚本命令。

      执行命令

      条件必选

      在作业节点上运行的具体命令或脚本,当运行模式批处理作业时必选。

      • Linux应用:必须为以#!开头,并且后面添加执行程序,例如#! /bin/bash

      • Windows应用:命令首行必须为[powershell][bat]

      执行节点数

      设定执行作业任务所需的节点总数。

    • 任务资源

      参数项

      是否必选

      说明

      单节点核数

      根据业务需求选择每个执行节点所需的CPU核数和内存大小。

      说明

      单节点的CPU核数与内存大小必须符合固定比例。更多信息,请参见使用限制

      单节点内存大小

      单节点计算存储空间

      所选存储资源的大小应大于应用镜像的大小,并且:

      • 应用为系统应用时,存储空间≥40 GiB。

      • 应用为个人应用时,存储空间≥20 GiB。

    • 访问外部存储

      参数项

      说明

      挂载目录

      输入挂载目录。

      类型

      当前仅支持通用型NAS

      文件系统挂载点

      选择要挂载的文件系统ID和挂载点,请确保该文件系统还有可用的挂载点余量。

      文件系统目录

      输入要挂载的文件系统目录。

      挂载选项

      选择挂载协议。

    • 更多设置

      参数项

      说明

      登录密码

      当您需要远程登录节点时,需要设置登录密码确认密码

      说明

      仅当计算环境云服务器时才能设置密码。

      确认密码

      资源调度限制

      支持以下两种调度方式:

      • :支持在指定的VPC下调度资源。

      • 仅在指定交换机下:创建的执行节点在指定的交换机下。

  3. 参数配置完成后,单击页面下方的创建作业

步骤:查看作业运行详情

  1. 创建完成后,已创建的作业将出现在作业列表中。您可以通过标签、状态和时间筛选需要查看的作业。

  2. 单击作业ID/名称列下的目标作业ID操作列下的查看详情

  3. 在作业详情页面,您可以查看作业的基础信息、任务运行情况和各个执行节点的状态。

    • 基本信息:展示了作业ID、作业状态、资源分配策略等基本信息。

    • 执行节点情况:展示了运行作业的执行节点情况,包括总执行任务数运行中任务数已完成任务数已终止任务数

    • 任务运行情况:展示了任务个数、任务状态、运行任务的节点资源等。

      image

  4. 查看作业的运行情况。

    • 监控数据:包括CPU利用率、内存利用率和磁盘使用率。

    • 运行日志:包括前处理脚本(PrologScript)和执行命令(Script)的运行日志。

    • 远程登录:出现异常情况时,您可以登录到执行节点上,排查具体问题。