本文介绍E-HPC Instant计算服务的使用流程,帮助您快速上手使用E-HPC Instant计算服务。
前提条件
使用流程
步骤一:添加应用
E-HPC公共应用中提供了业界主流的科学计算应用、编译器运行时库、MPI通信库等软件。如果公共应用列表中没有您需要的应用和版本,您需要添加应用。
登录Instant 计算服务控制台-我的应用页面。
在顶部菜单栏左上角处,选择地域。
在弹出的对话框中,完成以下参数配置。
参数
是否必选
说明
镜像名称
是
填写应用名称。
版本
否
填写应用版本。
描述
否
填写待添加应用的描述信息,字符数限制为0~100个字符。
镜像类型
是
根据实际情况选择镜像类型:
虚拟机镜像:包含完整操作系统和应用程序的独立单元。
容器镜像:仅包含运行特定应用程序所需的最小环境。
镜像
是
根据所选镜像类型,进行相应操作:
若选择虚拟机镜像,则从下拉列表中选择相应的镜像。
若选择容器镜像,则需填写容器镜像的地址。
单击确定。
单击右上角的
图标刷新列表,如果应用列表中出现目标名称的应用,说明您已经成功添加应用。
步骤二:创建作业
单击已上传的应用下的使用。
系统会自动跳转到创建作业页面,并默认选择该应用。您也可以在Instant 计算服务控制台-作业列表页面,单击创建作业。
在创建作业页面,完成以下参数配置。
作业信息
参数项
是否必选
说明
作业名称
是
填写作业任务的名称。需满足以下条件:
长度为2~64个字符。
必须以英文字母开头。
仅支持使用英文字母、数字和短划线(-)。
区域
是
选择作业执行所在的地域,以便优化网络延迟和成本。
调度策略
是
选择运行作业的调度策略,当前仅支持标准型调度策略。
说明如需使用经济型调度策略,请提交工单申请。
网络及可用区
是
选择专有网络和交换机后,E-HPC Instant计算服务会自动为作业执行节点挂载网卡,确保与您的数据存储(NAS)之间的网络交互。
安全组
是
选择安全组后,E-HPC Instant计算服务会自动为作业执行节点添加安全组。
单节点弹性公网IP
否
开启此功能后,节点将自动申请并分配弹性公网IP,从而确保节点能够通过互联网进行访问。
重要启用弹性公网IP会产生额外费用,建议您根据实际需要决定是否启用单节点弹性公网IP。
标签
否
选择一个或多个标签,便于后续的资源搜索和成本分析。更多信息,请参见标签。
任务详情
参数项
是否必选
说明
计算环境
是
选择运行作业所需的计算环境。包括以下两种:
云服务器
容器
应用
是
选择作业任务运行的具体应用,即镜像环境。
运行模式
是
选择执行作业任务的模式,分为以下两种模式:
批处理作业:执行用户命令后自动释放节点。
后台服务:支持长时间运行,需手动删除作业后才释放节点。
前处理脚本
否
填写在作业开始运行之前需要执行的脚本命令。
执行命令
条件必选
在作业节点上运行的具体命令或脚本,当运行模式为批处理作业时必选。
Linux应用:必须为以
#!
开头,并且后面添加执行程序,例如#! /bin/bash
。Windows应用:命令首行必须为
[powershell]
或[bat]
。
执行节点数
是
设定执行作业任务所需的节点总数。
任务资源
参数项
是否必选
说明
单节点核数
是
根据业务需求选择每个执行节点所需的CPU核数和内存大小。
说明单节点的CPU核数与内存大小必须符合固定比例。更多信息,请参见使用限制。
单节点内存大小
是
单节点计算存储空间
是
所选存储资源的大小应大于应用镜像的大小,并且:
应用为系统应用时,存储空间≥40 GiB。
应用为个人应用时,存储空间≥20 GiB。
访问外部存储
参数项
说明
挂载目录
输入挂载目录。
类型
当前仅支持通用型NAS。
文件系统和挂载点
选择要挂载的文件系统ID和挂载点,请确保该文件系统还有可用的挂载点余量。
文件系统目录
输入要挂载的文件系统目录。
挂载选项
选择挂载协议。
更多设置
参数项
说明
登录密码
当您需要远程登录节点时,需要设置登录密码和确认密码。
说明仅当计算环境为云服务器时才能设置密码。
确认密码
资源调度限制
支持以下两种调度方式:
无:支持在指定的VPC下调度资源。
仅在指定交换机下:创建的执行节点在指定的交换机下。
参数配置完成后,单击页面下方的创建作业。
步骤三:查看作业运行详情
创建完成后,已创建的作业将出现在作业列表中。您可以通过标签、状态和时间筛选需要查看的作业。
单击作业ID/名称列下的目标作业ID或操作列下的查看详情。
在作业详情页面,您可以查看作业的基础信息、任务运行情况和各个执行节点的状态。
基本信息:展示了作业ID、作业状态、资源分配策略等基本信息。
执行节点情况:展示了运行作业的执行节点情况,包括总执行任务数、运行中任务数、已完成任务数和已终止任务数。
任务运行情况:展示了任务个数、任务状态、运行任务的节点资源等。
查看作业的运行情况。
监控数据:包括CPU利用率、内存利用率和磁盘使用率。
运行日志:包括前处理脚本(PrologScript)和执行命令(Script)的运行日志。
远程登录:出现异常情况时,您可以登录到执行节点上,排查具体问题。