更新时间:2020-10-15 10:06
若您尚未拥有E-HPC集群,请先创建E-HPC集群
弹性高性能计算E-HPC的管理控制台提供了E-HPC集群节点相关的节点查询、重启、重置、删除、停机等功能,以及调度器管理功能,如节点队列创建、迁移、删除。
进入E-HPC管理控制台,点选左侧栏的“节点和队列”标签,进入如下界面:
选出需要调整的节点主要有以下步骤:
关于地域的说明,请参考地域和可用区
节点所属集群所在的地域即为节点所在地域,需通过地域筛选出节点所在集群。
在地域标签下方,点击“集群”选择框旁边的下拉菜单,根据集群名称可选择节点所在的集群。
E-HPC集群主要有三种节点类型,在“节点类型”按钮旁边的下拉框选择节点:
a. 管控节点,包括调度服务器和域帐户服务器。
b. 计算节点
c. 登录节点
完成以上节点所在地域、集群以及节点类型选择后,您可从节点概要信息表中找到需要调整的节点,在右侧操作栏点击“重启”或“更多”按钮,进行重启节点、重置节点、删除节点、查看详情等操作;对于多个节点,可进行批量停机、启动、删除操作。
注意:如无特殊需要(如故障修复等),请勿对处于运行中状态的节点执行重启操作。
点击“重启”按钮,在弹出界面选择“普通重启”或“强制重启”。
提醒:当节点重启无法修复故障时可尝试重置节点。
注意:如无特殊需要(如故障修复等),请勿对处于
运行中
状态的节点执行重置操作。
点开右侧更多下拉菜单,点击“重置节点”按钮,确认后即触发节点重置流程:
注意:仅计算节点可从集群移除,管控节点和登录节点不可删除。且删除计算节点是目前集群缩容的唯一途径。若需增加计算节点,请参考集群扩容。
注意:仅计算节点可进行停机操作,管控节点和登录节点不可停机。
E-HPC控制台支持批量节点的停机和启动操作。
节点停机:勾选需要停机的节点,点击上方“停机”按钮,确认后选中的节点将全部被停机。
节点启动:勾选需要启动的节点(说明:节点已处在停机状态,否则不可启动),点击上方“启动”按钮,确认后停机节点将在5分钟左右被全部启动。
除了以上启动方式外,您也可以进入云服务器ECS管理控制台,选择左侧的“实例”标签,跳转后选择您集群所在region,找到被停止的实例,点击实例ID进入停止实例页面,最后在右上角,点击“启动”按钮,启动该节点。操作完成之后,再去E-HPC管理控制台的节点界面,查看节点启动成功。
E-HPC推出调度器管理功能,将运行不同作业或执行不同任务的节点进行分类,加入到不同的队列进行分类管理,来更高效的管理大量运行作业的计算节点。如下图所示:
新建队列:选择集群节点类型为计算节点,点击“新建队列”按钮,在弹出框输入队列名称,确认后队列创建完成。
说明:新建的队列,可以在”队列”栏的下拉框中查看。
节点迁移:新创建的队列中不包含节点,您可以勾选需要移动到新队列的节点,然后点击“移动到队列”按钮,在弹出框选择目标队列,确认后即可完成迁移。
删除队列:删除不需要的队列时,只需要在“队列”栏选择需要删除的队列名称,然后点击“删除队列”按钮,确认后即可完成删除操作。
说明:默认队列不可删除;使用调度器的集群,队列中存在节点时不可删除;
在文档使用中是否遇到以下问题
更多建议
匿名提交