管理节点

重要

本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。

对于节点为ECS实例的集群,您可以管理集群中的节点,执行停止、重启等操作。本文介绍如何管理集群中的ECS节点。

操作步骤

  1. 打开节点与队列页面。

    1. 登录弹性高性能计算控制台

    2. 在顶部菜单栏左上角处,选择地域。

    3. 在左侧导航栏,选择资源管理 > 节点与队列

  2. 集群列表中选择目标集群,在节点类型列表中选择要操作的节点类型,然后按照需要进行操作。

    管理节点.png

    说明

    不同类型节点支持的操作不同(例如管控节点不支持启动、停止、重置和删除等操作),具体以控制台显示为准。

    操作

    说明

    步骤

    停止

    对于闲置的按量付费的计算节点,如果开启了节省停机模式,停止后将不再收取计算资源的费用。更多信息,请参见按量付费实例节省停机模式

    重要

    停止节点后,正在该节点上运行的作业会被停止。请确保要停止的节点上没有在运行的作业再执行停止操作。

    1. 在节点列表中选中目标节点。

    2. 在列表下方选择更多 > 停机

    3. 确认提示信息,然后单击确定

    启动

    对于停止状态的计算节点,如果要继续使用,可以启动节点。

    1. 在节点列表中选中目标节点。

    2. 在列表下方选择更多 > 启动

    3. 确认提示信息,然后单击确定

    重启

    如果计算节点出现异常,您可以尝试重启节点。重启分为两种方式:

    • 普通重启:向节点发送重启命令,由操作系统完成终止进程、系统重启等操作。

    • 强制重启:等同于强制断电重启,可能丢失数据。请仅在普通重启失败时再尝试强制重启。

    重要

    重启节点时,正在该节点运行的作业将会停止。请确保要重启的节点上没有在运行的作业再执行重启操作。

    1. 在节点列表中找到目标节点。

    2. 单击对应操作列中的重启

    3. 选择重启方式,然后单击确定

    重置

    如果无法修复节点故障,您可以尝试重置节点,将操作系统和软件恢复至初始状态。

    警告

    重置节点会对集群产生一定影响,如无特殊需要(如故障修复等),请勿重置处于运行中状态的节点。

    1. 在节点列表中找到目标节点。

    2. 单击对应操作列中的重置节点

    3. 确认提示信息,然后单击确定

    删除

    对于不再需要的计算节点,您可以执行删除操作将节点从集群中移除,实现集群缩容。

    根据计费方式的差异,被删除的节点的释放情况如下:

    • 按量付费的节点将立即释放。

    • 包年包月的节点会继续保留。到期前,需申请退款或转为按量付费后再释放。具体操作,请参见释放实例

    重要

    实例释放后数据无法恢复。如果需要保留数据,建议提前创建快照备份数据。具体操作,请参见创建一个云盘快照

    1. 在节点列表中选中目标节点。

    2. 在列表下方单击批量删除

      您也可以单击目标节点对应操作列中的删除节点来删除单个节点。

    3. 确认提示信息,然后单击确定

    发送命令

    如果需要快速完成对节点的维护,例如安装软件,执行运维脚本等,可以使用发送命令功能快速操作。

    1. 在节点列表中选中目标节点。

    2. 在列表下方单击批量发送命令

      您也可以单击目标节点对应操作列中的发送命令对单个节点执行命令。

    3. 设置命令参数,并输入命令内容,然后单击执行

      关于命令参数的解释,请参见发送远程命令

    转换计费方式

    ECS实例支持包年包月和按量计费等计费方式,支持互相转换,以满足成本和使用需求。

    1. 在节点列表中选中目标节点。

    2. 在列表下方选择更多 > 转包年包月实例,或者更多 > 转按量付费实例

    3. 按照页面提示完成后续操作。

    续费

    如果是包年包月的节点,可以通过续费延长使用时长。

    1. 在节点列表中选中目标节点。

    2. 在列表下方选择更多 > 续费

    3. 按照页面提示选择续费时长,并完成支付。

    更改实例规格(升降配)

    如果节点当前的配置无法满足业务需求,您可以升级或降低规格(即升降配)。操作前,请先确认当前节点规格支持更改,具体请参见支持变配的实例规格

    重要

    更改实例规格时会停止节点,影响您的业务。建议您在未进行作业计算时进行操作。根据节点类型,可能的影响如下:

    • 登录节点:升降配期间,无法通过登录节点登录集群。

    • 管控节点:

      • 升降配期间,E-HPC管控调度服务无法正常使用。升降配完成后,部分集群需要手动恢复调度服务,这个过程需要登录管控节点。

      • 升降配期间,无法创建、运行和查看作业。

    • 计算节点:正在该节点运行的作业将会停止。

    1. 在节点列表中找到目标节点。

    2. 单击节点ID,跳转到ECS控制台的实例详情页面。

    3. 配置信息区域的实例规格处,单击更换

    4. 选择要更换的规格,并完成后续操作。

      更多信息,请参见修改实例规格

    移动到队列

    对于运行不同作业或者执行不同任务的计算节点,可以加入到不同的队列中,以便分组管理。更多关于队列的信息,请参见管理队列

    1. 在节点列表中选中目标节点。

    2. 在列表下方单击移动到队列

    3. 按照页面提示完成后续操作。