升降配集群

重要

本文中含有需要您注意的重要提示信息,忽略该信息可能对您的业务造成影响,请务必仔细阅读。

创建标准版E-HPC集群后,如果当前集群管理节点配置无法满足您的业务需求,您可以修改集群管理节点的实例规格(vCPU和内存)来提高集群性能。本文介绍如何通过ECS控制台升降配标准版E-HPC集群的管理节点。

注意事项

  • 目前仅支持标准版E-HPC集群进行升降配集群操作。

  • 在操作期间管理节点将停止,E-HPC管控调度服务无法正常使用。

  • 更改实例规格时会停止管理节点,造成业务中断,须在集群无任何正在运行或正在排队作业时进行操作。

  • 管理节点的实例规格变配成功后,会按照变更后的规格配置进行计费,这将引起费用上的变化。更多计费信息,请参见实例规格计费

  • 降配管理节点的实例规格会影响集群性能,建议在进行降配操作前,请确保您的业务需求能够适应降低后的配置规格。

    说明

    选择合适的管理节点规格。对于不同规模的集群,推荐的管理节点规格如下:

    • 如果计算节点数≤100个,管理节点规格建议vCPU≥16核,内存≥64 GiB。

    • 如果100 < 计算节点数≤500个,管理节点规格建议vCPU≥32核,内存≥128 GiB。

    • 如果计算节点数>500个,管理节点规格建议vCPU≥64核,内存≥256 GiB。

前提条件

更改管理节点所属实例的规格需满足以下条件:

  • 集群对应管理节点的实例规格族支持变配。更多信息,请参见支持变配的实例规格

  • 管理节点所在的ECS实例必须处于运行中Running)或已停止Stopped)状态。

  • 集群处于空闲状态,即集群内无任何正在运行或正在排队的作业。

    重要

    为降低升降配操作可能带来的风险,确保集群的稳定性,阿里云强烈建议您在操作前执行以下操作:

    • 释放E-HPC集群中所有计算节点。具体操作,请参见节点

    • 临时关闭集群的自动伸缩功能。具体操作,请参见伸缩集群

    • 已完成集群重要数据的备份。具体操作,请参见创建快照

使用限制

更改按量付费实例规格时,存在以下限制条件:

  • 必须指定目标实例规格(包括vCPU和内存),不能单独变更其中一个配置。

  • 对于同一实例,两次变更操作之间的间隔不得少于5分钟。

更改包年包月实例规格时,存在以下限制条件:

  • 必须指定目标实例规格(包括vCPU和内存),不能单独更改其中一个配置。

  • 对于同一实例,两次变更配置操作之间的间隔不得少于5分钟。

  • 升配包年包月实例时,在当前计费周期内,如果您已经执行过续费降配操作,只有进入新的计费周期后才能升级配置,当前计费周期的剩余时间内无法升级。

  • 降配包年包月实例时,该实例没有未完成的续费降配流程。如果实例还在续费降配流程中,必须等续费降配执行完后才能执行实时降配操作。

  • 降配规格每月有最大quota额度限制,额度根据您历史消费情况而定。具体额度以页面展示为准。当月额度超限后不能再降配,quota额度次月1日自动更新。

    说明

    降配规格可能会产生退款,退款金额是新配置的价格与降配前有效购买剩余价格的差额。更多信息,请参见退订规则说明

操作步骤

根据您的E-HPC集群管理节点的付费方式,选择以下相应步骤进行升降配操作。

说明

完成升降配操作后,请检查集群状态,确保所有服务恢复正常运行。

按量付费类型的管理节点

  1. 登录ECS管理控制台

  2. 在左侧导航栏,选择实例与镜像 > 实例

  3. 在页面左侧顶部,选择目标资源所在的资源组和地域。地域

  4. 找到待变更的按量付费实例,在操作列中,选择image.png > 升降配 > 更改实例规格

    image

  5. 选择目标实例规格。

    说明

    支持更改的实例规格,以页面上显示的信息为准。

  6. 根据当前实例状态选择不同操作。

    • 实例为已停止:确认预估费用,单击确认更改image

    • 实例为运行中

      1. 确认预估费用,单击停止实例并继续

        image

      2. 停止实例对话框,选择停止方式,单击确定

        重要
        • 停止实例时,停止模式建议选择普通停机模式,选择节省停机模式会因计算资源(vCPU和内存)被回收,再次启动实例时可能因为库存不足导致启动失败。

        • 停止实例会造成业务中断,建议您在非业务高峰期时执行该操作。

  7. 变配完成后,单击启动实例并返回,在弹出的启动实例对话框,单击确定

    image

更多信息,请参见更改按量付费实例规格

包年包月类型的管理节点

  1. 登录ECS管理控制台

  2. 在左侧导航栏,选择实例与镜像 > 实例

  3. 在页面左侧顶部,选择目标资源所在的资源组和地域。地域

  4. 找到待变更的ECS实例,在操作列中,选择image.png > 升降配 > 更改实例规格

    image

  5. 选择目标实例规格。

    选择目标实例规格后,系统将显示该操作是升配还是降配。

    说明

    支持更改的实例规格,以页面上显示的信息为准。

  6. 更改实例规格。

    升配实例规格

    根据当前实例状态选择不同操作。

    • 实例为已停止

      1. 确认预估费用,选中请阅读和勾选同意《云服务器ECS服务条款》,单击确认更改并支付费用

        image

      2. 根据界面提示,完成支付费用。

        支付完成后,控制台会显示为新的实例规格,但实际并未生效,您需要启动实例使变更生效。

    • 实例为运行中

      1. 设置重启时间。

        如果选择了预约重启并设置了重启时间,您可以在ECS控制台的事件 > 变配重启事件中查看或修改预约时间。

        警告

        重启实例会造成您的实例停止工作,可能导致业务中断,建议您在非业务高峰期时执行该操作。

      2. 确认变更信息后,选中请阅读和勾选同意《云服务器ECS服务条款》,单击确认更改并支付费用确认更改并重启实例

        单击确认更改并支付费用并支付完成后,控制台会显示为新实例规格,但实际并未生效,您需要重启使变更生效。

        image

    降配实例规格

    1. 根据当前实例状态选择不同操作。

      • 实例为已停止:确认变更信息,选中请阅读和勾选同意《云服务器ECS服务条款》,单击确认更改

        image

      • 实例为运行中

        1. 确认变更信息,选中请阅读和勾选同意《云服务器ECS服务条款》,单击停止实例并继续

          image

        2. 停止实例对话框,选择停止方式,单击确定

          image

    2. 在更改实例规格对话框,单击启动实例并返回,然后单击确定

      启动实例后,新实例规格立即生效。

更多信息,请参见更改包年包月实例规格

相关文档