调用GetAutoScaleConfig获取指定集群的自动伸缩配置信息。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

请求参数

名称 类型 是否必选 示例值 描述
Action String GetAutoScaleConfig

系统规定参数。取值:GetAutoScaleConfig

ClusterId String ehpc-hz-FYUr32****

集群ID。

返回数据

名称 类型 示例值 描述
ClusterId String ehpc-hz-FYUr32****

集群ID。

ClusterType String pbs

集群的调度器类型。可能值:

  • slurm
  • pbs
  • opengridscheduler
  • deadline
EnableAutoGrow Boolean true

集群是否启动自动扩容。可能值:

  • true
  • false
EnableAutoShrink Boolean true

集群是否启动自动缩容。可能值:

  • true
  • false
ExcludeNodes String i-bp19lgqwxb4206t5****,i-bp1g4hvzs9pywrhb****

不参与自动伸缩的节点列表,多个节点之间用半角逗号(,)隔开。

ExtraNodesGrowRatio Integer 2

额外节点百分比。可能值:0~100

如果作业负载需要新增100个计算节点,ExtraNodesGrowRatio值为2,那么最终新增数量为102。

GrowIntervalInMinutes Integer 2

扩容时间间隔,每轮计算节点扩容的时间间隔。单位:分钟,可能值:2~10

说明 一次扩容任务可能会分几次完成,或者连续触发扩容时的时间间隔。
GrowRatio Integer 100

扩容比例。可能值:1~100

如果作业负载需要新增10个计算节点,GrowRatio配置为50,那么会进行多轮扩容,每轮扩容当前所需的50%。

GrowTimeoutInMinutes Integer 20

扩容超时时间,等待启动节点的超时时间。单位:分钟,可能值:10~60

如果扩容时间大于扩容超时时间,节点依然未达到运行状态,系统将此节点释放。

ImageId String m-bp10txryr4mhrrt1****

队列中计算节点镜像ID。

MaxNodesInCluster Integer 300

集群最多可以扩容的节点数量。可能值:0~500

Queues Array of QueueInfo

集群队列的自动伸缩配置信息。

说明 集群和队列同时开启了扩容或缩容时,则以队列设置为优先。
QueueInfo
EnableAutoGrow Boolean true

队列是否启动自动扩容。可能值:

  • true
  • false
EnableAutoShrink Boolean true

队列是否启动自动缩容。可能值:

  • true
  • false
HostNamePrefix String compute

队列名前缀。方便您查询具有指定前缀的队列。

HostNameSuffix String 000

队列名后缀。方便您查询具有指定后缀的队列。

InstanceType String ecs.sn1ne.large

该队列自动扩容的节点规格。

InstanceTypes Array of InstanceTypeInfo

计算节点规格信息。

InstanceTypeInfo
HostNamePrefix String compute

主机名前缀。方便您查询具有指定前缀的节点。

InstanceType String ecs.sn1ne.large

节点规格。

SpotPriceLimit Float 0.062

计算节点每小时最高价格,支持最多3位小数。参数SpotStrategy取值为SpotWithPriceLimit时生效。

SpotStrategy String NoSpot

计算节点竞价策略。可能值:

  • NoSpot:正常按量付费节点。
  • SpotWithPriceLimit:设置上限价格的抢占式节点。
  • SpotAsPriceGo:系统自动出价,跟随当前市场实际价格的抢占式节点。
VSwitchId String vsw-bp1lfcjbfb099rrjn****

计算节点所属的交换机ID。

ZoneId String cn-hangzhou-b

计算节点所属的可用区ID。

MaxNodesInQueue Integer 100

单个队列最多可以扩容的节点数量。可能值:0~500

MinNodesInQueue Integer 10

单个队列最小计算节点数,队列最少可以保留的计算节点数量。可能值:0~50

QueueImageId String centos_7_06_64_20G_alibase_2019071****

队列中计算节点镜像ID。

QueueName String workq

队列名称。

ResourceGroupId String rg-acfmxp7uc24****

计算节点所属的资源组ID。

SpotPriceLimit Float 0.062

计算节点每小时最高价格,支持最大3位小数。参数SpotStrategy取值为SpotWithPriceLimit时生效。

SpotStrategy String NoSpot

计算节点的抢占策略。可能值:

  • NoSpot:正常按量付费节点。
  • SpotWithPriceLimit:设置上限价格的抢占式节点。
  • SpotAsPriceGo:系统自动出价,跟随当前市场实际价格的抢占式节点。
SystemDiskCategory String cloud_efficiency

系统盘类型。可能值:

  • cloud_efficiency:高效云盘
  • cloud_ssd:SSD云盘
  • cloud_essd:ESSD云盘
  • cloud:普通云盘
SystemDiskLevel String PL1

系统盘性能等级。可能值:

  • PL0:单盘最高随机读写IOPS 1万
  • PL1:单盘最高随机读写IOPS 5万
  • PL2:单盘最高随机读写IOPS10万
  • PL3:单盘最高随机读写IOPS 100万
SystemDiskSize Integer 40

系统盘大小。单位:GB,可能值:40~500

RequestId String 04F0F334-1335-436C-A1D7-6C044FE73368

请求ID。

ShrinkIdleTimes Integer 3

节点连续空闲(未运行作业)次数。节点收缩检查时,一个节点连续处于空闲状态的次数。可能值:2~5

如果该参数值为3,表示一个计算节点连续空闲超过3次,就会被释放。

ShrinkIntervalInMinutes Integer 2

缩容时间间隔,每轮计算节点收缩的时间间隔。单位:分钟,可能值:2~10

SpotPriceLimit Float 0.062

计算节点每小时最高价格,最多支持3位小数。参数SpotStrategy取值为SpotWithPriceLimit时生效。

SpotStrategy String SpotWithPriceLimit

计算节点抢占策略。可能值:

  • NoSpot:正常按量付费节点。
  • SpotWithPriceLimit:设置上限价格的抢占式节点。
  • SpotAsPriceGo:系统自动出价,跟随当前市场实际价格的抢占式节点。
Uid String 129845258050****

阿里云账号ID。

示例

请求示例

https://ehpc.cn-hangzhou.aliyuncs.com/?Action=GetAutoScaleConfig
&ClusterId=ehpc-hz-FYUr32****
&<公共请求参数>

正常返回示例

XML格式

<GetAutoScaleConfigResponse>
      <RequestId>04F0F334-13358736C-A1D7-6C044FE73368</RequestId>
      <ExtraNodesGrowRatio>0</ExtraNodesGrowRatio>
      <EnableAutoGrow>true</EnableAutoGrow>
      <ClusterId>ehpc-hz-FYUr32****</ClusterId>
      <ShrinkIdleTimes>3</ShrinkIdleTimes>
      <MaxNodesInCluster>300</MaxNodesInCluster>
      <ClusterType>pbs</ClusterType>
      <EnableAutoShrink>true</EnableAutoShrink>
      <GrowRatio>100</GrowRatio>
      <GrowIntervalInMinutes>2</GrowIntervalInMinutes>
      <Uid>129845258050****</Uid>
      <GrowTimeoutInMinutes>20</GrowTimeoutInMinutes>
      <ImageId>m-bp10txryr4mhrrt1****</ImageId>
      <ShrinkIntervalInMinutes>2</ShrinkIntervalInMinutes>
      <SpotPriceLimit>0</SpotPriceLimit>
      <Queues>
            <QueueInfo>
                  <MinNodesInQueue>0</MinNodesInQueue>
                  <MaxNodesInQueue>100</MaxNodesInQueue>
                  <EnableAutoGrow>true</EnableAutoGrow>
                  <EnableAutoShrink>true</EnableAutoShrink>
                  <InstanceTypes>
                        <InstanceTypeInfo>
                              <ZoneId>cn-hangzhou-i</ZoneId>
                              <VSwitchId>vsw-bp1lfcjbfb099rrjn****</VSwitchId>
                              <SpotPriceLimit>0</SpotPriceLimit>
                              <HostNamePrefix>compute</HostNamePrefix>
                              <InstanceType>ecs.sn1ne.large</InstanceType>
                              <SpotStrategy>NoSpot</SpotStrategy>
                        </InstanceTypeInfo>
                  </InstanceTypes>
                  <QueueName>workq</QueueName>
            </QueueInfo>
            <QueueInfo>
                  <MinNodesInQueue>0</MinNodesInQueue>
                  <MaxNodesInQueue>100</MaxNodesInQueue>
                  <EnableAutoGrow>true</EnableAutoGrow>
                  <EnableAutoShrink>true</EnableAutoShrink>
                  <InstanceTypes>
            </InstanceTypes>
                  <QueueName>test1</QueueName>
            </QueueInfo>
            <QueueInfo>
                  <MinNodesInQueue>0</MinNodesInQueue>
                  <MaxNodesInQueue>100</MaxNodesInQueue>
                  <EnableAutoGrow>true</EnableAutoGrow>
                  <EnableAutoShrink>true</EnableAutoShrink>
                  <InstanceTypes>
            </InstanceTypes>
                  <QueueName>tes2</QueueName>
            </QueueInfo>
      </Queues>
      <ExcludeNodes>i-bp19lgqwxb4206t5****,i-bp1g4hvzs9pywrhb****</ExcludeNodes>
      <SpotStrategy>NoSpot</SpotStrategy>
</GetAutoScaleConfigResponse>

JSON格式

{
	"RequestId":"04F0F334-13358736C-A1D7-6C044FE73368",
    "ExtraNodesGrowRatio": 0,
	"EnableAutoGrow": true,
	"ClusterId": "ehpc-hz-FYUr32****",
	"ShrinkIdleTimes": 3,
	"MaxNodesInCluster": 300,
	"ClusterType": "pbs",
	"EnableAutoShrink": true,
	"GrowRatio": 100,
	"GrowIntervalInMinutes": 2,
	"Uid": "129845258050****",
	"GrowTimeoutInMinutes": 20,
	"ImageId": "m-bp10txryr4mhrrt1****",
	"ShrinkIntervalInMinutes": 2,
	"SpotPriceLimit": 0,
	"Queues": {
		"QueueInfo": [
			{
				"MinNodesInQueue": "0",
				"MaxNodesInQueue": "100",
				"EnableAutoGrow": "true",
				"EnableAutoShrink": "true",
				"InstanceTypes": {
					"InstanceTypeInfo": [
						{
							"ZoneId": "cn-hangzhou-i",
							"VSwitchId": "vsw-bp1lfcjbfb099rrjn****",
							"SpotPriceLimit": "0",
							"HostNamePrefix": "compute",
							"InstanceType": "ecs.sn1ne.large",
							"SpotStrategy": "NoSpot"
						}
					]
				},
				"QueueName": "workq"
			},
			{
				"MinNodesInQueue": "0",
				"MaxNodesInQueue": "100",
				"EnableAutoGrow": "true",
				"EnableAutoShrink": "true",
				"InstanceTypes": {
					"InstanceTypeInfo": []
				},
				"QueueName": "test1"
			},
			{
				"MinNodesInQueue": "0",
				"MaxNodesInQueue": "100",
				"EnableAutoGrow": "true",
				"EnableAutoShrink": "true",
				"InstanceTypes": {
					"InstanceTypeInfo": []
				},
				"QueueName": "tes2"
			}
		]
	},
	"ExcludeNodes": "i-bp19lgqwxb4206t5****,i-bp1g4hvzs9pywrhb****",
	"SpotStrategy": "NoSpot"
}

错误码

HttpCode 错误码 错误信息 描述
400 InvalidParams The specified parameter %s is invalid. 无效的参数: %s
404 ClusterNotFound The specified cluster does not exist. 指定的集群不存在,请您检查该参数是否正确。
403 InvalidOpt The specified operation is invalid. Please try again later. If the problem still exists, submit a ticket. 未知的操作,请您稍后再试,若还出现相同的错误请提交工单处理。
406 DbError A database service error occurred. 数据库请求失败
500 UnknownError An unknown error occurred. 未知错误
503 ServiceUnavailable The request has failed due to a temporary failure of the server 请求失败,服务暂时不可用

访问错误中心查看更多错误码。