调用CreateAutoscalingConfig创建自动伸缩配置。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

请求头

该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。

请求语法

POST /cluster/{ClusterId}/autoscale/config/ HTTP/1.1

请求参数

名称 类型 位置 是否必选 示例值 描述
ClusterId String Path c0XXXXXXX10

集群ID。

Object Body

请求体数据。

cool_down_duration String Body 10

静默时间,扩容出的节点,在静默时间过后,方可进入缩容判断,单位:分钟。

unneeded_duration String Body 10

缩容触发时延,节点缩容时需要连续满足触发时延所设定的时间,方可进行缩容,单位:分钟。

utilization_threshold String Body 0.5

缩容阈值,节点上 Request 的资源与总资源量的比值。

gpu_utilization_threshold String Body 0.5

GPU缩容阈值,节点上 Request 的资源与总资源量的比值。

scan_interval String Body 30

弹性灵敏度,判断伸缩的间隔时间,单位:s。

scale_down_enabled Boolean Body true

是否允许进行节点缩容,取值:

  • true:允许缩容。
  • false:禁止缩容。
expander String Body least-waste

节点池扩容顺序策略,取值:

  • least-waste :默认策略。如果可扩容节点池有多个,从中选择一个资源浪费最少的节点池进行扩容。
  • random:随机策略。如果可扩容节点池有多个,从中任意选择一个节点池进行扩容。
  • priority :优先级策略。如果可扩容节点池有多个,会按照您自定义的伸缩组顺序,选择优先级高的节点池进行扩容。

    优先级的配置存储在kube-system命名空间下ConfigMap的cluster-autoscaler-priority-expander中。当自动伸缩进行扩容时,实时读取此配置,将可扩容的伸缩组ID与配置中伸缩组ID进行匹配,在匹配上的伸缩组中选取优先级最大值的伸缩组作为扩容对象。

无响应参数

示例

请求示例

POST /cluster/c0XXXXXXX10/autoscale/config HTTP/1.1
Host:cs.aliyuncs.com
Content-Type:application/json

{
  "cool_down_duration" : "10m",
  "unneeded_duration" : "10m",
  "utilization_threshold" : "0.5",
  "gpu_utilization_threshold" : "0.5",
  "scan_interval" : "30s"
}

正常返回示例

JSON格式

HTTP/1.1 200 OK

错误码

访问错误中心查看更多错误码。