文档

创建自动伸缩配置

更新时间:

调用CreateAutoscalingConfig创建自动伸缩配置。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

请求语法

POST /cluster/ClusterId/autoscale/config HTTP/1.1
Content-Type:application/json

{
  "cool_down_duration" : "String",
  "unneeded_duration" : "String",
  "utilization_threshold" : "String",
  "gpu_utilization_threshold" : "String",
  "scan_interval" : "String",
  "scale_down_enabled" : Boolean,
  "expander" : "String",
  "skip_nodes_with_system_pods" : Boolean,
  "skip_nodes_with_local_storage" : Boolean,
  "daemonset_eviction_for_nodes" : Boolean,
  "max_graceful_termination_sec" : Integer,
  "min_replica_count" : Integer,
  "recycle_node_deletion_enabled" : Boolean,
  "scale_up_from_zero" : Boolean
}

请求参数

请求Path参数

参数名称

类型

是否必选

示例

说明

ClusterId String cdde1f21ae22e483ebcb068a6eb7f****

集群ID。

请求Body参数

参数名称

类型

是否必选

示例

说明

cool_down_duration String 10m

缩容触发时延,节点缩容时需要连续满足触发时延所设定的时间,才能进行缩容。单位:分钟。

unneeded_duration String 10m

静默时间。扩容出的节点,在静默时间过后,才能进入缩容判断。单位:分钟。

utilization_threshold String 0.5

缩容阈值,节点上Request的资源与总资源量的比值。

gpu_utilization_threshold String 0.5

GPU缩容阈值,节点上Request的资源与总资源量的比值。

scan_interval String 30s

弹性灵敏度,判断伸缩的间隔时间。单位:s。

scale_down_enabled Boolean true

是否允许进行节点缩容。取值:

  • true:允许缩容。
  • false:禁止缩容。
expander String least-waste

节点池扩容顺序策略。取值:

  • least-waste :默认策略。如果可扩容节点池有多个,从中选择一个资源浪费最少的节点池进行扩容。
  • random:随机策略。如果可扩容节点池有多个,从中任意选择一个节点池进行扩容。
  • priority :优先级策略。如果可扩容节点池有多个,会按照您自定义的伸缩组顺序,选择优先级高的节点池进行扩容。

    优先级的配置存储在kube-system命名空间下ConfigMap的cluster-autoscaler-priority-expander中。当自动伸缩进行扩容时,实时读取此配置,将可扩容的伸缩组ID与配置中伸缩组ID进行匹配,在匹配上的伸缩组中选取优先级最大值的伸缩组作为扩容对象。

skip_nodes_with_system_pods Boolean true

cluster autoscaler是否缩容有kube-system命名空间下的Pods(除了DaemonSet或mirror Pods)的节点。

  • true:不会缩容。
  • false:缩容。
skip_nodes_with_local_storage Boolean false

cluster autoscaler是否缩容有local storage(如EmptyDir 或 HostPath)的pods的节点

  • true:不会缩容。
  • false:缩容。
daemonset_eviction_for_nodes Boolean false

缩容时是否驱逐节点上的DaemonSet pods

  • true:驱逐。
  • false:不会驱逐。
max_graceful_termination_sec Integer 14400s

cluster autoscaler缩容节点时等待节点上pod终止的最长时间。单位:s。

min_replica_count Integer 0

考虑缩容时Pod应该有的最小副本数。

recycle_node_deletion_enabled Boolean false

极速模式节点缩容成功后,是否删除其对应的K8s Node对象。

scale_up_from_zero Boolean true

集群Ready节点数为0时,CA是否扩容。

响应体语法

HTTP/1.1 200 OK

响应参数

创建自动伸缩配置

示例

POST /cluster/cdde1f21ae22e483ebcb068a6eb7f****/autoscale/config HTTP/1.1
Host:cs.aliyuncs.com
Content-Type:application/json

{
  "cool_down_duration" : "10",
  "unneeded_duration" : "10",
  "utilization_threshold" : "0.5",
  "gpu_utilization_threshold" : "0.5",
  "scan_interval" : "30",
  "scale_down_enabled" : true,
  "expander" : "least-waste",
  "skip_nodes_with_system_pods" : true,
  "skip_nodes_with_local_storage" : false,
  "daemonset_eviction_for_nodes" : false,
  "max_graceful_termination_sec" : 14400,
  "min_replica_count" : 0,
  "recycle_node_deletion_enabled" : false,
  "scale_up_from_zero" : true
}

正常返回示例

JSON格式

HTTP/1.1 200 OK

错误码

访问错误中心查看更多错误码。

开发者资源

  • SDK

    阿里云为您提供多种语言的SDK,帮助您快速通过API集成阿里云的产品和服务,推荐您使用SDK调用API,已免除您手动签名验证。

  • OpenAPI Explorer

    快速检索,可视化调试API,在线命令行工具,同步动态生成可执行的SDK代码示例。

  • 阿里云CLI

    阿里云资产管理和配置工具,可通过命令方式同时管理多个阿里云产品和服务,简单快捷,是您上云好帮手。

  • 本页导读 (1)
文档反馈