在Knative中使用HPA实现基于CPU和Memory的自动扩缩容
Knative和HPA(Horizontal Pod Autoscaler)的结合使用可以为您的应用提供基于资源负载的自动扩缩容能力。Knative本身已经提供了基于请求量的自动扩缩容功能,但通过结合HPA,您可以根据更多指标类型(例如CPU使用率、内存使用率等)进一步精细化控制扩缩容行为。
前提条件
已在ACS集群中部署Knative。具体操作,请参见部署Knative。
已使用kubectl连接Kubernetes集群。具体操作,请参见获取集群KubeConfig并通过kubectl工具连接集群。
如需使用Knative监控大盘查看Knative服务监控数据,需已将Knative接入阿里云Prometheus监控,请参见查看Knative服务监控大盘。
步骤一:部署Knative Service
登录容器计算服务控制台,在左侧导航栏选择集群。
在集群页面,单击目标集群ID,然后在左侧导航栏,选择
。在Knative页面的服务管理页签下,选择命名空间为default,然后单击使用模板创建,将以下YAML示例粘贴至模板,最后单击创建。
创建一个名为
helloworld-go-hpa
的服务,以下为配置示例。apiVersion: serving.knative.dev/v1 kind: Service metadata: name: helloworld-go-hpa # Knative服务名称。 spec: template: metadata: labels: app: helloworld-go-hpa annotations: autoscaling.knative.dev/class: "hpa.autoscaling.knative.dev" # 指定弹性插件为HPA。 autoscaling.knative.dev/metric: "cpu" # HPA的指标类型可以设置为CPU和Memory。此处以CPU为例。 autoscaling.knative.dev/target: "30" # 设置HPA CPU指标的阈值。根据该阈值,Knative的HPA将自动调整副本数。 autoscaling.knative.dev/minScale: "1" # 设置弹性策略实例数的最小值。 autoscaling.knative.dev/maxScale: "4" # 设置弹性策略实例数的最大值。 spec: containers: - image: registry.cn-hangzhou.aliyuncs.com/knative-sample/autoscale-go:v1024 resources: requests: cpu: '200m'
执行以下命令,检查服务是否正常运行。
kubectl get ksvc
预期输出如下:
NAME URL LATESTCREATED LATESTREADY READY REASON helloworld-go-hpa http://helloworld-go-hpa.default.example.com helloworld-go-hpa-00001 helloworld-go-hpa-00001 True
READY
列显示True
,表明Knative服务正常运行。
步骤二:基于CPU实现自动弹性扩缩容
安装Hey压测工具。
关于Hey压测工具的详细信息,请参见Hey。
执行以下命令,模拟 100 qps 持续60s内对服务发起访问,从而进行压测。
说明请替换
121.XX.XX.10
为网关IP或域名。hey -z 60s -q 100 -host "helloworld-go-hpa.default.example.com" "http://121.XX.XX.10?prime=40000000" # 121.199.XXX.XXX为网关IP或域名。
在压测的同时,执行以下命令实时查看Pod扩缩容情况。
kubectl get pods --watch
Pod扩缩容预期输出如下结果:
NAME READY STATUS RESTARTS AGE # 该Pod正在运行,且容器已经就绪。 helloworld-go-hpa-00001-deployment-67cc8f979b-fxfl5 2/2 Running 0 101m # Pod扩容为4个,且状态为0/2 Pending,这意味着容器正在等待调度并分配资源。 helloworld-go-hpa-00001-deployment-67cc8f979b-kv6rj 0/2 Pending 0 0s helloworld-go-hpa-00001-deployment-67cc8f979b-fxq85 0/2 Pending 0 0s helloworld-go-hpa-00001-deployment-67cc8f979b-kv6rj 0/2 Pending 0 0s helloworld-go-hpa-00001-deployment-67cc8f979b-fxq85 0/2 Pending 0 0s # 4个Pod的状态变为0/2 ContainerCreating,表示容器正在创建。 helloworld-go-hpa-00001-deployment-67cc8f979b-kv6rj 0/2 ContainerCreating 0 0s helloworld-go-hpa-00001-deployment-67cc8f979b-fxq85 0/2 ContainerCreating 0 0s helloworld-go-hpa-00001-deployment-67cc8f979b-kv6rj 0/2 ContainerCreating 0 0s helloworld-go-hpa-00001-deployment-67cc8f979b-fxq85 0/2 ContainerCreating 0 0s # 4个Pod的状态变为1/2 Running和2/2 Running,表示其中一个或两个容器已经成功创建并运行。 helloworld-go-hpa-00001-deployment-67cc8f979b-kv6rj 1/2 Running 0 1s helloworld-go-hpa-00001-deployment-67cc8f979b-kv6rj 2/2 Running 0 1s helloworld-go-hpa-00001-deployment-67cc8f979b-fxq85 1/2 Running 0 1s helloworld-go-hpa-00001-deployment-67cc8f979b-fxq85 2/2 Running 0 1s
输出结果表明,Knative具有基于请求实现自动弹性扩缩容的能力。表现为当系统负载增加,需要更多的Pod来处理请求时,Pod数从最初的1个扩展到了4个,以提高系统的处理能力和吞吐量。
(可选)步骤三:查看服务监控数据
Knative提供开箱即用的可观测能力,在Knative页面单击监控大盘页签,即可查看目标Knative服务的监控数据情况。关于大盘信息的详细介绍,请参见查看Knative服务监控大盘。
相关文档
阿里云Knative通过整合容器构建(或者函数)、工作负载管理(动态扩缩)以及事件模型来实现Serverless标准。关于阿里云Knative的更多基本信息,请参见Knative概述。
关于阿里云Knative的更多功能,请参见阿里云Knative和开源Knative对比。