阿里云弹性预测 AHPA 助力厨芯科技降本增效
企业需求与痛点
厨芯科技一年前将业务系统从 ECS VM 迁移至 K8s 集群,虽然提高了微服务运维效率,但由于 ECI 容器单位成本高于 ECS,如何充分发挥 K8s 的资源弹性,就成为降低成本的主要问题。 主要有两个业务场景存在优化空间:
场景一:Web 服务每天有早、晚高峰和夜间低谷。最初使用 CronHPA 设置各个时间段的容器数,再用 HPA 应对业务高峰的局部扩容,有一定的优化效果。但是,CronHPA 设置的时间段越多,运维成本越高,并且不够灵活;目标容器数的配置也比较困难,太少则无法保证应对业务高峰,太多又起不到优化成本的效果,需要反复尝试进行调整。而 HPA 扩容总是滞后于负载变化,会引入一些不必要的容器创建删除,导致资源浪费。
场景二:定时任务有相对固定的周期性。对于15-30分钟的周期,CronHPA 的配置显然太过复杂,HPA 也因为滞后性无法发挥作用。
成本优化措施
经过充分沟通,在对厨芯科技业务的应用场景和需求有了深入理解后,推荐了阿里云容器服务弹性预测 AHPA(Advanced Horizontal Pod Autoscaler)解决方案。
阿里云容器服务 AHPA 可以根据业务历史指标,自动识别弹性周期并对容量进行预测,解决弹性滞后的问题。通过主动预测和被动预测相结合,实时调整资源实例数。被动预测基于应用实时指标计算 Pod 数量,可以很好的应对突发流量; 主动预测基于历史指标通过达摩院机器学习算法提前预测出未来 24 小时应用的实例数量。此外,AHPA 还增加了兜底保护策略,可以设置时间区间的实例数上下界值实现弹性兜底。
成本优化效果
厨芯科技已在几个主要服务 ACK 集群上启用了 AHPA。经过验证,相比于 CronHPA+HPA 的优化方案,AHPA 的主动预测模式额外降低了 10% 的 ECI 容器成本。同时,AHPA 自动计算负载曲线、设定目标容器数等特点,替代了人工运维的工作量,加速了业务容器化的进程。
关于 AHPA
AHPA 是阿里云容器服务 ACK 与达摩院合作推出的容器智能弹性预测产品,可以根据业务历史指标,自动识别弹性周期并对容量进行预测,帮您提前进行弹性规划,解决弹性滞后的问题。 详细介绍请见: AHPA概述