ACK目前已经全面支持Alibaba Cloud Linux 2的节点创建,并结合Alibaba Cloud Linux 2的高内核特性提供了多场景的优化。本文介绍ACK中使用Alibaba Cloud Linux 2操作系统的优势,及ACK基于Alibaba Cloud Linux 2提供的多场景优化。
背景信息
Alibaba Cloud Linux 2是新一代阿里云原生Linux操作系统,为云上应用程序提供安全、稳定、高性能的定制化运行环境,并针对云基础设施进行了深度优化,为您打造更好的运行时体验。您可以免费使用Alibaba Cloud Linux 2公共镜像,并免费获得阿里云针对该操作系统的长期支持。
使用Alibaba Cloud Linux 2操作系统镜像的优势
- 是阿里云上启动最快的Linux发行版。
- 针对ECS大规格虚机、裸金属服务器深度优化,特别是大规格实例的多任务的场景。
- 默认安装阿里云常用软件包,如阿里云CLI、cloud-init等,减少云资源的管理成本。
- 精简系统,最小的安全攻击面,最少的系统资源占用。
- 更完善的支持体系,在阿里云上提供多种渠道的技术支持体系。
- 更及时的软件安全漏洞(CVE)修复。
- 支持内核热补丁升级的能力,大大保障漏洞修复时的业务连续性。
- 针对ECS实例环境大幅优化启动速度,在系统压力来临时快速的扩容启动计算资源,启动速度相对CentOS 7提升29%。
- 针对ECS实例环境优化了多任务的场景,提升大规格实例多任务的性能,同样规格下能有16%的性能提升。
- 更高效的系统调用,系统调用的性能提升11%。
- Linux网络栈的优化,综合网络性能相对CentOS 7提升7.8%。
- Alibaba Cloud Linux 2默认是编译好BBR的拥塞控制算法的,在公网访问较多的场景中允许用户修改拥塞控制算法为BBR(Bottleneck Bandwidth and RTT),提升公网访问的带宽稳定性。
- 针对TLS协议的加密优化。
- 支持新的Budget Fair Queueing的IO调度器,降低云盘的延迟。
ACK结合Alibaba Cloud Linux 2的场景优化
- 容器网络优化
Alibaba Cloud Linux 2拥有4.19的高内核版本。在Alibaba Cloud Linux 2的节点上,ACK Terway网络插件支持IPVlan的容器网络模式,在网络小包的场景下相对传统bridge和策略路由网络性能提升40%。Alibaba Cloud Linux 2默认编译了BBR的拥塞控制算法,在公网访问较多的场景中允许用户修改容器的拥塞控制算法为BBR,提升公网访问的带宽稳定性,在容器的公网连接和跨公网的镜像拉取上性能大幅提升。
- 安全沙箱支持和优化
阿里云与Kata Containers和Clear Linux社区合作。在弹性裸金属实例上,您可以无缝地部署整套Kata Containers的解决方案。ACK还优化了安全沙箱(RunV)镜像的启动时间,使得Kata Containers的整体解决方案可以正常运行。ACK在此之上,提供了和普通集群体验几乎一致的安全沙箱容器集群,让应用运行在一个轻量虚拟机沙箱环境中,适合于多用户间的负载隔离,对不可信应用的隔离,在提升安全性的同时,对性能影响也做到非常小。
- 节点AutoScaler优化
Alibaba Cloud Linux 2针对ECS实例环境大幅优化启动速度,节点的启动时间相对CentOS 7的系统降低29%。结合ACK灵活高效的自动弹性伸缩,在应用压力来临时,ACK集群会自动根据负载状况创建和启动ECS的节点加入集群,并调度和启动应用实例。Alibaba Cloud Linux 2的快速扩容启动的能力让计算资源可以及时满足流量峰值的需求。
- CoreDNS优化
针对UDP协议的conntrack表的占用优化,在ACK集群中部署密度高了后经常遇到DNS的解析问题,大部分是因为DNS查询的UDP协议对conntrack的占用太多不释放导致,而Alibaba Cloud Linux 2中的conntrack的优化可以让同样DNS查询频率的conntrack表占用减少一半,从而大大提高集群中应用DNS查询的成功率。
- 更细粒度的资源监控和控制能力
Alibaba Cloud Linux 2的内核提供了针对容器场景的PSI压力模型、per-cgroup kswapd、memory priority等的细粒度可视化和控制能力。在Alibaba Cloud Linux 2的ACK集群中我们可以通过CGroup Controller来利用这些能力,可以实现细粒度BufferIO Control、TCP、CPUSet、Mem、NUMA等细粒度资源的配置和动态更新,在逐步提升资源利用率的同时也能保障应用间的互相干扰降到最低。
- AI和数据加速
Alibaba Cloud Linux 2对大规格机型和多任务的优化可以提升高性能计算任务的速度,对存储的流式读写的优化也可以提高模型大文件的读写性能,综合起来大大加速AI和高性能计算任务的效率。实际测试场景如下:
- 通过Alluxio利用64个线程加载OSS数据1152个文件144G,在CentOS需要3m25s,Alibaba Cloud Linux 2只需2m19.037s,速度是CentOS上的1.6倍。
- 运行ResNet50 Batch 128模型训练,数据缓存到Alluxio中,在CentOS下V100仅仅为5212.00 images/s。在Alibaba Cloud Linux 2下V100可以达到8746.59 images/s, 速度是CentOS上的1.7倍。
- 其他
- 使用Linux 4.19的内核,ACK将阿里巴巴内核和容器化实践融入其中。
- 降低Overlayfs的性能损耗,减少容器化对存储性能的损失。
- 大量sysctl namespace化,在4.19的内核中大部分sysctl配置都支持在容器中单独设置,比如TCP的超时和重传时间,不同应用有不同的超时和重传的需求,但是在CentOS 7的内核中是修改不了的,在Alibaba Cloud Linux 2中支持对其做Pod级别的配置。
如何使用Alibaba Cloud Linux 2作为集群节点系统镜像
您可以在创建集群的配置过程中,将操作系统选择为Alibaba Cloud Linux 2.1903来使用Alibaba Cloud Linux 2作为集群节点系统镜像。具体步骤,请参见创建Kubernetes专有版集群。

如果您选用Alibaba Cloud Linux 2,在创建集群以及后期扩容节点、添加节点、自动伸缩节点时,ACK会自动检测Alibaba Cloud Linux 2的安全补丁更新并自动安装补丁。
在文档使用中是否遇到以下问题
更多建议
匿名提交