ACK目前已经全面支持Aliyun Linux 2的节点创建,并结合Aliyun Linux 2的高内核特性提供了多场景的优化。本文介绍ACK中使用Aliyun Linux 2操作系统的优势,及ACK基于Aliyun Linux 2提供的多场景优化。

背景信息

Aliyun Linux 2是新一代阿里云原生Linux操作系统,为云上应用程序提供安全、稳定、高性能的定制化运行环境,并针对云基础设施进行了深度优化,为您打造更好的运行时体验。您可以免费使用Aliyun Linux 2公共镜像,并免费获得阿里云针对该操作系统的长期支持。

使用Aliyun Linux 2操作系统镜像的优势

Aliyun Linux 2的操作系统是针对阿里云飞天虚拟化平台开发的,针对阿里云的环境提供了很多优化和新特性,主要包括:
  • 是阿里云上启动最快的Linux发行版。
  • 针对ECS大规格虚机、裸金属服务器深度优化,特别是大规格实例的多任务的场景。
  • 默认安装阿里云常用软件包,如阿里云CLI、cloud-init等,减少云资源的管理成本。
  • 精简系统,最小的安全攻击面,最少的系统资源占用。
  • 更完善的支持体系,在阿里云上提供多种渠道的技术支持体系。
  • 更及时的软件安全漏洞(CVE)修复。
  • 支持内核热补丁升级的能力,大大保障漏洞修复时的业务连续性。
应用实例在Aliyun Linux 2上运行的性能优势包括:
  • 针对ECS实例环境大幅优化启动速度,在系统压力来临时快速的扩容启动计算资源,启动速度相对CentOS 7提升29%。
  • 针对ECS实例环境优化了多任务的场景,提升大规格实例多任务的性能,同样规格下能有16%的性能提升。
  • 更高效的系统调用,系统调用的性能提升11%。
  • Linux网络栈的优化,综合网络性能相对CentOS 7提升7.8%。
  • Aliyun Linux 2默认是编译好BBR的拥塞控制算法的,在公网访问较多的场景中允许用户修改拥塞控制算法为BBR(Bottleneck Bandwidth and RTT),提升公网访问的带宽稳定性。
  • 针对TLS协议的加密优化。
  • 支持新的Budget Fair Queueing的IO调度器,降低云盘的延迟。

ACK结合Aliyun Linux 2的场景优化

阿里云容器化业务通过内核级的优化,让容器任务混布的密度提升的同时不影响在线业务的响应。Aliyun Linux 2的操作系统和Kernel中包含了这些优化。ACK针对这些优化特性,提供了多场景的优化,促进容器化业务跑的更快更平稳。
  • 容器网络优化

    Aliyun Linux 2拥有4.19的高内核版本。在Aliyun Linux 2的节点上,ACK Terway网络插件支持IPVlan的容器网络模式,在网络小包的场景下相对传统bridge和策略路由网络性能提升40%。Aliyun Linux 2默认编译了BBR的拥塞控制算法,在公网访问较多的场景中允许用户修改容器的拥塞控制算法为BBR,提升公网访问的带宽稳定性,在容器的公网连接和跨公网的镜像拉取上性能大幅提升。

  • 安全沙箱支持和优化

    阿里云与Kata Containers和Clear Linux社区合作。在弹性裸金属实例上,您可以无缝地部署整套Kata Containers的解决方案。ACK还优化了安全沙箱(RunV)镜像的启动时间,使得Kata Containers的整体解决方案可以正常运行。ACK在此之上,提供了和普通集群体验几乎一致的安全沙箱容器集群,让应用运行在一个轻量虚拟机沙箱环境中,适合于多用户间的负载隔离,对不可信应用的隔离,在提升安全性的同时,对性能影响也做到非常小。

  • 节点AutoScaler优化

    Aliyun Linux 2针对ECS实例环境大幅优化启动速度,节点的启动时间相对CentOS 7的系统降低29%。结合ACK灵活高效的自动弹性伸缩,在应用压力来临时,ACK集群会自动根据负载状况创建和启动ECS的节点加入集群,并调度和启动应用实例。Aliyun Linux 2的快速扩容启动的能力让计算资源可以及时满足流量峰值的需求。

  • CoreDNS优化

    针对UDP协议的conntrack表的占用优化,在ACK集群中部署密度高了后经常遇到DNS的解析问题,大部分是因为DNS查询的UDP协议对conntrack的占用太多不释放导致,而Aliyun Linux 2中的conntrack的优化可以让同样DNS查询频率的conntrack表占用减少一半,从而大大提高集群中应用DNS查询的成功率。

  • 更细粒度的资源监控和控制能力

    Aliyun Linux 2的内核提供了针对容器场景的PSI压力模型、per-cgroup kswapd、memory priority等的细粒度可视化和控制能力。在Aliyun Linux 2的ACK集群中我们可以通过CGroup Controller来利用这些能力,可以实现细粒度BufferIO Control、TCP、CPUSet、Mem、NUMA等细粒度资源的配置和动态更新,在逐步提升资源利用率的同时也能保障应用间的互相干扰降到最低。

  • AI和数据加速

    Aliyun Linux 2对大规格机型和多任务的优化可以提升高性能计算任务的速度,对存储的流式读写的优化也可以提高模型大文件的读写性能,综合起来大大加速AI和高性能计算任务的效率。实际测试场景如下:

    • 通过Alluxio利用64个线程加载OSS数据1152个文件144G,在CentOS需要3m25s,Aliyun Linux 2只需2m19.037s,速度是CentOS上的1.6倍。
    • 运行ResNet50 Batch 128模型训练,数据缓存到Alluxio中,在CentOS下V100仅仅为5212.00 images/s。在Aliyun Linux 2下V100可以达到8746.59 images/s, 速度是CentOS上的1.7倍。
  • 其他
    • 使用Linux 4.19的内核,ACK将阿里巴巴内核和容器化实践融入其中。
    • 降低Overlayfs的性能损耗,减少容器化对存储性能的损失。
    • 大量sysctl namespace化,在4.19的内核中大部分sysctl配置都支持在容器中单独设置,比如TCP的超时和重传时间,不同应用有不同的超时和重传的需求,但是在CentOS 7的内核中是修改不了的,在Aliyun Linux 2中支持对其做Pod级别的配置。

如何使用Aliyun Linux 2作为集群节点系统镜像

您可以在创建集群的配置过程中,将操作系统选择为AliyunLinux 2.1903来使用Aliyun Linux 2作为集群节点系统镜像。具体步骤,请参见创建Kubernetes集群

linux
说明 如果您选用Aliyun Linux 2,在创建集群以及后期扩容节点、添加节点、自动伸缩节点时,ACK会自动检测Aliyun Linux 2的安全补丁更新并自动安装补丁。