文档

如何在不同场景下进行CPU性能优化

更新时间:

本文主要介绍了不同场景下的CPU性能优化方案。

场景

方案选择

性能

ACK节点运行在开启NUMA的弹性裸金属服务器

  • 计算密集性负载

  • 在线业务负载

  • 数据库类型

  • 稳定的平均响应时RT(Response Time)。

  • 最小化CPU限流。

  • CPU使用率提升。

ACK节点运行在弹性裸金属服务器/大规格ECS实例(32核以上)

  • 大数据负载, 例如SparkJob

  • 机器学习负载, 例如TFJob, MPI

最大化利用碎片化CPU,提升CPU使用率。

ACK节点运行在开启NUMA的弹性裸金属服务器/大规格ECS实例(32核以上)

允许核绑定的延迟敏感负载和BestEffort负载的混合部署。

最大化保持延迟敏感负载的RT,CPU时间片和内存回收策略。

ACK节点运行在弹性裸金属服务器/大规格ECS实例(32核以上)

使用CPUShare模式的多种负载的混合部署。

  • 弹性资源限制

  • 容器内进程优先级设置 QoS Identity

  • 网卡中断的NUMA绑定

  • 内存回收策略

最大化保持延迟敏感负载的RT,压缩BE负载对LS的影响在5%范围以内。

ACK节点运行在AMD弹性裸金属服务器

  • 计算密集性负载

  • 在线业务负载

  • Redis等内存数据库

  • 对8核CPU以下在线应用大幅降低RT 30%以上,提升吞吐45%。

  • 稳定的RT。

  • 最小化CPU限流。

  • CPU使用率提升。

ACK节点运行在Arm弹性裸金属服务器

  • 计算密集性负载

  • 在线业务负载

CPU拓扑感知调度

  • 对8核CPU以下在线应用大幅降低RT 20%以上,提升吞吐20%。

  • 稳定的RT。

  • 最小化CPU限流。

注册集群管理线下物理节点调度

  • 计算密集性负载

  • 自建数据库

CPU拓扑感知调度

具体性能与CPU类型有关。

CPU性能优化后,L3感知/缓存和内存带宽动态隔离、CCX/CCD亲和性调度、CPU拓扑感知优化效能提升幅度如下图所示。

1

  • 本页导读 (1)