本文介绍Prometheus Agent采集量和内存、CPU的关系,并提供资源使用建议。

Agent压测报告

单次采集量(单个Agent的采集量)CPU内存
100万0.95核1.09483 GB
110万1.11核1.16045 GB
120万1.36核1.09452 GB
130万1.66核1.15971 GB
140万1.29核1.09465 GB
150万1.50核1.15977 GB
160万1.39核1.15971 GB
170万1.64核1.1599 GB
180万1.63核1.42331 GB

单次采集量可以在带有Prometheus名称的Grafana大盘页面获取。

例如:对于如下PromQL,采集量如下图所示。

sum (scrape_samples_scraped) by (_ARMS_AGENT_ID)
Prometheus的Grafana

资源使用建议

根据Agent压测报告显示,100万的采集量,需要使用约1 GB内存和1核CPU。但为了采集过程正常运行,建议将CPU和内存各50%的使用率分配给Prometheus Agent采集数据。

不同的采集量对应的CPU和内存使用建议如下:

  • 50万(Grafana页面显示为500K)的采集量,建议使用1 GB内存和1核CPU。
  • 100万的采集量,建议使用2 GB内存和2核CPU。
  • 200万的采集量,建议使用4 GB内存和4核CPU。
  • 以此类推。

示例:假设通过Grafana页面观察到目前采集量达到了100万,此时建议您将内存和CPU扩容至2 GB和2核。