为AHPA开启Prometheus大盘

阿里云Prometheus监控提供一键安装AHPA组件功能,并提供开箱即用的专属监控大盘。本文介绍如何为AHPA开启Prometheus监控。

前提条件

  • 已在集群中开启阿里云Prometheus监控,且Prometheus Agent版本为3.0.0以上,请参见步骤一:开启阿里云Prometheus监控

  • 已部署AHPA,且版本为v2.0.0及以上,请参见部署AHPA

  • 已将如下预测结果的代码写入Prometheus配置。

    展开查看代码详情

    apiVersion: v1
    kind: ConfigMap
    metadata:
      name: application-intelligence
      namespace: kube-system
    data:
      prometheus_writer_url: http://cn-hangzhou-intranet.arms.aliyuncs.com/prometheus/190601496873****/cd5ec926b715e41b282296d1415a1***/cn-hangzhou/api/v3/write
      prometheus_writer_ak: xxx
      prometheus_writer_sk: xx
      ...
    • prometheus_writer_url:设置Remote Write内网地址。

    • prometheus_writer_ak: 设置阿里云账号的AccessKeyID。

    • prometheus_writer_sk:设置阿里云账号的AccessKeySecret。

步骤一:接入AHPA

您可以参见下方步骤将AHPA组件接入阿里云Prometheus。

  1. 登录ARMS控制台

  2. 在左侧的导航栏,单击接入中心,然后在页面的搜索栏输入AHPA

  3. 单击AHPA资源卡片,根据页面信息提示,选择待接入的容器服务集群和配置信息,完成AHPA的接入

    配置项

    说明

    接入名称

    当前AHPA监控唯一名称。

    metrics采集间隔(秒)

    监控数据采集时间间隔。

查看AHPA大盘数据

  1. 登录ARMS控制台

  2. 在左侧的导航栏,单击接入管理,然后单击已接入组件

  3. 单击AHPA资源卡片,然后单击大盘列表页签,单击具体大盘名称,在Grafana查看AHPA监控大盘的详情数据。

Prometheus监控提供的AHPA大盘数据包括CPU使用率、Pod数、预测Pod数等。

  • CPU使用率&实际POD数大盘:当前工作负载(Deployment)的CPU平均利用率以及Pod数量。

  • CPU实际使用量与预测使用量:当前工作负载中Pod的CPU使用总量与预测给出的使用量。如果预测给出的使用量大于实际使用量,则表明预测的CPU容量充足。

  • Pod趋势:实际Pod数、推荐Pod数以及主动预测的Pod数。

    • 实际Pod数:当前运行中的Pod数量。

    • 推荐Pod数:AHPA推荐扩缩容Pod数。综合主动预测、被动预测以及边界区间给出的最终Pod数。

    • 主动预测:是基于历史数据,识别出周期性,然后预测出来的Pod数。

AHPA关键指标说明

指标名

说明

ahpa_proactive_pods

主动预测Pod数

ahpa_reactive_pods

被动预测Pod数

ahpa_requested_pods

推荐Pod数

ahpa_max_pods

最大Pod数

ahpa_min_pods

最小Pod数

ahpa_target_metric

目标阈值

相关文档

在云原生场景下,资源容量通常难以预估,而使用K8s原生的HPA,需要面对弹性滞后以及配置复杂问题。AHPA(Advanced Horizontal Pod Autoscaler)弹性预测可以根据业务历史指标,自动识别弹性周期并对容量进行预测,帮助您提前进行弹性规划,解决弹性滞后问题。关于AHPA的更多实践,请参见弹性伸缩最佳实践