本文主要介绍可观测监控 Prometheus 版的监控组件Helm的版本发布说明。

2023年

Helm版本号Agent镜像版本号功能概述发布时间
v1.1.15arms-prom-operator:v4.0.0适配ACK容器集群的K8s 1.26版本。2023年05月
v1.1.14arms-prom-operator:v4.0.0
  • 优化Memory约30%和CPU约50%的资源消耗,提升采集能力。
  • 进一步降低对CoreDns域名解析依赖,变为若依赖,提升数据发送稳定性。
  • ServiceMonitor支持BasicAuth认证。
  • 修复RemoteWrite解析Secret类型问题。
  • 增加3项自监控埋点。
  • Metrics Metadata展示指标含义。
  • 新增收集集群事件指标的采集任务。
  • Multi-Master机制,可应对超大规模集群服务发现和Targets调度,默认关闭。
  • BugFix 3+项。

2023年

Helm版本号Agent镜像版本号功能概述发布时间
v1.1.13gpu-prometheus-exporter:v2.3.6-994eaf7-aliyun
  • 升级GPU-Exporter v2.3.6-994eaf7-aliyun。
  • 支持ACK One注册集群。
2023年04月
v1.1.12
  • arms-prom-operator:v3.2.1
  • gpu-prometheus-exporter:v2.3.6-fdb40f2-aliyun
  • 升级GPU-Exporter v2.3.6-fdb40f2-aliyun。
  • 优化组件镜像拉取速度。
2023年02月

2022年

Helm版本号Agent镜像版本号功能概述发布时间
v1.1.11arms-prom-operator:v3.2.1
  • 增加服务降级功能,在Remote Write失败时优先保证主链路采集稳定。
  • 支持采集Job中Global Config的修改。
  • Remote Write增强,当CoreDNS发生解析域名失败时,自动切换为提前缓存的IP方式发送。
  • Remote Write支持配置多个发送地址。
2022年12月
v1.1.9arms-prom-operator:v3.2.0
  • Agent支持多种CPU架构,包括amd64、arm、arm64、ppc64le、s390x。
  • Agent自监控能力增强。
  • Agent内存垃圾回收策略优化。
  • 优化多副本Target调度策略,避免Worker内存泄漏。
  • Agent内存降级问题修复。
  • 修复多副本状态下的边界条件死锁问题。
  • 新增4种服务发现的能力,包括IonOS、PuppetDB、Uyuni、Vultr。
2022年09月
v1.1.7
  • arms-prom-operator:v3.1.0
  • gpu-prometheus-exporter:v2.3.6-2.0.0-0c0440f
支持新版GPU-Exporter指标与大盘。更多信息,请参见开启集群GPU监控2022年07月
v1.1.6
  • arms-prom-operator:v3.1.0
  • gpu-prometheus-exporter:v1.0.1-26c5321
修复GPU-Exporter v1x版本数据采集问题。2022年06月
v1.1.5arms-prom-operator:v3.1.0
  • 支持集成中心。
  • 支持超大规模集群(>1万节点)。
  • 支持设置非可观测监控 Prometheus 版控制台创建的ServiceMonitor和PodMonitor同步。
  • 支持配置非可观测监控 Prometheus 版控制台创建的ServiceMonitor与PodMonitor声明式服务发现。
    Annotations: arms.prometheus.io/discovery=true|false
  • 支持Agent HPA副本数上限可参数化配置。
  • 支持编辑Prometheus基础指标Job部分字段。
  • 支持在线校验ServiceMontor、PodMonitor及Prometheus.yaml相关配置文件。
  • 优化CPU、内存资源使用与系统稳定性。
2022年05月

2021年

Helm版本号Agent镜像版本号功能概述发布时间
v1.1.0arms-prom-operator:v3.0.0
  • 支持PodMonitor。
  • 支持自定义Namespace。
  • CMS支持GPU数据。
  • 支持Agent日志在线化。
2021年10月
v1.0.0arms-prom-operator:v3.0.0
  • 按目标抓取量调度。
  • 按量HPA能力。
  • 性能优化。
  • Bug修复:修复CMS磁盘使用率数据为0的问题。
2021年09月
v0.1.8arms-prom-operator:v0.1
  • 优化升级能力。
  • 优化自建K8s公网接入。
  • Bug修复:修复云服务Region标签不准确问题。
2021年07月

2020年

Helm版本号Agent镜像版本号功能概述发布时间
v0.1.5arms-prom-operator:v0.1
  • 支持阿里云容器服务Kubernetes版v1.18集群。
  • 支持镜像Region从内网地址拉取。
2020年10月
v0.1.4arms-prom-operator:v0.1
  • 开箱即用的K8s容器监控,包括Pod监控、Node监控和Resource监控等,主要用于监控应用所在的K8s容器运行时。
  • 白屏化的组件监控,包括MySQL、Redis、Kafka、ZooKeeper和Nginx等常见的9种组件监控,主要用于监控应用依赖中间件的场景。
  • 全托管的可观测监控 Prometheus 版系统,包括Prometheus.yaml采集规则、Grafana大盘和告警系统,可以满足自建Prometheus迁移阿里云的需求场景。
  • Bug修复:修复鉴权访问Bug。
2020年07月
v0.1.3arms-prom-operator:v0.1增加Agent资源使用限制。2020年04月

2019年

Helm版本号Agent镜像版本号功能概述发布时间
v0.1.2arms-prom-operator:v0.1初始发布版本。2019年08月