alicloud-monitor-controller

alicloud-monitor-controller是阿里云容器服务Kubernetes版提供的对接云监控的系统组件。本文介绍alicloud-monitor-controller组件的信息、使用说明和变更记录。

组件介绍

alicloud-monitor-controller是阿里云容器服务Kubernetes版提供的对接云监控的系统组件。当创建、变更、删除应用时,alicloud-monitor-controller会自动同步应用元数据到云监控,从而实现应用的容器监控。此外,alicloud-monitor-controller还提供设置报警模板的功能,开发者可以通过控制台开启该功能。

使用说明

关于alicloud-monitor-controller组件的使用,请参见容器服务报警管理

变更记录

2023年12月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.8.5

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.8.5-88ba904-aliyun

2023年12月25日

支持在不同网络环境下自动配置ACK One、注册集群,并配置默认报警规则。

此次升级不会对业务造成影响。

2023年08月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.8.4

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.8.4-d2d72d6-aliyun

2023年08月14日

  • RBAC权限收敛。

  • 支持在ACK One、注册集群等不同网络环境下配置默认报警规则。

此次升级不会对业务造成影响。

2023年07月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.8.3

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.8.3-d2d72d6-aliyun

2023年07月25日

  • 支持在Arm架构部署节点。

  • SLS报警规则国际化。您可以自定义报警通知的语言,系统也会根据用户所属站点自动选择合适的语言进行通知。

此次升级不会对业务造成影响。

2023年02月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.8.0-7c28347-aliyun

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.8.0-7c28347-aliyun

2023年02月24日

  • ACK报警中心通知方式支持钉钉、企业微信、飞书机器人。

  • 支持默认审计报警规则。

此次升级不会对业务造成影响。

2022年07月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.6.5-2c5c836-aliyun

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.6.5-2c5c836-aliyun

2022年07月07日

  • 支持阿里云内网环境。

  • 修复镜像安全漏洞。

  • 修复网络问题导致的规则同步失败问题。

  • 修复同步阿里云Prometheus报警规则逻辑。

此次升级不会对业务造成影响。

2022年04月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.6.1-aa20856-aliyun

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.6.1-aa20856-aliyun

2022年04月15日

  • 支持阿里云Prometheus默认报警规则,如集群核心组件、集群Workload异常等报警规则。

  • 支持集群节点操作系统内核宕机默认报警规则。

  • 支持无公网访问权限的集群环境。

此次升级不会对业务造成影响。

2022年03月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.5.15-ed0a4c72-aliyun

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.5.15-ed0a4c72-aliyun

2022年03月02日

  • 修复某些情况下,无法同步报警规则的问题。

  • 修复组件镜像安全漏洞。

此次升级不会对业务造成影响。

2021年11月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.5.13-6990db0e-aliyun

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.5.13-6990db0e-aliyun

2021年11月04日

支持容器服务报警中心集群基础资源默认报警能力。

此次升级不会对业务造成影响。

2021年08月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.5.12-f7aedb4a-aliyun

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.5.12-f7aedb4a-aliyun

2021年08月23日

优化容器服务报警配置能力。

此次升级不会对业务造成影响。

v1.5.10-a75e4ee2-aliyun

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.5.10-a75e4ee2-aliyun

2021年08月19日

优化容器服务报警配置能力。

此次升级不会对业务造成影响。

2021年04月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.5.7-e1d5de8a-aliyun

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.5.7-e1d5de8a-aliyun

2021年04月23日

支持容器服务事件报警能力,可通过CRD方式配置容器服务事件报警。

此次升级不会对业务造成影响。

2020年07月

版本号

镜像地址

变更时间

变更内容

变更影响

v1.4.0-49ff2362-aliyun

registry.{REGION}.aliyuncs.com/acs/alicloud-monitor-controller:v1.4.0-49ff2362-aliyun

2020年07月24日

  • 支持采集Windows节点池与Linux节点池混合部署场景。

  • 支持调整多档位的弹性灵敏度,目前支持15s、20s、30s、60s四个档位。

  • 修复应用滚动更新时HPA误弹的问题。

此次升级不会对业务造成影响。

问题诊断

云监控无应用分组

请按照以下方式进行预检查:

  • 检查kube-system命名空间下alicloud-monitor-controller的Pod是否正常运行。

  • 检查组件版本,如果组件的版本与当前最新的版本存在差异,建议升级组件版本。

  • 检查组件对应的日志,查看是否存在网络超时、SDK调用报错等问题。

按上述说明检查后,没有发现问题,请按照以下工单模板提交工单

工单模板

  1. 是否已更新至最新版本。

  2. 组件日志是否存在SDK调用流控等异常问题,如存在异常请删除Pod。

    未发现,重启未恢复

  3. 工单内附完整alicloud-monitor-controller日志。

    上传日志详情压缩包

云监控应用分组无数据

请按照以下方式进行预检查。

检查应用分组中实例名称是否与应用的Pod名称相对应:

  • 如果实例名称异常,请按照上述云监控无应用分组的检查方法进行检查。

  • 如果实例名称正常,则检查kube-system命名空间下的metrics-server的Pod是否正常运行,检查日志是否正常稳定输出。如果日志中出现Successful write 164190 bytes metrics to monitor server,则表明日志正常稳定输出。

按上述说明检查后,没有发现问题,请按照以下工单模板提交工单

工单模板

  1. 检查分组中实例的名称是否与应用的Pod一致。

  2. 检查kube-system下的metrics-server组件是否可以正确输出日志。

  3. 提供集群ID、应用名称、Pod名称。