文档

使用阿里云Prometheus监控ACS集群状态

更新时间:

您可以通过阿里云Prometheus监控查看预先配置的监控大盘和监控性能指标。本文介绍如何在ACS中接入阿里云Prometheus监控、如何配置Prometheus监控报警和自定义Prometheus监控指标,并通过Grafana展示。

阿里云Prometheus监控介绍

阿里云Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,且提供全面托管的Prometheus服务。ACS集群完全兼容Prometheus生态体系、通用功能等相关能力。借助阿里云Prometheus监控,您无需自行搭建Prometheus监控系统,因而无需关心底层数据存储、数据展示、系统运维等问题。有关阿里云Prometheus监控的更多信息,请参见什么是可观测监控 Prometheus 版

Prometheus监控组件

ACS集群开服的时候默认就已经安装托管版Prometheus监控组件。单击页面左侧运维管理,选择Prometheus 监控功能。

类型

说明

托管版

由阿里Prometheus云服务直接采集您集群中的容器监控数据,提供开箱即用以及Serverless化的体验。

说明

在创建ACS集群时会默认开启Prometheus监控服务,请参见创建ACS集群。默认开启的Prometheus不收费。

配置Prometheus监控报警

为监控任务创建报警可在满足报警条件时通过邮件、短信、钉钉等渠道实时报警,主动帮助您发现异常。报警规则被触发时会向您指定的联系人分组发送通知,而在创建联系人分组之前必须先创建联系人。创建联系人时,您可以指定联系人用于接收通知的手机号码和邮箱地址,也可以提供用于自动发送报警通知的钉钉机器人地址。

步骤一:创建联系人

  1. 登录Prometheus控制台,在Prometheus监控页面左上角,选择容器服务K8s集群所在的地域。

  2. 在左侧导航栏,选择告警管理 > 通知对象

  3. 联系人页签单击新建联系人

  4. 新建联系人对话框中根据实际需求设置以下参数,然后单击确认

    参数

    说明

    姓名

    自定义联系人姓名。

    手机号

    设置联系人的手机号码后,可以通过电话和短信的方式接收告警通知。

    说明

    仅验证过的手机号码可以在通知策略中使用电话的通知方式,验证手机号的操作,请参见验证手机号

    邮箱

    设置联系人的邮箱地址后,可以通过邮箱接收告警通知。

    联系人组

    选择联系人需要加入的联系人组。创建联系人组的操作,请参见联系人组

    电话通知失败补发类型

    选择电话通知失败后,通知补发类型。

    您可以在联系人页签设置全局默认值,具体操作,请参见下文联系人默认配置

    用户标识

    在企业内使用的IM工具(目前支持钉钉、飞书、企业微信)对应的用户ID,如钉钉号、企微号等。

    该字段可用于群内告警卡片@联系人的功能。如您需要使用该功能,请正确填写对应IM工具的ID号。

    目前飞书、企业微信的@联系人功能必须依赖该字段,钉钉暂不依赖该字段。

    重要
    • 手机号码和邮箱至少填写一项,每个手机号码或邮箱只能用于一个联系人。

    • 新版联系人不支持设置钉钉机器人,如果您需要创建钉钉机器人,请在钉钉/飞书/企微页签新建钉钉机器人。具体操作,请参见钉钉机器人。已在旧版联系人中创建的钉钉机器人则保留不变。

步骤二:配置告警规则

  1. 登录Prometheus控制台,在左侧导航栏,单击接入管理

  2. 应用实施监控服务ARMS > 接入管理右侧页面单击要配置规则的集群名,进入对应集群的接入管理页面。

  3. 单击告警规则,在告警规则列表,单击对应告警规则右侧的编辑,编辑告警规则,配置完成后单击保存。更多信息,请参见Prometheus告警规则(新版)Prometheus告警规则(旧版)

自定义Prometheus监控指标

可观测监控 Prometheus 版也提供了高阶监控指标的采集和配置方式。详细的配置请参见:

开启集群网络监控(CoreDNS 和 Ingress流量监控)

ACS产品默认会集成ARMS并免费采集核心管控以及基础指标(Pod、容器),但不会采集CoreDNS和集群Ingress相关指标数据,相关配置需要进入登录Prometheus控制台进行配置,同时2款组件产品的数据采集属于收费项目。

在ACS控制台点击页面左侧运维管理 > 组件管理,页面右侧提供ALB Ingress ControllerCoreDNS托管版组件安装能力,您可以按需选择。

image您也可以选择在集群内自行安装社区版软件。详细配置,请参见:通过接入中心接入数据