云监控为您提供基础的容器监控功能,您可以查看容器服务Kubernetes版集群的概览、节点、命名空间和工作负载的监控数据,时刻掌握容器服务的运行情况。您还可以为容器服务Kubernetes版的集群、节点或容器组(pod)创建报警规则,当符合报警规则时,云监控自动发送报警通知,便于您及时了解容器服务的异常并快速进行处理。

前提条件

请确保您已开通容器服务Kubernetes版,且已创建集群,操作方法请参见首次使用容器服务Kubernetes版

背景信息

容器服务Kubernetes版集群的metrics-server组件必须升级到V0.3.8及以上版本,操作方法请参见升级安装Kubernetes集群的metrics-server组件

查看集群概览

  1. 登录云监控控制台
  2. 在左侧导航栏,单击Kubernetes容器监控
  3. 容器监控页面,单击目标集群的集群名称链接或查看详情
  4. 集群概览页面,查看目标集群的基本信息和监控数据。
    • 集群监控统计概览页签,您可以查看容器组和节点的运行情况,以及CPU和内存消耗的Top数据。
    • 集群监控图表页签,您可以查看指定时间段内所有监控项的监控图表。

查看节点

  1. 登录云监控控制台
  2. 在左侧导航栏,单击Kubernetes容器监控
  3. 容器监控页面,单击目标集群的集群名称链接或查看详情
  4. 在左侧导航栏,单击节点
  5. 节点页面,单击目标节点的实例ID链接或查看详情
  6. 监控图表页签,查看指定时间段内所有监控项的监控图表。

查看命名空间

  1. 登录云监控控制台
  2. 在左侧导航栏,单击Kubernetes容器监控
  3. 容器监控页面,单击目标集群的集群名称链接或查看详情
  4. 在左侧导航栏,单击命名空间
  5. 命名空间页面,单击目标命名空间的名称链接或查看详情
  6. 监控图表页签,查看指定时间段内容器组的运行情况,以及CPU和内存消耗的Top监控图表。

查看工作负载

  1. 登录云监控控制台
  2. 在左侧导航栏,单击Kubernetes容器监控
  3. 容器监控页面,单击目标集群的集群名称链接或查看详情
  4. 在左侧导航栏,单击工作负载
  5. 工作负载页面,查看应用和容器组的监控图表,以及容器组的CPU和内存消耗的Top数据。
    • 无状态有状态守护进程集定时任务任务页签,单击目标应用名称链接或操作列的查看详情,查看应用的监控图表、容器组列表和容器组热点。
    • 容器组页签,单击目标容器组名称链接或操作列的查看详情,查看工作负载中的所有容器组的监控图表。
  6. 工作负载无状态页签,单击目标工作负载的名称链接或查看详情
    您可以从无状态有状态守护进程集定时任务任务容器组维度查看工作负载的CPU和内存的使用量。
  7. 部署应用容器组列表容器组热点维度查看工作负载的基本信息和监控图表。

创建报警规则

  1. 登录云监控控制台
  2. 在左侧导航栏,单击Kubernetes容器监控
  3. 容器监控页面,单击目标集群对应操作列的报警规则
  4. 报警规则页面,单击创建报警规则
  5. 创建报警规则面板,设置报警规则相关参数。
    参数 描述
    资源范围 报警规则的作用范围。取值:
    • 集群:报警规则作用于目标集群。
    • 节点:报警规则作用于目标集群的全部节点或指定节点。
    • 容器组(pod):报警规则作用于目标集群的指定命名空间下应用中的全部容器组或指定容器组。
    规则描述 报警规则的主体。当监控数据满足指定条件时,触发报警规则。
    通道沉默周期 报警发生后如果未恢复正常,间隔多久重复发送一次报警通知。
    生效时间 报警规则的生效时间。报警规则只在生效时间内才会检查监控数据是否需要报警。
    报警回调 云监控会将报警信息通过POST请求推送到该地址,目前仅支持HTTP协议。
    说明 建议您填写公网可访问的URL。
    报警联系组 用于接收报警通知的联系人组。
  6. 单击确定