前提条件

请先检查kube-system命名空间下是否已经部署了alicloud-monitor-controller,若未部署,请进行旧版本集群升级。

使用方式

  1. 登录 容器服务管理控制台
  2. 在Kubernetes菜单下,单击左侧导航栏中的部署,进入部署列表页面。
  3. 选择所需的deployment,单击右侧的监控,或者在内置的Kubernetes Dashboard的部署页面中单击监控




    此时会跳转到云监控的相应的监控视图页面。



  4. 应用分组支持分组实例两个维度的监控。




  5. 如需告警设置,分组级别的指标以group开头,实例级别的指标以pod开头。


旧版本集群升级

  1. 登录 容器服务管理控制台
  2. 在Kubernetes菜单下,单击左侧导航栏中的应用 > 部署,进入部署列表页面,单击右上角的使用模板创建


  3. 选择所需的集群,Kube-system命名空间,使用以下的示例模板,然后单击创建
    说明
    根据自己的集群替换REGIONCLUSTER_ID,并重新部署Heapster的yaml编排。


    heapster示例编排模板如下。若集群中已有旧版本的heapster,您也可登录到Kubernetes集群,执行kubectl apply -f xxx.yaml命令进行更新。

    apiVersion: extensions/v1beta1
    kind: Deployment
    metadata:
      name: heapster
      namespace: kube-system
    spec:
      replicas: 1
      template:
        metadata:
          labels:
            task: monitoring
            k8s-app: heapster
          annotations:
            scheduler.alpha.kubernetes.io/critical-pod: ''
        spec:
          serviceAccount: admin
          containers:
          - name: heapster
            image: registry.##REGION##.aliyuncs.com/acs/heapster-amd64:v1.5.1.1
            imagePullPolicy: IfNotPresent
            command:
            - /heapster
            - --source=kubernetes:https://kubernetes.default
            - --historical-source=influxdb:http://monitoring-influxdb:8086
            - --sink=influxdb:http://monitoring-influxdb:8086
            - --sink=socket:tcp://monitor.csk.##REGION##.aliyuncs.com:8093?clusterId=##CLUSTER_ID##&public=true
    alicloud-monitor-controller 的示例编排如下,执行 kubectl create -f xxx.yaml命令部署alicloud-monitor-controller。
    apiVersion: extensions/v1beta1
    kind: Deployment
    metadata:
      name: alicloud-monitor-controller
      namespace: kube-system
    spec:
      replicas: 1
      template:
        metadata:
          labels:
            task: monitoring
            k8s-app: alicloud-monitor-controller
          annotations:
            scheduler.alpha.kubernetes.io/critical-pod: ''
        spec:
          hostNetwork: true
          tolerations:
          - effect: NoSchedule
            operator: Exists
            key: node-role.kubernetes.io/master
          - effect: NoSchedule
            operator: Exists
            key: node.cloudprovider.kubernetes.io/uninitialized
          serviceAccount: admin
          containers:
          - name: alicloud-monitor-controller
            image: registry.##REGION##.aliyuncs.com/acs/alicloud-monitor-controller:v1.0.0
            imagePullPolicy: IfNotPresent
            command:
            - /alicloud-monitor-controller
            - agent
            - --regionId=##REGION##
            - --clusterId=##CLUSTER_ID##
            - --logtostderr
            - --v=4
  4. 更新完毕后,进入Kubernetes 控制台,在kube-system命名空间中,可看到这两个Deployment处于运行中,即升级完毕。


对于不清楚自己REGION信息的开发者,可以通过如下的方式快速查询,打开ECS控制台,选择自己集群所在的地域,页面地址URL中最后一段即是REGION。