概述

本文主要介绍如何收集Kubernetes集群的诊断信息。

 

详细信息

当Kubernetes集群出现问题或者节点异常时,则需要收集Kubernetes集群的诊断信息以供数据分析使用。当集群异常时,需要在Master节点上收集Kubernetes集群的诊断信息。当Worker节点异常时,则需要在Master节点和异常的Worker节点上收集Kubernetes集群的诊断信息。以下方法Master和Worker节点同时适用,本文以Maste节点为例。

  1. 登录Kubernetes集群的Master节点,详情请参见通过kubectl连接Kubernetes集群
  2. 执行如下命令,下载诊断脚本。
    curl -o /usr/local/bin/diagnose_k8s.sh http://aliacs-k8s-cn-hangzhou.oss-cn-hangzhou.aliyuncs.com/public/diagnose/diagnose_k8s.sh
  3. 执行如下命令,给诊断脚本添加执行权限。
    chmod u+x /usr/local/bin/diagnose_k8s.sh
  4. 执行如下命令,进入指定目录。
    cd /usr/local/bin
  5. 行如下命令,运行诊断脚本。
    diagnose_k8s.sh
    系统显示类似如下,每次执行诊断脚本,产生的日志文件名称不同,本文以diagnose_1514939155.tar.gz为例,现场以实际环境为准。
    ......
    + echo 'please get diagnose_1514939155.tar.gz for diagnostics'
    please get diagnose_1514939155.tar.gz for diagnostics
    + echo '请上传 diagnose_1514939155.tar.gz'
    请上传 diagnose_1514939155.tar.gz
  6. 执行如下命令,查看存放集群诊断信息的文件。
    ls -ltr | grep diagnose_1514939155.tar.gz
    注:将diagnose_1514939155.tar.gz替换为现场环境产生的日志文件名称。

 

适用于

  • 容器服务 Kubernetes 版