删除Kubernetes集群失败

问题描述 在容器服务控制台中,删除Kubernetes集群失败,并提示ROS stack 无法删除的错误。说明:以下操作本文以删 除VPC实例下的交换机资源失败为例,其它报错信息请参见更多信息。问题原因 Kubernetes 集群被外部...

新建集群

在创建租户与数据库前,需要先创建集群,这要求您拥有一个阿里云账号。如未注册阿里云账号,请进入 阿里云 官网,点击页面右上角 免费注册 按钮,进行注册。创建集群步骤: 登录并进入 OceanBase 管理控制台。在 ...

容器服务中创建Kubernetes集群失败

问题描述 创建Kubernetes集群时出错,日志显示如下。k8s-for-cs-c06fb.055d5598-ff44-43. ALIYUN:ROS:Stack Resource CREATE failed:WaitConditionFailure: resources.k8s_master_cloudinit_wait_cond:Signal 1 ...

Kubernetes集群创建失败的解决方法

概述 本文主要介绍在Kubernetes集群创建失败时,如何查找失败的原因,并解决问题。详细信息 您可以参考以下步骤,通过集群日志查看集群创建失败的报错信息,然后根据相应的解决方法解决问题: 登录Kubernetes控制台...

快速创建Kubernetes集群

关于使用ACK快速创建Kubernetes集群的操作文档,请参见快速创建Kubernetes托管版集群

Kubernetes管控集群链路异常的排查思路

连接Kubernetes集群,详情请参见通过kubectl连接Kubernetes集群,执行以下命令,查看集群命名空间。kubectl get ns 如下图所示,说明是正常情况,则执行下一步操作。若返回结果异常或为空,则为集群内部问题,请执行...

ECS集群应用日志清理机制是什么

日志目录下的日志(具体以ECS集群应用部署的ECS主机上使用admin用户执行crontab-l 看到的每天凌晨3点10分的定时清理任务为准),有定时清理脚本的情况:[admin@iZbp1bzvz55uz2x8s0bXXXX~]$crontab-l 10 3*/home/...

Kubernetes集群网络异常的排查方法

问题描述 在Kubernetes集群内,某个节点上的Pod出现网络访问异常,具体现象如下所示。Pod访问外网异常。Pod访问其他Service异常。Pod访问其他节点上的Pod异常。问题原因 集群内ECS的安全组配置错误或者冲突。集群内...

通过CloudShell管理集群出现超时问题

容器服务集成了CloudShell,所以用户可以通过此工具管理集群 在用户使用CloudShell管理集群时,可能会出现如下超时错误。Unable to connect to the server:dial tcp XX.XX.XX.XX:6443:i/o timeout 问题原因 容器服务...

Kubernetes集群如何指定安全组

概述 本文主要介绍Kubernetes集群如何指定安全组。详细信息 目前暂不支持给Kubernetes集群指定安全组。但是在创建Kubernetes集群时,容器服务Kubernetes会自动创建一个默认安全组,您可以通过修改默认安全组的规则,...

云数据库Redis版是否支持分布式集群的形态?

云数据库Redis版支持分布式集群的形态。集群实例提供更大的存储容量及更高的处理能力。关于云数据库Redis版集群实例支持的命令请参见Redis命令支持。

容器服务ACK集群故障排查

概述 本文主要介绍关于如何排查ACK集群出现的问题。详细信息 检查集群节点 首先要做的是查看集群中的节点状态,确认所有的Node节点都存在并且状态是Ready,命令如下。kubectl get nodes 系统显示类似如下。对于异常...

将ECS实例导入集群失败

问题描述 在EDAS控制台的应用配置页面,实例来源选择使用已有实例,实例来源类型选择未导入到集群的实例,将ECS实例导入集群失败,并提示以下报错: 导入机器到集群失败,目前仅支持操作系统是Aliyun LInux 2.1903 ...

子账号使用Kubernetes集群权限问题

问题描述 使用子账号登录控制台访问容器集群时,提示如下错误。已确认该子账号拥有容器服务产品的Full权限。注:Full权限对应的是 AliyunCSFullAccess策略。您没有权限进行当前操作。如果您是子账号用户,请联系主...

删除ACK集群后Prometheus Agent未同步删除

问题描述 已经在Kubernetes控制台中删除对应的ACK集群,但是在Prometheus控制台的监控列表页面,对应的Prometheus Agent未同步删除,且集群状态为灰,重新创建同名集群失败,单击集群并提示以下信息。当前集群已经卸...

如何收集Kubernetes集群的诊断信息

当Kubernetes集群出现问题或者节点异常时,则需要收集Kubernetes集群的诊断信息以供数据分析使用,本文主要介绍如何收集Kubernetes集群的诊断信息。详细信息 当Kubernetes集群异常时,只需要在Master节点上收集...

添加Kubernetes集群节点的常见问题

概述 本文主要介绍添加已有的ECS实例到Kubernetes集群的常见问题。详细信息 阿里云提醒您: 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于...

容器服务Swarm集群节点调度异常

解决方案集群管理会检查所有的容器来防止端口配置冲突,即使没有在运行状态的容器,如果已经声明过端口映射。相应的宿主机端口也会标记为已占用。登录服务器,执行如下命令,查看是否存在问题描述中报错的端口。...

应用部署在多个实例后,集群中会话如何共享?

目前 EDAS 尚未提供分布式 Session 管理的功能,您可以借助一些可以存储共享存储信息的缓存系统(例如:云数据库 Memcache 版,Redis 等)来进行管理。

Kubernetes集群如何指定RAM中的自定义角色

概述 本文主要介绍Kubernetes集群如何指定RAM中自定义角色。详细信息 Kubernetes集群暂不支持指定RAM中的自定义角色,在Kubernetes集群中创建Worker时会自动生成一个角色,您可以通过给该角色添加Policy的方式,从而...

容器服务Kubernetes集群中SLB实例的具体用途

概述 本文主要介绍容器服务Kubernetes集群SLB实例的默认创建数量以及具体用途。详细信息 默认创建SLB实例的数量 如果创建Kubernetes集群时勾选了安装 Ingress 组件,那么会创建两个SLB实例。SLB实例的具体用途 两个...

如何采集K8s集群的容器日志

概述 本文主要介绍如何采集K8s集群的容器日志。详细信息 日志服务支持通过DaemonSet方式和Sidecar方式采集Kubernetes集群的容器日志,具体操作请参见采集容器日志。适用于 日志服务

应急预案:pai集群容器产生僵尸进程的修复方法

pai集群PaiJcs#服务角色的pai_jcs容器和PaiCap#服务角色的pai_cap容器产生大量僵尸进程,导致宿主机无法创建新的进程,影响宿主机上其他容器。如果发现有pai_jcs和pai_cap容器,则按照以下临时解决方法,修复并预防...

如何查看阿里云容器服务Kubernetes版集群的容器网段和...

概述 本文主要介绍如何在容器服务控制台中,查看阿里云容器服务Kubernetes版集群的容器网段和节点网段。详细信息 Flannel和Terway网络插件查看网段的方法不同,请参考以下内容查看。Flannel网络插件 查看ACK集群的...

如何确认Kubernetes集群内应用的出网地址

概述 本文主要介绍在Kubernetes集群内,如何确认应用的出网地址。详细信息 应用需要访问其他云服务或第三方服务,但相关服务存在安全策略,需要添加应用的出网地址到白名单。请根据当前环境是否使用Terway网络插件,...

Kubernetes集群移除节点报错

问题描述 在集群节点池的页面中移除节点失败,出现如下报错。Failed to drain node[cn-beijing.10.0.18.xx], err:drain-node job execute timeout,last logs is:node/cn-beijing.10.0.18.xx already cordoned ...

Kubernetes集群配置自动伸缩组件失败

问题描述 在Kubernetes集群配置自动伸缩组件失败。cluster-autoscaler Pod一直处于失败重启的状态,无法正常运行。查看该Pod日志,确认包含如下类似错误信息。问题原因 配置RAM Role角色和权限出错,包含如下几种...

自建Kubernetes集群使用Prometheus监控时无Pod监控...

问题描述 自建Kubernetes集群接入Prometheus监控后,在Promethues监控页面的Grafana监控大盘,无法采集并展示Pod...使用Linux环境中的编辑器软件VIM,编辑主机的/var/lib/kubelet/config.yaml文件,文件末尾增加一行 ...

通用方案:专有云V3环境中RocketMQ集群Broker节点上电...

1.概述 本文主要介绍在专有云V3环境中,RocketMQ集群Broker节点的上电方法。1.1.适用范围 专有云V3,RocketMQ 1.2.用户告知 操作复杂度:中 预估执行时长:45分钟 风险等级:低 说明: Broker上电操作对已有的业务及...

在Kubernetes集群如何支持私有镜像

概述 本文主要介绍在Kubernetes集群,如何使用私有镜像编排容器。详细信息 Kubernetes集群支持使用私有镜像编排容器。首先需创建密钥用于编排容器,并且可实现无密钥编排。使用密钥编排容器 使用kubectl连接...

Redis集群中某个节点缓存无法写入

问题描述 在使用阿里云云数据库Redis过程中,集群中某个节点缓存无法写入,且该节点内存使用率过高。问题原因 Redis实例某个节点缓存无法写入是因为数据写入到了一个节点中,存在Key分布不均情况,导致其中一个节点...

如何收集边缘Kubernetes集群节点的诊断信息

概述 本文主要介绍当边缘 Kubernetes 集群的节点出现异常时,如何收集边缘 Kubernetes 集群节点的诊断信息,以供数据分析使用。详细信息 您需要完成以下步骤,在异常边缘节点中收集诊断信息。登录到边缘 Kubernetes ...

Kubernetes集群扩容常见问题的排查及解决方法

概述 本文主要介绍扩容ECS实例到Kubernetes集群常见问题的排查及解决方法。详细信息 阿里云提醒您: 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但...

容器服务的Swarm集群开启日志服务报错

问题描述容器服务的Swarm集群开启日志服务报如下错误。MachineGroup acs-machine-group not exist 系统显示类似如下。问题原因日志服务控制台的acs-machine-group机器组被删除。解决方案 在日志服务控制台中创建acs-...

Kubernetes集群中访问LoadBalancer暴露出去的SLB地址...

问题描述 在Kubernetes集群中有部分节点能访问集群暴露出去的Local类型SLB,但是也有部分节点不能访问,且Ingress出现该问题较多。问题原因 SLB设置了externalTrafficPolicy:Local 类型,这种类型的SLB地址只有在...

应急预案:专有云V2环境AnalyticDB集群的上电方法

1.概述 本文主要介绍在专有云V2环境,发生集群断电后,如何启动AnalyticDB集群,恢复业务。1.1.适用范围 专有云V2企业版,AnalyticDB 1.2.用户告知 适用平台:x86 授权级别:L2(二线技术支持工程师) 临时或固化...

通用方案:专有云V3环境AnalyticDB集群断电方法

1.概述 本文介绍专有云V3环境中,AnalyticDB集群断电方法。1.1.适用范围 专有云V3,AnalyticDB 说明:适用于专有云V3.3及以上的版本。1.2.风险说明 AnalyticDB集群断电,服务将被停止使用,其数据服务依托盘古的基础...

应急预案:专有云V3环境AnalyticDB集群的上电方法

1.概述 本文主要介绍在专有云V3环境,发生集群断电后,如何启动AnalyticDB集群,恢复业务。1.1.适用范围 专有云V3企业版,ECS 说明:适用于专有云V3.3及之后的版本。1.2.用户告知 适用平台:x86 授权级别:L2(二线...

通用方案:专有云V3环境中RocketMQ集群Broker节点断电...

1.概述 本文主要介绍在专有云V3环境中,RocketMQ集群Broker节点的断电方法。1.1.适用范围 专有云V3,RocketMQ 1.2.用户告知 操作复杂度:中 预估执行...服务角色,在过滤出来的主机右侧单击Terminal,登录对应的机器。...

应急预案:专有云V2环境AnalyticDB集群断电方法

1.概述 本文介绍专有云V2环境中,AnalyticDB集群断电方法。1.1.适用范围 专有云V2企业版,AnalyticDB 1.2.用户告知 适用平台:x86 授权级别:L2(二线技术支持工程师) 临时或固化方案:固化 操作复杂度:中 业务...

Kubernetes集群使用Terway网络的IPvlan或Pod独占弹性...

现象三:无法获取集群内的监控数据。现象四:Pod内程序无法访问RDS实例。集群设置Terway网络的IPvlan或Pod独占弹性网卡模式的示例图...Pod内域名解析要求有跨主机Pod通信的能力,故Pod的ENI与ECS必须处于同个安全组。...

通用方案:专有云V2环境AnalyticDB集群断电方法

1.概述 本文介绍专有云V2环境中,AnalyticDB集群断电方法。1.1.适用范围 专有云V2,AnalyticDB 1.2.风险说明 AnalyticDB集群断电,服务将被停止使用,其数据服务依托盘古的基础服务,断电前需确保停止业务录入,保证...

通用方案:专有云V3环境ECS集群盘古水位过高的处理...

1.概述 本文主要介绍在专有云V3环境ECS集群中,盘古水位过高的处理方法。1.1.适用范围 专有云V3,ECS、盘古 说明:适用于专有云V3.0.0~V3.15.0环境,包含V3.0.0和V3.15.0环境。1.2.用户告知 操作方式:灰屏 操作复杂...

Kubernetes集群的GPU问题诊断

快速恢复集群可调度GPU卡数量 如果某个节点的GPU出现问题,那么需要删除该节点上运行的device plugin Pod,然后Kubernetes会自动重新启动一个Nvidia device plugin Pod。使用kubectl delete po [$POD_NAME]-n kube-...

应急预案:专有云环境OTS集群Chunk数量过高的处理方法

1.概述 本文主要介绍在专有云环境,OTS集群Chunk数量过高的处理方法。1.1.适用范围 专有云V2企业版,OTS 专有云V3企业版,OTS 1.2.用户告知 适用平台:x86、ARM 授权级别:L2(二线技术支持工程师) 临时或固化方案...

通用方案:pai集群容器产生僵尸进程的修复方法

pai集群PaiJcs#服务角色的pai_jcs容器和PaiCap#服务角色的pai_cap容器产生大量僵尸进程,导致宿主机无法创建新的进程,影响宿主机上其他容器。如果发现有pai_jcs和pai_cap容器,则按照以下临时解决方法,修复并预防...

应急预案:专有云V3环境AnalyticDB集群的断电方法

1.概述 本文介绍专有云V3环境中,AnalyticDB集群断电方法。1.1.适用范围 专有云V3企业版,AnalyticDB 说明:适用于专有云V3.3及以上的版本。1.2.用户告知 适用平台:x86 授权级别:L2(二线技术支持工程师) 临时或...
共有8条 < 1 2 3 4 ... 8 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
专有宿主机 云虚拟主机 云数据库专属集群 云数据库 Redis 版 云安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用