ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

系统架构

Region内可用区之间的管控服务器集群为多活模式,任一可用区管控服务器集群可承担Region下其他可用区所有解析配置下发流量。解析层:解析层在全球Region内均有部署,每个可用区均部署解析服务器集群,集群内解析服务器负载均摊。Region内...

历史功能发布记录(2023年)

全部 开启事件驱动功能 2023年11月 产品 功能名称 功能描述 发布地域 相关文档 容器服务 Kubernetes 版 托管节点池时开启指定自动化运维功能 在创建或编辑托管节点池时,您可以选择开启节点故障自愈、kubelet自动升级、CVE自动修复等功能,...

集群高可用架构推荐配置

containerPort:80-apiVersion:policy/v1beta1 kind:PodDisruptionBudget metadata:name:pdb-for-app spec:minAvailable:2 selector:matchLabels:app:app-with-pdb 配置Pod健康检测与自愈 在ACK集群中,您可以配置不同类型的探针来监测和...

CLB释放和挂载

挂载CLB后,ClickHouse集群将实现自动故障转移,通过健康检查分配流量至正常节点,确保集群高可用。挂载CLB属于依赖付费项,如果您不需要该功能,可以对其进行释放。为了保证您的服务可靠性不建议您释放CLB。注意事项 RAM用户暂时不支持CLB...

使用须知及高危风险操作说明

阿里云容器服务Kubernetes版(简称容器服务ACK)提供容器服务相关的技术架构以及核心组件的托管服务,对于非托管组件以及运行在ACK集群中的应用,不当操作可能会导致业务故障。为了更好地预估和避免相关的操作风险,在使用容器服务ACK前,...

创建Kubernetes托管版集群

托管节点池是ACK推出的具有操作系统(OS)CVE漏洞修复、节点自愈等能力的免运维型节点池,可以降低对节点池的运维管理负担,同时提升节点安全性。更多信息,请参见 托管节点池概述。自愈规则 选中 托管节点池 后,可设置此配置项。勾选 ...

历史功能发布记录(2020年及之前)

全部 无 2020年11月 功能名称 功能描述 发布地域 相关文档 托管节点池发布 托管节点池是ACK全新推出的具有自动升级、节点自愈能力的免运维型节点池,为您提供统一的、全托管的节点生命周期管理。您无需关心节点运维操作,如节点组件版本...

主备方案介绍

通常需要进行主备集群切换的场景如下:机房出现断网断电等故障。无法正常连接主集群,请求全部报错。由于软件Bug导致全集群宕机。由于慢盘或者坏盘造成的集群访问超时。故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机...

容器服务报警管理

报警配置功能提供统一管理容器报警场景的功能,包括容器服务异常事件报警、集群相关基础资源的关键指标报警、集群核心组件及集群中应用的指标报警。支持在创建集群时默认开启报警功能。容器服务的报警规则支持通过集群内部署CRD的方式配置...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

将报警配置功能接入注册集群

规则集类型 规则名 规则说明 Rule_Type ACK_CR_Rule_Name SLS_Event_ID critical-events集群重要事件报警规则集 集群Error事件 集群中所有Error Level异常事件触发该报警。event error-event sls.app.ack.error 集群Warn事件 集群中关键...

设置自动/手动启停Serverless集群

本文介绍设置自动或手动启停Serverless集群的方法。设置自动启停 您可以设置开启或关闭Serverless集群的自动启停功能。开启后在设置的 无活动暂停的检测时长 之内,如果集群无业务连接,则集群自动进入暂停状态;如果有任何业务连接接入...

多可用区部署架构

相比单可用区集群,多可用区集群具备更高的容灾能力,可以抵御机房级别的故障。本文将为您介绍如何实施多可用区部署以及如何更换主可用区。前提条件 集群所在的地域需要 PolarDB 在两个及以上的可用区部署了资源。如下地域暂不支持多可用区...

自动切换可用区

概述 PolarDB 开启跨可用区自动切换后,当主可用区故障(例如,主可用区所有计算节点同时故障)时,集群会自动进行主备可用区切换,备可用区中的备库升级为新的主库,恢复集群的可用性。同时,PolarDB 还提供了半同步模式来进行跨可用区的...

系统架构

Proxy 服务器 单节点配置,集群版结构中会有多个Proxy组成,系统会自动对其实现负载均衡及故障转移。分片服务器 每个分片服务器均是双副本高可用架构,主节点故障之后,系统会自动进行主备切换保证服务高可用。配置服务器 用于存储集群配置...

作业类型

背景 批量计算依据您使用集群方式的区别,将作业分为固定集群作业,自动集群作业,组合集群作业三种类型。下面分别介绍三种作业的优缺点,您可依据业务需求选择相应的作业类型。作业概述 固定集群作业 优点:集群支持分布式缓存,适用大...

查看集群概况

智能运维系统通过红黄绿3种颜色来展示集群的健康状况:红色:表示集群已经出现了很严重的问题或者很严重的隐患,已经影响了您的使用,需要立即处理,否则会存在数据丢失,集群故障等问题。黄色:表示集群存在较严重的问题或隐患,可能会...

自动升级集群

启用 ACK Serverless集群 的自动升级功能后,您可以使集群保持周期性的自动升级,降低版本运维压力。配置自动升级策略后,系统会提前生成集群升级计划,在维护窗口期内触发前置检查并升级集群的控制面,让您更专注于容器应用开发。使用限制...

自动升级集群

启用 ACK托管集群 的自动升级功能后,您可以使集群保持周期性的自动升级,降低版本运维压力。配置自动升级策略后,系统会提前生成集群升级计划,在维护窗口期内触发前置检查并升级集群的控制面,让您更专注于容器应用开发。使用限制 仅集群...

云盒故障服务器维修流程

本文介绍当云盒内的服务器出现故障时,阿里云如何进行更换和维修,保证数据安全。背景信息 当云盒内的服务器出现故障,需要更换和维修时,出于客户成本考虑,云盒内没有部署数据擦除服务,阿里云不在客户现场进行数据擦除。重要 在您购买...

架构信息查询导航

云原生内存数据库Tair 支持三种架构类型:标准、集群与读写分离架构。您可根据业务场景选用不同架构的实例。架构概览 如需了解以下产品架构的详细信息,请单击架构名称跳转到相应的文档。警告 单副本架构不能保障数据可用性和服务连续性,...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

集群版-单副本

纯缓存应用 单副本集群版的分片服务器由单节点组成,分片服务器某节点出现故障时,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,数据将会丢失,有可能流量被冲击到后端数据库,需要做好应用程序的预热保护机制...

续费流程

在包年包月集群自动释放前,您可以手动或者自动续费集群。自动续费开通后,系统将在资源到期前自动执行续费操作,无需您手动操作,您也不必再担心因未及时续费而导致资源和数据被删除。本文为您介绍如何手动和自动续费Databricks数据洞察...

建Greenplum迁移到AnalyticDB PostgreSQL版

使用gpcopy迁移数据 提交工单 联系阿里云技术支持,并将AnalyticDB PostgreSQL版实例ID、建Greenplum集群的IP地址和端口号、可用于迁移数据的Greenplum superuser权限账号和安装建Greenplum集群服务器的IP地址提供给阿里云技术支持。...

概述

固定规格集群的Serverless功能 固定规格集群的Serverless功能的技术架构图 固定规格集群的Serverless功能的Proxy 数据库代理Proxy资源由普通集群的Proxy资源和Serverless Proxy资源两部分组成,其中固定规格的Proxy资源按照普通集群的Proxy...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

API概览

ModifyDBClusterStorageSpace 变更企业版按空间计费集群和标准版集群的存储空间 变更企业版按空间计费集群和标准版集群的存储空间。ManuallyStartDBCluster 手动启动集群 手动启动集群。高可用部署架构 API 标题 API概述 ...

修复集群

修复集群后,集群自建队列被清除,节点继续保留,并全部迁移到集群默认队列中。修复集群后,集群所有节点的系统盘和数据盘数据将会丢失,包括用户信息、作业信息、调度器队列信息、自动伸缩队列配置信息,但文件存储NAS上的数据仍然保留。...

全球数据库常见问题

如果从集群与主集群规格相差较大,当主集群写入压力增大时,从集群同步数据,IOPS到达瓶颈时会造成主从同步延时增大,建议升级从集群规格与主集群对齐。GDN集群如何进行主从切换?GDN集群进行主从切换的具体操作请参见 切换主集群、...

常见问题

创建集群、扩容集群或配置自动伸缩策略时,如果无法选择定义镜像,可能有以下原因:您的阿里云账号在当前地域下没有定义镜像,关于如何创建定义镜像,请参见 定义镜像概述。定义镜像操作系统为E-HPC不支持的操作系统。当前选择的...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...

组件概述

网络 组件名称 组件类型 描述 CoreDNS 系统组件 Kubernetes集群域名解析服务器。managed-kube-proxy 系统组件 ACK灵骏托管版集群上使用的容器化kube-proxy,用于管理节点上Service的访问入口。Terway 系统组件 阿里云开源的基于专有网络VPC...

API概览

集群管理 API 标题 API概述 CreateDBCluster 创建集群 创建AnalyticDB for MySQL数仓版集群。DeleteDBCluster 删除集群 删除AnalyticDB MySQL集群。ModifyDBCluster 对集群进行升降配 对AnalyticDB MySQL集群进行升降配。...

云原生关系型数据库PolarDB的审计事件

CreateDBEndpointAddress 创建PolarDB集群主地址、默认集群地址和自定义集群地址的公网连接地址。CreateDBLink 创建DBLink。CreateDBNodes 增加PolarDB集群的只读节点。CreateGDNAddress 创建GDN地址。CreateGlobalDatabaseNetwork 新建...

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细化摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

成本数据模型介绍

在ACK集群中,Pod作为最小的可部署单元,是衡量集群成本的关键因素。但不同Pod可能有不同的资源配置、调度策略和生命周期,导致其成本估算较为复杂。ACK提供一种通用性的成本数据模型定义和计算方法,帮您准确地衡量云上ACK集群的成本,并...

API概览

云原生数据库PolarDB ...集群 类别 API 描述 集群管理 CreateDBCluster 该接口用于创建 PolarDB 集群。DeleteDBCluster 该接口用于释放按量付费的 PolarDB 集群。DescribeDBClusters 该接口用于查询 PolarDB 集群列表或被RAM授权的集群列表。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 云服务器 ECS 云数据库 Redis 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用