ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...
高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。
常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...
本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...
以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...
故障隔离:当局部Provider出现异常时,支持将异常的Provider进行故障隔离,保证所有机房内的Consumer均不会调用到异常的Provider,实现微服务流量的故障逃逸。单元化服务寻址:针对异地多活单元化架构,支持按照单元化规则寻址调用Provider...
IPv6相关 如何解决IPv6双栈的部分常见问题?其他 如何解决Pod启动后存在时延的问题?如何让Pod访问自己暴露的服务?Kubernetes集群中Pod出现网络异常 如何规划集群网络?ACK是否支持hostPort的端口映射?如何查看集群的网络类型及对应的...
本文列举了 Web应用防火墙(Web Application Firewall,简称WAF)相关的常见问题。类型 问题列表 产品FAQ 售前咨询问题 非阿里云服务器能否使用WAF?WAF支持云虚拟主机吗?WAF是否支持防护HTTPS业务?WAF是否支持自定义端口?WAF是否对接入...
本文列举了 Web应用防火墙(Web Application Firewall,简称WAF)相关的常见问题。类型 问题列表 产品FAQ 售前咨询问题 非阿里云服务器能否使用WAF?WAF支持云虚拟主机吗?WAF是否支持防护HTTPS业务?WAF是否支持自定义端口?WAF是否对接入...
一个保护组中可包含多个ECS实例,便于您使用一个计划对多个ECS实例进行统一操作。使用云盘异步复制技术进行容灾时,需要创建保护组。本文介绍创建保护组的操作步骤。前提条件 已设置网络交换机与安全组规则映射。具体操作,请参见 步骤三:...
保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...
保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...
一个保护组中可包含多个ECS实例,便于您使用一个计划对多个ECS实例进行统一操作。使用云盘异步复制技术进行容灾时,需要创建保护组。本文介绍创建保护组的操作步骤。操作步骤 登录 混合云容灾管理控制台。在左侧导航栏,单击 云盘异步复制...
一个保护组中可包含多个ECS实例,便于您使用一个计划对多个ECS实例进行统一操作。使用云盘异步复制技术进行容灾时,需要创建保护组。本文介绍创建保护组的操作步骤。前提条件 已设置网络交换机与安全组规则映射。具体操作,请参见 步骤三:...
一个保护组中可包含多个ECS实例,便于您使用一个计划对多个ECS实例进行统一操作。使用云盘异步复制技术进行容灾时,需要创建保护组。本文介绍创建保护组的操作步骤。前提条件 已设置网络交换机与安全组规则映射。具体操作,请参见 步骤三:...
保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...
保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...
NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题
本文汇总了使用多活容灾时的常见问题。MSHA基础常见问题 什么是MSHA?如果用户自有机房,计划同城新建一个机房,应选用什么架构?用户要做容灾架构,是否必须全套都使用阿里云产品?同城多活常见问题 假设数据库主备,ECS双可用区部署,...
故障恢复 数据同步后切换 该故障恢复会停止保护组中被保护的实例,并且一直等到所有被保护的实例停止,再进行最后一轮数据同步,并等待数据同步完成后再启动恢复,服务不可用时间会大于“立即切换”的时间,主要用在生产站点正常工作等场景...
故障恢复 数据同步后切换 该故障恢复会停止保护组中被保护的实例,并且一直等到所有被保护的实例停止,再进行最后一轮数据同步,并等待数据同步完成后再启动恢复,服务不可用时间会大于“立即切换”的时间,主要用在生产站点正常工作等场景...
常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...
本文列出了虚拟机常见的故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...
数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...
常见的故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...
本文介绍异地双读的常见问题以及解决方案。异地双读只保障读流量,如何保障写流量?读写流量按什么纬度区分读?异地双读应用场景是什么?异地双读的业务改造成本有多大?异地双读只保障读流量,如何保障写流量?是的,异地双读只保障读流量...
两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...
控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...
云数据库HBase存储海量大数据,在业务场景中往往承载着重要数据,为保障数据的高可用性和安全性,云数据库HBase提供了主备双活和主备容灾特性。本文介绍云数据库HBase的主备双活和主备容灾特性功能。使用场景 主备双活:大数据量随机读响应...
模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制台常见问题 网站耗资源(客户程序故障)常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...
为了保证您的站点能够安全、...关于网站耗资源的原因以及排查方法,更多信息,请参见 网站耗资源(客户程序故障)常见问题。增强版共享虚拟主机和独享虚拟主机可以更好地应对耗资源问题,避免站点被关停。更多信息,请参见 云虚拟主机官网。
本文介绍异地应用双活的常见问题以及解决方案。混合云场景下,涉及云上云下两朵云,两朵云的注册中心如何建立容灾?配置中心如何建立容灾?业务场景中以MySQL数据源为基准,会额外冗余到ES存储数据用于业务使用,ES数据是如何做同步?异地...
保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动创建按量付费的ECS实例。注意事项 启动复制后,系统会在容灾站点自动创建按量付费的ECS实例,由ECS和云盘复制产品收取...
保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动创建按量付费的ECS实例。注意事项 启动复制后,系统会在容灾站点自动创建按量付费的ECS实例,由ECS和云盘复制产品收取...
常见数据保护方式 资源对象 数据保护方式 涉及云产品 相关文档 ECS 开启ECS快照 开启快照跨地域复制 ECS快照 创建自动快照策略 快照计费 自动快照概述 ECS整机备份 ECS文件备份 ECS数据库备份 云备份镜像仓库 云备份 ECS整机备份 备份ECS...
在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止...
网站耗资源(客户程序故障)常见问题 通过Robots协议屏蔽搜索引擎抓取网站内容 流量统计常见问题 云虚拟主机可以升级到云服务器ECS吗?如何取消云虚拟主机的自动续费功能?产品计费问题 计费常见问题 安装网站程序问题 安装完WordPress程序...
本文介绍 PolarDB PostgreSQL版(兼容Oracle)的常见问题和解答。基本问题 Q:什么是 PolarDB?A:PolarDB 是一个关系型数据库云服务,目前已在全球十多个地域(Region)的数据中心部署,向用户提供开箱即用的在线数据库服务。PolarDB 目前...
本文介绍同城多活的常见问题以及解决方案。假设数据库主备,ECS双可用区部署,是否就是同城多活?和EDAS、MSE集群流量同可用区优先的差异和优势?消息是基于Shutdown机制实现多活么?数据库是两个机房各一个主备,还是主机房一主一备,备...
概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...