FAQs

Ping健康检查:可以根据丢包率的大小、响应时间的长短判断应用服务是否故障。TCP健康检查:可以根据tcp端口的响应时间来判断应用服务是否故障。HTTP(S)健康检查:可以根据http(s)响应时间、返回码信息来判断应用服务是否故障。全局流量管理...

常见问题

code=exited”错误 启动SSH服务时出现“error while loading shared libraries”错误 ECS网络问题 Windows实例ping外网地址提示“一般故障”Linux系统的ECS中没有禁pingping不通的解决方法 使用ping命令测试ECS实例时ping不通的排查方法 ...

Windows系统ECS实例激活失败

查看IP安全策略,详情请参见 服务器ping外网提示一般故障处理方法 中查看是否设置了 IP 安全策略章节。查看是否有其它安全软件对kms.cloud.aliyuncs.com的1688 TCP端口的访问做了拦截。执行 route print 命令查看服务器内部的路由是否正常...

网络架构容灾

网络是数字世界的基础设施,没有网络的联通,所有信息都无法交互,因此网络架构的设计在应用系统中至关重要,特别是针对网络架构的高可用及灾能力的设计,是业务在异常发生时,实现快速恢复、降低业务损失的关键。云上网络规划设计 为...

无法远程连接Windows实例的排查方法

在实例中使用ping命令测试与客户端的连通性,提示 一般故障 错误时,请参见 Windows实例ping外网地址提示“一般故障”进行解决。步骤九:检查CPU负载、带宽及内存使用情况 无法正常远程连接Windows实例时,可能是因为CPU负载、带宽不足或...

远程桌面无法连接到Windows实例的快速排查方法

在实例中使用ping命令测试与客户端的连通性,提示“一般故障”的错误,请参见 Windows实例ping外网地址提示“一般故障”进行解决。步骤六:检查CPU负载、带宽及内存使用情况 确认是否存在CPU负载过高的情况,如果存在,则参考本步骤解决...

Windows实例网络访问丢包延时高的排查方法

概述 当网站访问很慢或无法访问时,若已经排除显著的问题,而使用ping命令检测到有明显丢包时,建议您做链路测试。在Windows环境中,推荐优先使用WinMTR工具,或者tracert命令行进行链路测试以判断问题来源。通常情况下,链路测试步骤如下...

主备容灾

但是面对可用区级别的断电、断网及其他极端故障单个HBase集群无法满足用户的高可用要求,针对跨可用区灾备需求我们提供了跨可用区的HBase同城主备灾,提供混合场景(云实例同云实例、云实例同自建实例以及自建与自建实例)下的故障一键、...

跨可用区容灾(Beta)

异常切换时,容灾情况 显示为 异常切换中,切换完成灾情况 更新为 建立同步链路中。说明 切换完成灾域名将指向容灾实例,您可以使用容灾域名进行数据查询和写入。系统会自动建立由容灾实例向生产实例同步数据的链路。

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

功能概览

故障切换灾站点B变为“生产站点”,生产站点A变为“容灾站点”。此时重启保护后,数据复制为起始时的反向,方向为B->A,称为反向保护。故障恢复后,A回到生产站点状态,B回到容灾站点状态,此时启动复制A->B,回到正向保护状态。...

常见问题-FAQ

Ping健康检查:可以根据丢包率的大小、响应时间的长短判断应用服务是否故障。TCP健康检查:可以根据tcp端口的响应时间来判断应用服务是否故障。HTTP(S)健康检查:可以根据http(s)响应时间、返回码信息来判断应用服务是否故障。全局流量管理...

故障止损恢复

快恢预案推荐 通用的故障恢复方法一般包括 重启、回滚、扩、切流、流、降级 等。快恢的执行效率很大程度取决于是否有完备的预案和定期演练。建议在故障应急协同群中推荐输出常见的快速恢复能力,并提供PC、手机端的一键快速执行能力,...

混合云应用双活容灾最佳实践

通过MSHA多活灾助力企业进行混合云应用双活灾建设的实践案例,给出了灾架构建设实践方法,同时利用Chaos故障演练产品注入真实故障,来验证故障场景业务灾能力是否符合预期。若您在使用过程中有任何疑问,欢迎您搜索钉钉群号...

Windows实例通过外部访问网络不通的处理

更多信息,请参见 在ECS实例的Windows服务器PING外网提示一般故障处理方法。检查Windows实例是否有性能问题,如CPU资源占用高、内存耗尽、带宽占用满、网络动态端口耗尽。更多信息,请参见 Windows系统内存分析工具的介绍。检查Windows实例...

Windows实例公网网络异常

问题描述 登录Windows实例,发现网络异常,使用 ping 命令无法连接公网或者无法telnet RDP端口,使用 ping 命令连接内网网卡的网关提示“一般故障”。问题原因 Windows实例启用了Routing and Remote Access服务,只配置远程访问时会导致...

ECS实例使用的Windows系统激活失败如何解决?

查看IP安全策略,请参见 服务器ping外网提示一般故障处理方法 中 查看是否设置了IP安全策略 章节。查看是否有其他安全软件对kms.cloud.aliyuncs.com的1688 TCP端口的访问做了拦截。执行 route print 命令查看服务器内部的路由是否正常,...

手把手教您配置通用型NAS容灾

步骤三:灾切换 当业务文件系统发生故障时,切换业务系统至灾文件系统。步骤一:创建文件系统 创建一个与业务文件系统除可用区不同,其他配置相同的灾文件系统。登录 NAS控制台。在 概览 页面的文件系统选型区域,单击 通用型NAS ...

附录:SOFAStack 产品目录

同时满足异地灾、低成本快速扩的需求,能够解决传统集中式架构转型的困难,并通过打造大规模高可用分布式系统架构,来支撑金融业务创新。SOFAStack 由四大领域模块组成:分布式中间件、运维管理(应用 PaaS)、高阶运维保障、研发效能...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

上海博卡:借助云效+ACK实现3分钟快速发布

通过各种检测插件进行质量检测,阻止异常构建或者部署 对比项 使用ACK前 使用ACK 零停机部署 不支持 支持 应用异常自动修复 不支持 支持 扩耗时 1小时 1分钟 扩方式 手动修改nginx配置 自动扩 敏感信息安全 代码库保存,存在泄露风险...

云上整机恢复VMware虚拟机

在VMware虚拟机故障时,您可以把已备份的VMware虚拟机整机恢复到阿里云ECS,保障业务快速恢复。本文介绍如何把已备份的VMware虚拟机整机恢复到阿里云ECS上。前提条件 已完成VMware虚拟机备份。更多信息,请参见 备份VMware虚拟机。已了解...

虚拟机场景

一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过流、快速扩等手段保证业务连续性。参数说明如下:参数名称 是否必选 默认值 参数说明 进程ID 必选其一 无 Java进程的ID。进程关键字 无 用于识别唯一的关键字,可以...

在Windows实例无法访问外部网络如何处理?

或 Windows实例ping外网地址提示“一般故障”。检查Windows实例是否存在性能问题 Windows实例可能存在CPU资源占用高、内存耗尽、带宽占用满、网络动态端口耗尽等问题,您可以通过如下方式进行检查:使用工具进行分析,具体操作,请参见 ...

基本概念

[回到顶部]H HAS 高可用管理平台(High Availability Service,HAS)是以灾为主的高可用管控平台产品,可实现灾方案的端到端整体能力,从客户业务到中间件、PaaS以及IaaS整体的灾切换及恢复,灾规划,灾模拟演练等能力,并包含...

DAS Auto Scaling弹性能力

垂直扩则是在现有规格基础上进行升级,其一般流程为先对备库做升级,然后主备切换,再对新备库做规格升级,通过这样的流程来降低对业务的影响,但是备库升级切换主库时依然存在数据同步和数据延迟的问题。因此,在什么条件下选择哪种扩...

客户端离线排查

云安全中心控制台显示客户端离线时,表示该服务器已失去云安全中心的防护。此时,该服务器可能存在被黑客入侵的风险。建议您参考本文内容尽快排查离线原因,保障客户端在线。背景信息 云安全中心提供客户端问题一键排查功能,如果您发现...

功能概述

灾演练或流量切换完成,如希望恢复到执行前的访问策略,那么可以通过 回滚功能 实现,操作回滚,系统则会将故障地址池中的地址恢复为“智能返回”的工作模式,并会恢复访问策略。使用指南您可以参阅 灾预案 文档。

创建节点池

勾选 故障时重启节点 ,节点NotReady时,系统会尝试自动重启相关组件来修复故障节点,并在重启前执行排水。自动升级规则 选中 托管节点池 ,可设置此配置项。勾选 自动升级 kubelet ,系统会在有可用的kubelet版本时自动升级到该版本...

什么是多活容灾

多活灾MSHA(Multi-Site High Availability)是在阿里巴巴电商业务环境演进出来的多活灾商业化产品,是应用高可用服务AHAS的核心模块,为客户提供灾架构建设能力。横向支持灾架构的上线、运维、演练、切流,升级到下线。纵向支持...

集群实例工作台

说明 只有创建了备实例的集群,在其集群实例工作台页面才会显示主备灾信息。当备实例全部被释放或解耦为独立集群,主备灾信息将不再展示。主备库功能目前只针对白名单客户开放,如需开通请联系云数据库 OceanBase 技术支持。查看拓扑...

通过物理专线实现本地IDC与云上VPC互通

步骤四:配置阿里云侧健康检查 阿里云默认每隔2秒从每个健康检查源IP地址向本地IDC中的健康检查目的IP地址发送一个ping报文,如果某条物理专线上连续8个ping报文都无响应,则说明该物理专线链路故障。登录 云企业网管理控制台。在左侧导航...

集群管理常见问题

解决方法:您可以等待需要扩的ECS机型库存充足再扩,或者通过新增节点组的方式选择其他ECS机型对集群进行扩,详情请参见 新增节点组。创建集群时报错“ECS库存不足”,该如何处理?问题现象:新建集群或新增节点组时失败,失败原因...

部署和使用跨可用区实例

跨可用区部署可提升集群的灾能力,系统会自动选择库存充足的可用区创建集群。在索引配置了副本的情况下,当某一可用区出现故障时,剩余的可用区依然可以不间断地提供服务,显著增强了集群的可用性。同时,您可以通过控制台的切流操作,将...

数据湖集群

数据湖集群特性介绍 可靠性 如果您启用了集群的高可用服务,则EMR把3台Master节点分布在底层不同的硬件上以降低故障风险。另外,考虑到Master节点在损坏情况下的修复时间,数据湖集群不再支持2台Master模式。同时在高可用集群模式下,EMR...

主机健康诊断

说明 如果您的主机底座k8s-launcher版本不存在,则界面显示立即升级,请按照界面指引进行升级再进行健康诊断。诊断完成,单击 查看报告 查看诊断结果,并根据提示诊断结果和建议进行问题修复。系统配置诊断 诊断项 说明 内核参数检测 ...

部署方案

单机房部署 云数据库 OceanBase 单机房部署将所有节点位于同一可用区,具备主机级别故障容灾能力。此外单机房部署还具备如下优点:两个全能型副本同时提供读写能力,为您提供更高性能的数据库读写服务。单机房部署的写请求无需进行跨机房...

专线连接类

阅读文档→选择合适的接入点→控制台购买物理专线接口→申请LOA→运营商施工→用户报竣并等待阿里云施工→支付资源占用费→启用物理专线→配置边界路由器→加入云企业网或者创建对等连接→配置路由→从两端主机互相做连通测试(一般ping...

应用容灾

“应用多活”是“应用灾”技术的一种高级形态,指在同城或异地机房建立一套与本地生产系统部分或全部对应的生产系统,所有机房内的应用同时对外提供服务。当灾难发生时,多活系统可以分钟级内实现业务流量切换,用户甚至感受不到灾难发生...

多可用区部署

传统的主备灾概述 传统的主备灾为了实现高可用性,通常的原理是分别在两个不同的可用区(可用区A和可用区B)中购买一个Lindorm实例(主实例1和备实例2),使用数据通道服务(简称LTS)实现Lindorm实例间的双向同步。当主实例1发生故障...
共有116条 < 1 2 3 4 ... 116 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库Cassandra版 云数据库 OceanBase 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用