灾备规划

RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,RPO就要求越小。RPO越小,往往要求数据备份、复制频率更高,对生产环境、网络的压力也会越大,成本通常也越高。RTO:指故障发生后,期望...

金融行业最佳实践

金融两地三中心 业务挑战:金融源站往往采用两地三中心的架构,当某个源站发生故障时,需要快速地将业务切换到其他可用源站,保障业务的连续性和稳定性。方案优势:阿里云DCDN提供多源负载均衡能力,实现多源异地灾备,可以按照主备、权重...

词汇表

这意味着如果一个可用区发生故障,其他可用区仍能保持正常运行,从而保证了高可用性。同一地域内的不同可用区之间内网互通,使用低时延链路相连。不同地域之间的可用区完全隔离。下图以地域1(包含3个可用区)和地域2(包含3个可用区)为例...

故障处理流程

当智能接入网关设备发生网络故障后,您可以先观察现象、收集信息,然后对现象和信息进行分析诊断,尝试修复问题。本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

故障管理

通过建立一个规范可遵循、全流程闭环的故障管理体系,配合技术手段的提升,可以有效降低故障发生的几率,缩短故障的MTTR,最终使故障造成的破坏性趋近于0。在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的...

功能概览

跨地域容灾 容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

故障演练

生产环境做三大类场景的低频演练:机房断演练,通过对业务资源的IP级别编排,实现先单个业务断演练验证,再逐步扩大业务范围、直至所有业务的机房断演练,保证线上多活容灾能力的持续有效性,避免因业务迭代、基础设施/中间件变化...

网络架构容灾

但是如果配置多台服务器直接对外提供访问,业务上又需要将域名解析到多个ECS外网IP,当ECS服务很多的时候就会导致解析数量巨大不易于管理,而且不利于弹性扩缩容。为实现服务高可用的目标可以使用阿里云负载均衡产品。负载均衡代理多台后端...

企业单AZ架构升级到多AZ

多可用区部署的常见应用:关键业务系统:对于需要高可用性和连续性的关键业务系统,如金融服务、医疗保健和电子商务平台,多AZ部署可以确保系统即使在一个数据中心发生故障的情况下也能继续运行。容灾要求高的场景:当组织需要符合特定的...

功能特性

VPC边界防火墙 NAT边界防火墙用于防护私网IP资产访问互联网的流量。NAT边界防火墙 DNS边界防火墙用于防护VPC访问互联网指定域名的流量。DNS边界防火墙 数据概览 展示云防火墙防护的云资产的流量拓扑图。流量拓扑图 提供云防火墙的防御能力...

创建和管理服务器组

警告 关闭健康检查后,NLB 不再检查后端服务器,一旦某台后端服务器发生故障,则无法实现访问流量自动切换至其它正常的后端服务器。若延长健康检查的间隔时间,后端服务器出现故障时,NLB 发现故障后端服务器的时间也会变长。移除后端...

ECS容灾常见问题

在自建数据中心发生重大故障时,几分钟内在云上拉起,达到分钟级RTO。ECS容灾持续复制型 支持哪些操作系统?CDR支持主流的Windows和Linux操作系统。更多信息,请参见 操作系统。ECS容灾服务目前仅支持以下服务器版本。操作系统 版本 ...

ECS容灾常见问题

在自建数据中心发生重大故障时,几分钟内在云上拉起,达到分钟级RTO。ECS容灾持续复制型 支持哪些操作系统?CDR支持主流的Windows和Linux操作系统。更多信息,请参见 操作系统。ECS容灾服务目前仅支持以下服务器版本。操作系统 版本 ...

SOFAMesh 服务网格总体经济影响报告

Forrester 提出适应未来(Future Fit)的技术战略模型,也即以客户为中心,帮助企业快速重构业务结构和能力,调整运营方式,以自适应性、创造力和韧性满足未来客户和员工的需求,而平台、实践与合作伙伴将成为构建这一技术战略的关键因素。...

关键技术竞争力

“人-事件-过程”统一的风险应急能力 TRaaS 技术风险防控平台风险应急能力是以用户风险(故障)处置为核心,通过应急响应将用户的“人”、“事”、“平台能力”进行有效串联,实现应急拉起、应急人员通知、诊断推送、预案执行,将应急过程...

附录:SOFAStack 产品目录

一直秉承着引领和拥抱业界先进标准和实践的理念,同时亦能满足传统金融架构的平滑迁移和融合适配,以稳妥应对业务升级变更,并积极应对金融交易系统所面临的服务和数据扩展性、事务一致性、秒级容灾、弹性供给与调度等关键技术的挑战。...

实时分析链路数据

单机故障每时每刻都在频繁发生,特别是核心集群由于节点数量比较多,从统计概率来看几乎是一种“必然”事件。单机故障不会造成服务大面积不可用,但是会造成少量的用户请求失败或超时,持续影响用户体验和答疑成本,需要及时处理。单机故障...

新金融行业

场景介绍 随着互联网技术的发展,金融机构在不断利用互联网技术实现资金融通、支付、投资和信息中介服务等更多新型的金融业务模式,产生了更多和终端相关的业务形态,对终端算力弹性要求越来越高的同时也对企业数据安全和合规性的保障提出...

功能特性

近源压制一般通过运营商骨干网核心路由器,在靠近攻击源的位置丢弃特定区域的流量。近源压制策略 攻击分析 攻击分析 将公网IP资产添加到DDoS原生防护实例进行防护后,可以通过攻击分析页面查询资产上发生的DDoS攻击事件记录和详情,实现...

GetFileProtectEvent-获取核心文件监控事件详情

172.16.XX.XX IntranetIp string 关联实例的私 IP。10.42.XX.XX HandleTime long 事件处理时间。1694576692000 Remark string 备注信息。["test"]ProcessId string 事件进程 ID。3453 示例 正常返回示例 JSON 格式 {"RequestId":"0B48AB...

什么是多活容灾

多活容灾MSHA(Multi-Site High Availability)是在阿里巴巴电商业务环境演进出来的多活容灾商业化产品,是应用高可用服务AHAS的核心模块,为客户提供容灾架构建设能力。横向支持容灾架构的上线、运维、演练、切流,升级到下线。纵向支持...

节点诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。基于专家经验和AI智能诊断两种诊断模式,节点诊断可以深入定位问题根因。节点诊断包括诊断检查项和诊断根因。诊断检查项:包括Node检查、...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

跨地域Web安全加速(海外域名)

全球加速依托阿里云优质BGP带宽和全球传输网络,通过联动DDoS高防和Web应用防火墙,可以有效防御DDoS攻击和Web攻击,同时可以通过全局流量管理实现故障隔离或流量切换,为Web服务商提供一套高安全的跨地域加速方案。背景信息 某Web服务部署...

配置堡垒机

若您有其他访问控制策略基于私网IP地址放行(例如防火墙等),切换网络后,请您使用更新后的地址进行配置。若您将主备交换机配置到不同可用区,私网运维地址会解析出两个IP。配置完成后,单击 确定。切换单可用区 如果您的堡垒机版本为基础...

什么是混合云容灾服务

解决的核心问题 混合云容灾解决的核心问题如下:应用级容灾保障业务持续性(Business Continuity):在数据中心故障或长时间系统维护作业时,在云上快速恢复应用运行,缩短业务停机时间,极大减少损失。数据级容灾:在数据中心备份您的数据...

配置设备级高可用

背景信息 静态HA功能通过把几台路由设备联合组成一台虚拟的路由设备,将虚拟路由设备的IP地址作为局域内主机的默认网关实现与外部网络通信。当主网关设备发生故障时,HA机制能够从备份的网关设备中选举一台设备成为新的主网关设备,用来...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

步骤五:应用容灾

确保操作人员熟悉容灾恢复流程,当主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 页面,选择 恢复网络、...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 面板,选择 恢复...

什么是故障

核心功能 故障应急:支持故障全局应急通告,电话、短信、邮件、IM多种通知渠道,确保故障关键进展及时通知至相关人员,加快信息流转;故障收敛:支持按时间/次数进行告警收敛,将告警收敛到一个故障中统一处理;故障追踪:支持对故障的最新...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

容器网络FAQ

早于2022年10月创建的集群节点可能未默认启用所有IPVS调度算法,您需要手动在所有集群节点上启用IPVS调度算法内核模块(以最小连接数调度算法lc为例,如果选用其他算法,请替换lc关键字),逐台登录每个节点,并运行 lsmod|grep ip_vs_lc ...

设计方案

从提前发现系统风险、提升测试质量、完善风险预案、加强监控告警、提升故障应急效率等方面做到故障发生前有效预防,故障发生时及时应对,故障恢复后回归验证。基于故障本身打造分布式系统韧性,持续提升软件质量,增强团队对软件生产运行的...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

高可用虚拟IP(HaVip)

什么是高可用虚拟IP(HaVip)定义 HaVip是一种可以独立创建和释放的私网IP资源,具备与ECS实例主私网IP地址一样的网络接入能力,可以与高可用软件,例如 Keepalived 配合使用,搭建高可用主备服务,提高业务的可用性。HaVip支持绑定一个...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 云服务器 ECS NAT网关 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用