实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

代码逻辑场景

受影响的请求占(%)否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比,也可代表每次请求发生故障的概率。填写小于或等于0,则表示100%发生故障。说明 仅填写百分比数字部分即可,即80%,填写80。请求过滤规则 否 无 通过脚本...

设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

常见问题-FAQ

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM最快可在1分钟左右准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

EMR Kafka磁盘故障运维

当磁盘发生故障时,应及时完成相关故障的处理,及时恢复集群的容错能力。磁盘运维概述 本文从磁盘监控和磁盘故障恢复角度来介绍磁盘运维策略。磁盘监控 以下内容从Kafka服务层面以及ECS系统层面来简单了解一下磁盘的监控策略。Kafka服务...

JVM注入动态脚本

受影响的请求占(%)否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比,也可代表每次请求发生故障的概率。填写小于或等于0,则表示100%发生故障。说明 仅填写百分比数字部分即可,即80%,填写80。请求过滤规则 否 无 通过脚本...

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

故障演练

故障演练实践参考 阿里巴巴集团借助混沌工程实现了无损演练和有损演练的常态化执行,缩短建设大规模演练实施的进程、加速演练执行效率,让业务更聚焦在架构/流程风险识别与系统优化/容灾能力建设上,保障混沌工程实验投入产出最大化。...

政企安全加速

可选付费项 政企安全加速商务模式 政企安全加速产品与官网标准SCDN产品不同,由于提供了额外的政企安全功能,因此,整体商务价格标准SCDN高。如果您是金融、政府、传媒、零售和交通等行业客户,并对如上产品方案感兴趣,您可以联系您对应...

多NUMA机型的容器内存就近访问加速

索引 前提条件 内存就近访问加速功能的优势 使用场景 使用内存就近访问加速功能 步骤一:通过Policy开启内存就近访问加速功能 步骤二:通过Event查看内存就近访问加速结果(可选)步骤三:开启多次内存就近访问加速 验证内存就近访问加速...

DCDN企业版为政企提供加速和安全一站式服务

阿里云DCDN企业版依托阿里云全球分布的加速网络,承载全面的安全防护能力,为政府、金融、传媒、零售和交通等企业,提供边缘安全和加速一站式服务。DCDN企业版商务模式 DCDN企业版产品与官网标准CDN或者DCDN产品不同,由于提供了额外的企业...

点播CDN常见问题

如何提升视频点播缓存命中率 如果发生命中率过低的情况意味着用户的每次请求都会通过CDN回源,公网链路的不稳定可能导致加速的效果反而变差。您可以通过预热URL、配置资源缓存规则、过滤URL中可变参数提升视频点播的缓存命中率。具体方案...

故障处理流程

当智能接入网关设备发生网络故障后,您可以先观察现象、收集信息,然后对现象和信息进行分析诊断,尝试修复问题。本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下...

GTM实现跨网访问加速故障切换

方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速故障切换,...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进,避免历史同类故障重复发生

数据安全

当其中一个加速地域出现故障时,可以将访问请求切换至其他距离用户时延较低、位置较近的加速地域进入全球加速网络中,实现加速地域间的故障容灾。如何配置CNAME解析,请参见 配置CNAME。全球加速联动DNS实现加速地域高可用容灾,请参见 ...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

金融行业最佳实践

金融两地三中心 业务挑战:金融源站往往采用两地三中心的架构,当某个源站发生故障时,需要快速地将业务切换到其他可用源站,保障业务的连续性和稳定性。方案优势:阿里云DCDN提供多源负载均衡能力,实现多源异地灾备,可以按照主备、权重...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

FAQs

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM能在 3分钟左右 准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

通过CDN跨域访问资源时发生报错

场景二:CDN加速OSS资源,在客户端请求加速资源时发生报错。问题原因 在以上两个场景中发生报错的原因如下:场景一:CDN配置的加速源站中,没有在请求头和源站的响应头中配置“credentials”参数。场景二:CDN加速OSS时,OSS不支持设置HTTP...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

数据集性能

加速开启情况 当前组织中数据集 加速开启情况,具体为 开启加速引擎、开启缓存加速、未开启加速 的占以及 数据集总数 展示,支持选择对应的 工作空间,单击查询,可以查看空间内的占情况。说明 开启加速引擎 是指数据集开启了“实时...

加速跨地域应用实现高可用容灾

您可以使用全球加速服务(GA)加速跨地域部署的应用,并实现应用访问流量的多地域负载和高可用容灾。背景信息 某金融公司总部和分部分别设立在美国(硅谷)和美国(弗吉尼亚)地域,并分别在阿里云对应地域创建了服务器ECS01和ECS02,用于...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

跨地域Web安全加速(海外域名)

全球加速依托阿里云优质BGP带宽和全球传输网络,通过联动DDoS高防和Web应用防火墙,可以有效防御DDoS攻击和Web攻击,同时可以通过全局流量管理实现故障隔离或流量切换,为Web服务商提供一套高安全的跨地域加速方案。背景信息 某Web服务部署...

出海加速

出海加速表示通过自定义规则,联动使用DDoS高防(非中国内地)保险版或无忧版实例与加速线路实例,实现在业务正常访问期间,流量经过加速线路提升访问速度;在业务被攻击时,流量切换到DDoS高防(非中国内地)进行清洗,只有正常业务流量被...

ListAccelerators-查询全球加速实例列表

调用ListAccelerators接口查询全球加速实例列表。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限...

DDoS高防和CDN或DCDN联动

例如,在CDN和高防联动且回源到OSS的场景,由于CDN回源支持修改回源HOST,而DDoS高防不支持,导致发生攻击自动切换到DDoS高防后,DDoS高防回源到OSS的正常流量无法被识别,出现业务故障。前往DNS服务商处修改DNS解析,将DNS解析指向流量...

为什么选择DCDN

边缘计算,带来技术变革 随着互联网业务向复杂化和多元化发展,动态请求(例如搜索结果、个性化推荐等)的占将越来越大,这类多元化内容需要经过计算后再返回给用户。使用DCDN可以在边缘节点进行计算,防止源站请求过载,从而可以使源站...

DCDN性能拨测数据参考

阿里云DCDN不定期更新拨测数据,拨测的数据是针对同一个访问资源,通过DCDN和直接访问源站的数据差别,您可以通过数据了解到,DCDN加速的数据效果。拨测数据 拨测时间 2023年03月01日 00:00~2023年03月02日 00:00 拨测工具 博睿数据 源站...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
全球加速 安全加速 SCDN (文档停止维护) 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用