故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

迁移失败常见原因及解决方案

案例四:出现“check content-length failed”报错 现象描述 某客户迁移第三方数据至阿里云OSS时,迁移失败文件列表产生如下报错:原因分析 目标地址数据最后修改时间(target last modify)晚于源地址数据最后修改时间(source last ...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

产品概述

该地址算法服务能解决一地多名,地址解析,地址真伪辨别等多种问题,为企业,政府机关以及开发者提供地址数据清洗,地址标准化能力,使地址数据更好的为业务提供支持。产品名 产品形态 计费方式 应用场景 地址标准化接口服务 算法API 后...

版本发布记录

IP地址解析函数 新函数,IP地址解析函数,能够把IP地址翻译为对应的国家、省市。PreparedStatement 支持PreparedStatement。OSS API调用次数 减少对OSS API的调用次数。Partition数量限制 一次性写入的Partition的数量限制。表和字段格式 ...

容灾预案

系统则会将故障地址池中的地址全部设置为 永远离线 的工作模式,地址池状态变为不可用,并按照您配置的访问策略自动执行切换。注意:永远离线是地址的一种工作模式,您可以参阅 地址池配置 文档来了解地址工作。6.回滚 指容灾演练或流量...

一键诊断

相关文档 通过一键诊断了解数据库性能情况的全貌后,您可以使用如下功能对数据库进行全面细致的诊断,准确定位故障原因,并解决故障。会话管理 性能趋势 锁分析 慢SQL 空间分析 常见问题 Q:一键诊断中,如何计算会话的线程使用率、连接数...

什么是用户体验监控

完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能表现情况,并支持日志数据查询,帮助您快速跟踪定位故障原因,提升用户体验。...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

全局流量管理&WAF&GA&SLB联动

实践架构 前置GTM:实现智能解析故障转移,若域名DNS服务商支持智能解析,且不考虑故障冗余可去除此层GTM架构。GA:实现全球加速,本例为针对中国内地向海外服务器进行请求加速。WAF:实现Web应用防护,智能分配解析请求至就近节点。后置...

功能特性

此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索分析 查询并导出SQL语句对应的日志信息。搜索 SQL洞察 SQL洞察聚类分析,用作深度异常的排查。SQL洞察 安全审计 内置了...

应用场景

当3个IP地址中某一个地址故障时,将故障地址从DNS解析列表中暂时删除,不向用户返回,当故障IP地址恢复后,重新添加回DNS解析列表。通过 GTM,创建一个地址池 Pool A,包含地址(1.1.XX.XX、2.2.XX.XX、3.3.XX.XX),主地址池集合 选择 ...

背景信息以及准备工作

DLA可以在不移动OSS日志文件的情况下读取并分析日志文件数据,定位服务故障原因等。对于一个服务而言,日志文件记录了服务运行的所有详细信息。在进行故障排除、状态监控或者预测告警时,都需要对日志文件进行查询分析。阿里云对象存储服务...

解析设置类常见问题总结

记录值是指您需要将子域名指向哪个解析地址解析地址可以输入服务器IP地址、也可以输入域名。您可以参阅 添加解析记录 文档进行操作。添加记录时,提示MX和CNAME记录冲突?答:DNS解析过程,各记录类型之间是有优先级的,所以在主机记录...

网络架构容灾

地址池中地址发生故障时,HealthCheck模块会准确的检测到异常情况并与DNS交互(如下图中序号3所示),摘除故障地址(如下图中序号4所示),这样用户端会自动解析到可用的地址池(如下图中序号5所示)。并当故障地址恢复时,自动恢复至...

功能概述

访问策略 访问策略包括DNS智能解析、默认地址池/备用地址池、生效地址池切换策略等相关信息,一个GTM实例可以创建多个访问策略,可为不同网络或区域来源的访问用户设置不同的解析响应地址池,并最终实现用户就近访问接入和故障自动切换的...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

什么是全局流量管理?

② 访问策略:访问策略可支持为不同网络或区域来源的访问用户设置不同的解析响应地址池,并最终实现用户就近访问接入和故障自动切换的效果。③ 健康检查:健康检查主要是针对地址池里IP地址列表,可以实时监测应用服务的可用性状态,包括:...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

计量计费

服务类型 API接口 后付费价格 免费调用额度 基础服务 地址抽取 2.8元/千次 共500次 姓名抽取 电话号码抽取 行政区划解析 邮编识别 地址文本清洗 地址结构化 6元/千次 共500次 地址纠错 地址补全 门址标准化 地址异常检测 智能地址填写 物流...

什么是全局流量管理?

2、访问策略 访问策略可以助企业轻松管理全球流量,其能够根据客户设定的流量调度策略,可为不同网络或区域来源的访问用户设置不同的解析响应地址池,并最终实现用户就近访问和故障切换效果。访问策略包含两种访问策略类型,且一个实例只能...

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

跟踪概览

故障诊断与运维 服务故障分析:在出现服务中断或性能下降时,可以使用跟踪日志来分析事件前后的操作,以帮助确定故障原因。配置变更追踪:记录对云资源配置的所有更改,帮助识别可能导致服务中断的配置错误。基本概念 概念 说明 跟踪 跟踪...

GTM如何实现同城容灾

创建1个全局访问策略,解析请求流量 选择 全局,主地址池集合 选择「业务中心01」地址池和「业务中心02」地址池,负载均衡策略 选择 返回全部地址,此设置可实现两个数据中心同时提供服务和发生故障时系统自动摘除故障地址的效果。...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

DNS监控

解析地址变更:则DNS监控下的解析地址会同步更新;产品限制 DNS监控添加的子域名仅限A和CNAME两种记录类型使用;DNS监控仅支持DNS托管在云解析DNS中的域名使用;DNS监控不建议泛解析域名添加监测,拨测效果差;相同主机记录但不同解析线路...

实例列表

4.地址池个数 首先GTM 是通过地址池来管理对应用服务的IP地址,一个地址池,代表一组提供相同应用服务,即具备相同运营商或地区属性的IP地址或域名地址,一个应用服务可以设置多个地址池,所以这里的地址池个数是指此M实例下设置的地址池...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

UpdateGtmRecoveryPlan-修改容灾预案

请求参数 名称 类型 必填 描述 示例值 Lang string 否 用户语言 en RecoveryPlanId long 是 容灾预案 ID 100 Name string 否 容灾预案名称 abc Remark string 否 备注 remark FaultAddrPool string 否 故障地址池列表["hra0or"]返回参数 ...

AddGtmRecoveryPlan-新增容灾预案

请求参数 名称 类型 必填 描述 示例值 Lang string 否 用户语言 en Name string 是 容灾预案名称 name-example Remark string 否 备注 remark FaultAddrPool string 是 故障地址池 ID 列表["hra0or"]返回参数 名称 类型 描述 示例值 object...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

DescribeDnsGtmInstanceStatus-获取GTM实例状态

1 AddrNotAvailableNum integer 故障地址个数。1 AddrPoolGroupNotAvailableNum integer 不可用地址池集合个数。1 示例 正常返回示例 JSON 格式 {"StrategyNotAvailableNum":1,"AddrAvailableNum":1,"RequestId":"389DFFA3-77A5-4A9E-BF3D-...

DescribeGtmRecoveryPlan-获取容灾预案详情

故障地址池列表 AddrPoolId string 地址池 ID hra0oq InstanceId string 实例 ID instance-zwy-38 AddrPoolName string 地址池名称 压测-Failover-1 Addrs object[]地址列表 Value string 地址值 1.1.1.1 Mode string 地址模式 OFFLINE Id ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
实时数仓 Hologres 云解析 PrivateZone 云解析DNS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用