更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

围绕混沌工程的平台实践

原则3在生产环境中运行实验 混沌工程推荐故障演练是在生产环境中进行,主要的原因有以下两点:系统的行为会根据环境和流量模式的变化,例如系统依赖的组件在测试环境和生产环境会有比较大的差异。系统的监控和人员的应急响应在测试环境和...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

多云场景全局容灾

预实现效果 中国内地的用户流量调度到线下IDC 中国香港用户的访问流量调度到阿里云中国香港 境外访问流量调度到华为云新加坡 IDC故障场景下,流量调度至阿里云 华为云故障场景下,流量调度至阿里云 阿里云故障场景下,流量调度至华为云 ...

附录:SOFAStack 产品目录

数据库流量分配 提供了基于规则的流量分发机制,通过部署多个数据库实例(如一写多读)的方式来满足大量查询业务的需求。分布式链路跟踪 分布式链路跟踪(Distributed System Tracing,简称 DST)是一款面向分布式架构、微服务架构和云原生...

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

退订方式说明

DSW预付费 智能推荐 视频云 导播服务(包年包月)视频点播流量包 直播互动 云原生 故障演练包年包月资源包 流量防护包年包月资源包 全局事务服务 微消息队列MQTT版(包年包月)消息队列 RabbitMQ 版包年包月 消息队列RocketMQ资源包(容量...

混沌工程缓存实战系列-Redis

缓存命中率 缓存未命中可能会在大流量下引发穿透、击穿、雪崩等问题,如果业务没有做好应急处理,很容易压垮数据库。穿透:Key对应的数据在数据源并不存在,每次针对此Key的请求从缓存获取不到,请求都会到数据源,从而可能压垮数据源。...

数据面质量

但现有的流量回放能力,并不能直接用于 MOSN,原因在于 RPC 的路由寻址与部署结构有关,线上的流量并不能够在线下直接运行,因此需要一套新的流量回放解决方案。目前,这部分能力还在建设中。专项测试 除了上述功能测试之外,蚂蚁团队还...

产品架构介绍

故障隔离:当局部Provider出现异常时,支持将异常的Provider进行故障隔离,保证所有机房内的Consumer均不会调用到异常的Provider,实现微服务流量故障逃逸。单元化服务寻址:针对异地多活单元化架构,支持按照单元化规则寻址调用Provider...

新功能发布记录

共享专线连接概述 2021年04月 功能名称 变更类型 功能描述 相关文档 VBR快速倒换 新增 将两个VBR加入一个快速倒换组中,可以在BFD检测到故障后,让流量故障链路的VBR快速切换到备份VBR,完成亚秒级别倒换,加快路由收敛,实现业务的平滑...

流量统计常见问题

根据阿里云和第三方提供的流量统计工具不同,最终统计的流量大小也有所不同,原因如下所示:阿里云流量统计工具:云虚拟主机管理控制台提供的流量统计工具是基于网站访问日志来统计流量,包括网站访问和搜索引擎两种形式的访问流量。...

发现异常与排查

您可以通过 网络智能服务 NIS(Network Intelligence Service),及时获取网络异常事件通知,然后排查实例、路径和流量来定位异常原因,精准定位修复异常。使用场景 通过NIS发现网络异常,并通过排查实例、路径和流量来定位异常原因,保证...

解决方案与客户案例

业务连续性保障 异地多活架构下各个数据中心常态承接业务流量故障发生时只需调拨入口流量即可实现容灾切换,实现分钟级的容灾切换。同时随着参与多活建设的数据中心数量增加,参与调拨流量的比例会相应减少,未参与调拨的业务流量可以...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

CDN如何分析流量异常

问题描述 CDN出现流量异常 解决方案 流量异常原因较多,需先分析流量异常产生的域名、时间段、以及来源,从而制定相应的防护措施。确认域名&时间段 流量异常的域名以及时间段可在CDN控制台-监控查询-实时监控中查看,如图。确认来源 确认...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

虚拟服务(Virtual Service)CRD说明

虚拟服务是服务网格ASM实现流量路由功能的关键资源之一。对于访问指定目标主机的流量,虚拟服务定义了一组流量路由规则,每个路由规则定义了特定的流量匹配条件。如果流量匹配,则将其转发到路由规则所指定的目标服务或者目标服务的版本...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

阿里云CDN与阿里云其他产品配合使用时流量如何计费?

可能原因 CDN流量与其他云产品流量各自独立计费,之间并无关系。每个产品的收费请查看其产品的计费规则。例如,某客户购买了CDN和OSS来提供文件下载服务,当客户端访问CDN时,如果CDN节点无对应的资源缓存,则需要回源请求,此时会产生两次...

基本概念

流日志 专有网络VPC提供流日志功能,可以捕获VPC网络中弹性网卡ENI(Elastic Network Interface)的传入和传出流量信息,帮助您检查访问控制规则、监控网络流量和排查网络故障流量镜像 专有网络VPC流量镜像功能可以镜像经过ENI且符合筛选...

计费常见问题

流量费用异常且您已配置加速域名 可以借助统计分析看板分析可能产生异常流量的原因。通过查看相应时间段的 热门URL 或 TOP数据 看板,明确可能产生异常流量的访问行为或视频,具体操作,请参见 统计分析。结合操作日志,分析可能存在的异常...

计费常见问题

流量费用异常且您已配置加速域名 可以借助统计分析看板分析可能产生异常流量的原因。通过查看相应时间段的 热门URL 或 TOP数据 看板,明确可能产生异常流量的访问行为或视频,具体操作,请参见 统计分析。结合操作日志,分析可能存在的异常...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

实例容灾

它是将物理服务器部署在不同的可用区,当一个可用区出现故障流量可以在短时间内切换到另一个可用区。整个切换过程对用户透明,应用代码无需变更。重要 发生主备切换时应用到实例的连接会断开,需要应用重新连接实例。迁移可用区请参见 ...

流出流量产生的原因以及如何查看?

本文介绍流出流量产生的原因以及如何查看流出流量。流出流量产生原因 当数据通过互联网从OSS传输到客户端、通过内网从OSS传输到客户端、使用跨区域复制功能将源Bucket的数据同步复制到目标Bucket等场景均会产生流出流量。关于流出流量的更...

日志常见问题

应用显示为Unknown,说明云防火墙未识别到流量的应用,可能存在如下原因流量日志的收发包个数小于3个包,且未建立会话,可能是扫描流量。被四层访问控制策略拦截的流量,这种情况不会建立会话。被入侵防御拦截或其他原因导致TCP Reset...

多集群场景下启用ASM本地集群内流量保持功能

重要 流量保持功能开启后,如果m1c1集群中的Reviews-v1因故障原因下线,Productpage无法通过访问m1c2集群中的Reviews-v2来提供服务。说明 如果您为一个服务开启了集群内流量保持功能,当其它服务的工作负载访问此服务时,将只能访问到该...

多集群场景下启用ASM本地集群内流量保持功能

重要 流量保持功能开启后,如果m1c1集群中的Reviews-v1因故障原因下线,Productpage无法通过访问m1c2集群中的Reviews-v2来提供服务。说明 如果您为一个服务开启了集群内流量保持功能,当其它服务的工作负载访问此服务时,将只能访问到该...

网站流量异常导致网站无法访问

解决方案 针对上述原因,您需要具体分析网站的访问情况,例如,了解网站访问量的变化趋势或分析网站运行中遇到的具体故障原因。本方案以建在Windows操作系统主机上的网站为例,主要介绍使用WebLog Expert Lite工具分析网站日志的方法。下载...

流量回放和压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享流量包 Web应用防火墙 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用