故障协同处理(基于钉钉)

原因检查:展示故障发生原因故障恢复方式等故障详情。分析详情:展示监控来源和故障相关人等故障详情。改进措施:逐条填写改进措施,至少新增一条改进措施。(4)故障动态 H5界面:故障动态和PC端故障动态保持一致,PC端和移动端对于故障...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

演练概述

执行演练 将故障注入机器,可通过演练时需曲线、演练参数、演练日志等检查故障注入的效果是否符合预期。停止演练 清除故障。当故障演练自动结束、您主动终止或者演练中的任何环节出现异常后,系统都会进入恢复阶段,自动清除相应的故障,使...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

常见问题FAQ

2.绿屏/蓝屏/花屏故障检查 故障示意图如下:见下遥控器按键说明,按电源键启动广告机。如无法排除上面的mac、蓝牙等地址打码。售后服务热线 400-0099998转1号键,进入报单,报单时请提供:门店名称、门店编号、门店具体地址、门店联系人...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

一键诊断

相关文档 通过一键诊断了解数据库性能情况的全貌后,您可以使用如下功能对数据库进行全面细致的诊断,准确定位故障原因,并解决故障。会话管理 性能趋势 锁分析 慢SQL 空间分析 常见问题 Q:一键诊断中,如何计算会话的线程使用率、连接数...

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

检查常见问题

本文介绍目标数据库PolarDB O引擎在预检查过程中遇到的常见问题和解决方案。目标库账号权限错误 问题描述 目标库账号无权限:目标库账号权限不足。原因 生成迁移计划时,用户名 为目标数据库的普通账号。解决方案 重新生成迁移计划,用户名...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

诊断项与诊断结果说明

检查该实例的操作系统(Guest OS)内部是否存在内核Panic、OOM异常或内部宕机等故障。此类故障可能是由于实例配置不当或用户空间的程序配置不当导致的,您可以尝试通过重启实例进行恢复。实例虚拟化异常 实例在运行中出现崩溃或出现异常...

专线连接类

排查物理专线故障原因,具体操作,请参见 故障排查。本地数据中心到阿里云的线路中断,如何解决?请在本地数据中心的网关设备上测试物理专线的客户端侧IP到阿里云侧IP是否可达,即此物理专线的直连IP是否可以ping通。如果不通,则需您向...

客户端离线排查

如果DNS服务无法运行,重启您的服务器,或者检查服务器DNS服务是否有故障检查服务器是否设置了防火墙ACL规则或阿里云安全组规则。如果有,请确认已将云安全中心的服务端IP加入防火墙白名单(仅出方向需添加,入方向无需配置)以允许网络...

词汇表

云防火墙 阿里云云防火墙是一款云平台SaaS(Software as a Service)化的防火墙,可针对您云上网络资产的互联网边界、VPC边界及主机边界实现三位一体的统一安全隔离管控,是您业务上云的第一道网络防线。更多信息,请参见 什么是云防火墙。...

错误码

遇到该错误的通常原因是数据节点故障,请联系技术支持。PXC-4108 ERR_VARIABLE_CAN_NOT_SET_TO_NULL_FOR_NOW 描述:变量(variable)不允许被设置为NULL。示例:ERR-CODE:[PXC-4108][ERR_VARIABLE_CAN_NOT_SET_TO_NULL_FOR_NOW]System ...

NAT边界访问控制策略迁移指导

将私网ACL迁移 NAT边界 页面后(包含自行创建和由云防火墙技术支持批量迁移),您需要 访问控制>NAT边界 页面检查私网ACL是否符合业务逻辑和安全逻辑。如果迁移后的私网ACL不符合要求,您需要自行修改私网ACL配置。具体操作,请参见 NAT...

错误代码

导致该错误的常见原因是RDS MySQL故障,无法访问Sequence有关的数据表。建议先检查后端RDS MySQL状态。TDDL-4401 ERR_MISS_SEQUENCE Sequence不存在。示例:ERR-CODE:[TDDL-4401][ERR_MISS_SEQUENCE]Sequence '*' is not found 命令中使用...

代码评审报告

边界检查 代码中对于边界值的处理是否正确。例如最近30天包含今天但不包含第前30天的。例如日期筛选是否为双闭区间。是 过滤条件完整性 过滤条件是否完整。例如筛选当前有效会员需要加上会员状态的限制。是 指标间逻辑检查 同表字段间...

ConnectionDisconnect

告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障。处理方法 检查用户侧运营商网络接入是否正常。icmsDocProps={'productMethod':'...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

GTM如何实现同城容灾

相关概念 名词 概念 GTM 全局流量管理(Global Traffic Manager),简称GTM,支持智能解析、健康检查故障隔离、故障切换,可帮助企业快速构建同城双中心、两地三中心的容灾架构。智能解析 是指根据用户请求源地址(运营商、地域等),...

GTM实现跨网访问加速与故障切换

相关概念 名词 概念 GTM 全局流量管理(Global Traffic Manager),简称GTM,支持智能解析、健康检查故障隔离、故障切换,可帮助企业快速构建同城双中心、两地三中心的容灾架构。智能解析 是指根据用户请求源地址(运营商、地域等),...

无法远程连接Windows实例的排查方法

快速登录Windows实例 如果您遇到紧急情况,需要尽快登录Windows实例,请参见以下操作步骤,先检查ECS实例的状态,然后通过云助手向Windows实例发送命令或通过VNC登录实例,具体步骤如下:步骤一:检查ECS实例状态 无论何种原因导致无法远程...

产品原理

全局流量管理(GTM)支持用户就近接入、高并发负载均衡、健康检查故障切换,可以帮助企业在短时间内构建同城多活与异地灾备的容灾架构。同时GTM支持管理阿里云和非阿里云IP地址,能够方便企业客户快速构建混合云应用的灾备。GTM属于DNS...

设置健康检查

将应用部署在 SAE 后,您可以使用健康检查功能查看应用实例与业务运行是否正常,以便运行异常时定位问题...说明 如果您需要查看检查失败原因,您可以单击 失败,跳转至 应用事件 页面,查看健康检查的详细信息。表示健康检查通过,实例健康。

GTM如何实现智能解析按地域划分

场景说明 企业应用服务一般会有多个IP,且多个IP地址可能分布于不同国家或地区、不同运营商、不同厂商的数据中心中,在这种情况下,云解析DNS的智能...通过设置服务IP地址的ACL策略,使得健康检查失败,测试GTM健康检查故障自动切换功能。

健康检查

在将边界路由器实例加载至云企业网实例后,您可以通过云企业网的健康检查功能监测物理专线的连通性。背景信息 健康检查会以一定的时间间隔向本地数据中心发送多个连续的探测报文,如果收到回复报文,则证明物理专线连接正常。如果在多个...

开启边界路由器(VBR)健康检查功能

开启边界路由器(VBR)的健康检查功能,确保及时发现出现故障的物理专线,也可修改VBR的健康检查配置。接口说明 您可以通过为 VBR 实例设置健康检查,监测本地数据中心与阿里云之间物理专线的连接状况,以便及时发现问题。在使用健康检查...

API概览

边界路由器连接 边界路由器连接 CreateTransitRouterVbrAttachment 在企业版转发路由器下创建边界路由器VBR连接 您可以调用CreateTransitRouterVbrAttachment接口将要互通的边界路由器VBR(Virtual Border Router)网络实例连接到同地域的...

网络诊断

连接异常处理 网络连接测试失败时,您可以排查以下原因检查安全组规则是否允许堡垒机访问主机的端口。检查主机是否已开启云防火墙,并且设置了允许堡垒机访问主机端口的访问策略。具体操作,请参见 云防火墙和运维安全中心(堡垒机)联合...

DNS解析异常问题排查

索引 类别 内容 诊断流程 基本概念 异常诊断流程 常见客户端报错 排查思路 排查思路 常见排查方法 检查业务Pod的DNS配置 检查CoreDNS Pod运行状态 检查CoreDNS运行日志 检查CoreDNS DNS查询请求日志 检查CoreDNS Pod的网络连通性 检查业务...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用高可用服务 云安全中心 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用