网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

如何管理故障

可对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

为什么调用链丢失?

可能原因 调用链数量和设置的调用链采样率有关。您可以在 ARMS控制台 目标应用的 应用设置>自定义配置 页签的 采样率设置 区域查看调用链采样率。默认的采样率为10%,即只有10%的调用链会被采集。采样规则:错误与异常调用调用链会被默认...

0015-00000104

问题原因 调用PutBucket接口时,存在以下场景之一则会报此错误:Bucket已经存在,而且使用RAM用户AK或者STS来调用PutBucket再次重复创建此Bucket时,会报此错误。只有阿里云账号才能再次重复创建自己的Bucket(这种操作不会改变Bucket的...

API概览

QueryFailReasonForRegistrantProfileRealNameVerification 查询信息模板实名认证审核失败的原因 调用QueryFailReasonForRegistrantProfileRealNameVerification接口查询信息模板实名认证审核失败的原因。VerifyContactField 校验域名联系...

消息发送重试和流控机制

消息发送重试机制 重试基本概念 云消息队列 RocketMQ 版 客户端连接服务端发起消息发送请求时,可能会因为网络故障、服务异常等原因导致调用失败。为保证消息的可靠性,云消息队列 RocketMQ 版 在客户端SDK中内置请求重试逻辑,尝试通过重...

Co、递归调用

然而这种写法其实也不是万无一失的,我们来看下面这个生产故障案例。发现问题 客户接入 Node.js 性能平台 后,通过监控经常出现内存增长导致的 OOM,于是客户加上了一条告警规则:@heap_used/heap_limit>0.5,目的是在堆较小但是发生泄漏时...

附录:SOFAStack 产品目录

分布式链路跟踪 分布式链路跟踪(Distributed System Tracing,简称 DST)是一款面向分布式架构、微服务架构和云原生架构的应用可观察性的金融级解决方案,帮助用户厘清应用间复杂的调用关系,迅速定位故障或者缓慢节点。产品架构 产品优势...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

API概览

RedeployDedicatedHost 执行专有宿主机的故障迁移 调用RedeployDedicatedHost执行专有宿主机的故障迁移。ReleaseDedicatedHost 释放专有宿主机 调用ReleaseDedicatedHost释放一台按量付费专有宿主机。CreateDedicatedHostCluster 创建一个...

返回结果

调用方可根据每个接口对应的错误码以及 公共错误码 来定位错误原因调用API报错后,将在response中返回HTTP状态码、错误码和错误信息,还会包括该次请求在全局的唯一标识RequestId。若您根据错误码和错误信息无法明确问题,可将RequestId...

API概览

RedeployDedicatedHost 执行专有宿主机的故障迁移 调用RedeployDedicatedHost执行专有宿主机的故障迁移。ReleaseDedicatedHost 释放专有宿主机 调用ReleaseDedicatedHost释放一台按量付费专有宿主机。CreateDedicatedHostCluster 创建一个...

QueueHasDiffField

可能原因调用的Queue的参数的已设置属性值与本次声明的Queue的参数的属性值不一致,导致报QueueHasDiffField类型错误。可能出现不一致的Queue参数如下。参数 类型 描述 queue String Queue的名称。durable boolean Queue是否持久化:...

ExchangeHasDiffFields

可能原因调用的Exchange的参数的已设置属性值与本次声明的Exchange的参数的属性值不一致,导致报ExchangeHasDiffField类型错误。可能出现不一致的Exchange参数如下:参数 类型 描述 exchange String Exchange的名称。type String ...

诊断应用卡顿问题

排查、解决网站卡顿、页面加载过慢等问题过程复杂,耗时较长,原因如下:应用链路太长 从前端页面到后台网关,从Web应用服务器到后台数据库,任何一个环节出现故障都有可能导致整体卡顿。采用微服务架构的应用,链路更加复杂,而且不同组件...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

通过错/慢调用链排查应用产生异常的原因

在生产环境中,引发应用异常(如耗时突增、错误率突增)的原因有很多,常见的包括流量不均、单机故障、程序异常和依赖组件故障等。在新应用上线或大促备战前通常建议做一次系统性的性能调优,分析当前系统存在哪些性能瓶颈,梳理出常出错的...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

RPC 常见问题

使用 RPC 客户端调用服务时报错 调用服务时报“RPC-02306:没有获得服务[{0}]的调用地址,请检查服务是否已经推送”错误 排查思路如下:检查服务地址是否推送。登录客户端,查看/home/admin/logs/rpc/sofa-registry.log 日志,您可以通过...

设计方案

整体稳定性设计方案可参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量级的通信机制进行互相调用的微服务架构,...

API概览

RebalanceInstances 重新平衡ECS实例分布 如果由于库存不足等原因导致可用区之间ECS实例的数量不均衡,您可以通过调用API RebalanceInstances重新平衡多可用区伸缩组内ECS实例的分布。SetInstanceHealth 设置伸缩组内ECS实例的健康状态 在...

API概览

故障演练 API 标题 API概述 CreateFailoverTestJob 创建高速通道故障演练任务 调用CreateFailoverTestJob接口创建高速通道故障演练任务。StartFailoverTestJob 开始高速通道故障演练任务 调用StartFailoverTestJob接口开始高速通道故障演练...

RPC服务无法调用

问题描述 RPC客户端调用服务时,服务无法调用。问题原因 服务器到服务注册中心网络不可达、服务权限限制、服务调用超时等。解决方案 RPC服务无法调用时,请参考以下操作进行排查:查看 catalina.out 日志,检查服务提供者是否正常注册到...

配置网络

故障排查 函数计算 无法在设置 vpcConfig 时对访问VPC的权限进行检测,而需要在执行函数时检测,因此在通过 InvokeFunction 接口调用函数时会引入一些新的错误类型。下表描述了接入VPC时一些常见的错误,以便您迅速排查问题。错误码 状态码...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

API概览

UpdateExperiment 调用UpdateExperiment接口编辑故障演练基本信息及流程定义。ExecuteExperiment 调用ExecuteExperiment接口执行故障演练。PushExperimentTask 调用PushExperimentTask接口推进故障演练任务。FinishExperimentTask 调用...

API概览

故障演练 API 标题 API概述 CreateFailoverTestJob 创建高速通道故障演练任务 调用CreateFailoverTestJob接口创建高速通道故障演练任务。StartFailoverTestJob 开始高速通道故障演练任务 调用StartFailoverTestJob接口开始高速通道故障演练...

返回结果

调用方可根据每个接口对应的错误码以及下述公共错误码来定位错误原因。当调用出错时,HTTP 请求返回一个 4xx 或 5xx 的 HTTP 状态码。返回的消息体中是具体的错误代码及错误信息。另外还包含一个全局唯一的请求 ID:RequestId 和一个您该次...

返回结果

调用方可根据每个接口对应的错误码以及下述公共错误码来定位错误原因。当调用出错时,HTTP 请求返回一个 4xx 或 5xx 的 HTTP 状态码。返回的消息体中是具体的错误代码及错误信息。另外还包含一个全局唯一的请求 ID:RequestId 和一个您该次...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

返回结果

JSON示例如下:{"RequestId":"4C467B38-3910-447D-87BC-AC049166F216",/*返回结果数据*/} 错误结果示例 调用接口出错后,调用方可根据对应的错误码来定位错误原因。当调用出错时,HTTP请求返回一个4xx或5xx的HTTP状态码。返回的消息体中是...

配置网络

您在 函数计算 创建的函数,默认可以通过公网调用,无法通过VPC调用。如果您需要函数能够访问VPC内的资源,或允许指定的VPC来调用函数,那么您需要手动为服务配置网络访问能力。网络配置为服务级别,即对服务下的所有函数生效。本文介绍...

返回结果

调用方可根据每个接口对应的错误码以及下述公共错误码来定位错误原因。当调用出错时,HTTP请求返回一个4xx或5xx的HTTP状态码。返回的消息体中是具体的错误代码及错误信息,另外还包含一个全局唯一的请求ID(RequestId)和一个本次请求访问...

返回结果

调用方找不到错误原因,可以联系阿里云客服,并提供该HostId和RequestId,以便我们尽快帮您解决问题。XML示例?xml version="1.0"encoding="UTF-8?RequestId>xxxxxxxxxxxxxxxxxxx</RequestId><HostId>petadata.aliyuncs....

返回结果

调用方找不到错误原因时,可以联系阿里云客服,并提供该 HostId 和 RequestId,以便我们尽快帮您解决问题。XML示例?xml version="1.0"encoding="UTF-8?RequestId>8906582E-6722-409A-A6C4-0E7863B733A5</RequestId><HostId>dm....

返回结果

调用方找不到错误原因时,可以联系阿里云客服,并提供该HostId和RequestId,以便我们尽快帮您解决问题。XML示例?xml version="1.0"encoding="UTF-8?RequestId>8906582E-6722-409A-A6C4-0E7863B733A5</RequestId><HostId>dns....

返回结果

返回结果数据->接口名称+Response>JSON示例 {"RequestId":"4C467B38-3910-447D-87BC-AC049166F216"/*返回结果数据*/} 错误结果 调用接口出错后,将不会返回结果数据,调用方可根据每个接口对应的错误码以及 错误代码表 来定位错误原因。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 短信服务 机器翻译 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用