Linux实例负载高问题排查和异常处理

内存使用率过高,可能会出现系统卡顿、内部服务响应速度变慢等问题。I/O使用率过高:一般来说,当前I/O读写≥该云盘I/O的80%时,定义为I/O使用率过高。I/O使用率过高,可能会出现文件读写变慢、应用性能下降或报错等问题问题排查 您可以...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

V5.1.x系列实例版本说明

解决DISTINCT在部分跨库JOIN场景下会出现报错的问题。修复库分表情况下聚合函数查询带LIMIT时返回结果不正确的问题。解决BigDecimal类型在类型转换过程会消耗大量CPU的问题。修复SHOW FULL STATS连接数不准确的问题。修复SHOW FULL STATS...

常见问题

答:对于GDB高可用版,当主节点出现故障时,GDB会快速切换到备节点。切换过程中会出现短时间的连接闪断(切换很快,主要为主节点故障诊断和确认时间),需要用户设置好程序的自动重连,避免因为切换导致服务不可用。问:图数据库GDB支持跨...

集群版-单副本

纯缓存应用 单副本集群版的片服务器由单节点组成,片服务器某节点出现故障时,系统重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,数据将丢失,有可能流量被冲击到后端数据库,需要做好应用程序的预热保护机制...

SDK相关FAQ

什么会出现内存泄漏?setSDKAuthSDKInfo的密钥如何获取?什么情况下会返回600005页面非法修改?当使用移动卡请求一键登录不成功,可能出现的报错日志及解决方法有哪些?若出现权限相关问题,该怎样做?检查App的权限是否可以正常申请。...

Tair Proxy特性说明

云原生内存数据库Tair 的集群架构和读写分离架构中,代理服务器(Proxy)承担着路由转发、负载均衡与故障转移等职责,可以帮助您简化客户端的逻辑,同时支持多数据库(DB)、缓存热点数据等高级功能。通过了解Proxy的路由转发规则和特定...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

补数据

什么补数据选择业务时间昨天和今天,也会出现等待时间的情况?为什么补数据选择补0点~1点生成了多个实例?为什么进行大量补数据操作时,会出现等待资源情况(实例显示黄色,实例状态为等待资源)?为什么补数据报错调起的节点运行时间不...

自动/手动主备切换

注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请务必确保应用具备重连机制;当只读节点开启了热备功能时,主备切换将在5~10秒内完成。关于如何开启只读节点的热备...

应用场景

出现这些故障时,如果用户业务部署在单个地区,那么就因为地区故障导致服务不可用,且不可用时间完全依赖故障恢复时间。通过构建灾备库,使用数据同步服务实时增量同步主库数据以确保主库与灾备库数据的完全一致,当业务中心发生地区...

一键诊断

A:RDS MySQL的计算公式如下:线程使用率=活跃线程数/最大线程数 连接数使用率=当前连接数/实例规格最大连接数 最大线程数=thread_pool_size*(thread_pool_oversubscribe+1)Q:为什么会出现线程使用率超过100%的情况?A:按照线程使用率的...

配置网络

交换机所在的子网故障或子网中的IP地址已用尽,您可以在配置VPC时提供两个或者多个交换机ID,如果一个可用区出现故障,您的函数可以在其他可用区运行,提高容错能力。安全组配置错误,请您按照以下要求配置安全组。需要设置VPC中的安全组的...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

Windows系统的ECS实例ping外网地址提示“一般故障”...

然后重新ping外网地址,不再出现一般故障”错误时,表示该问题已解决。检查网卡配置信息 执行 ipconfig/all 或 route print 命令检查IP配置,查看路由配置是否存在问题。如果回显中显示了所有网卡信息,如下图所示,说明路由配置没有问题...

自动或手动主备切换

A:RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

重启实例或节点

当云数据库MongoDB单节点实例、副本集实例、片集群实例、片集群实例中指定节点(任意一个Mongos节点或Shard节点)出现连接数满或性能问题时,您可以手动重启实例或指定节点。注意事项 重启实例期间启停进程,系统断开当前所有连接...

异地双活切流

选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回 ...

云解析DNS如何实现故障切换

全局流量管理支持IP地址健康检查功能,并根据健康检查的结果,来判断运营商IP地址是否出现故障,如果出现故障,则将域名解析切换到备份的运营商IP上,并最终帮用户实现自动故障转移的功效。请参阅 GTM实现跨网访问加速与故障切换 操作...

常见问题

专有网络FAQ 一般性FAQ 什么是CIDR?VPC与经典网络的区别是什么?VPC是否支持VPN功能?如何选择VPC的网段?如何选择交换机的网段?附加网段FAQ 同VPC下,主网段内的ECS实例与附加网段内的ECS实例是否可以互通?同VPC下,主网段内的ECS实例...

什么要升级到MongoDB的新版本

简要描述:在片集群实例中,若未及时清理孤立文档,可能导致在迁移数据时出现数据不一致的问题。推荐版本:4.4及以上版本。推荐理由:当一个Chunk成功迁移到新的片后,源片中的该Chunk延期删除。孤立文档通常是因为迁移过程中断...

切换为专有网络VPC

实例会出现秒级的连接闪断,请在业务低峰期执行该操作并确保应用具备重连机制。在执行切换时,您可以选择是否保留经典网络地址。如果不保留,实例的经典网络地址将被释放,客户端将无法继续通过经典网络地址连接Redis实例,您需要尽快更换...

步骤五:应用容灾

故障恢复 本机出现故障后在云上拉起本地业务,待本地环境恢复后再将其恢复到本地。具体步骤如下:在 主站点管理 页签,单击+添加。在 添加计算平台 页面,填写计算平台 名称,选择 类型,填写 IP地址、用户名 和 密码。单击 创建。在连续...

容灾演练断网方式说明

在实例进行主备切换时,业务可能会出现长连接闪断的情况,以此验证业务是否具备失效重连机制。使用场景 部分业务或大规模业务实例不可用。Redis、RDS云服务高可用实例部分不可用。使用限制 安全组断网只针对新建立的网络连接进行阻断,并不...

常见报错

主日志报错:all shards failed 报错说明 出现该报错后,集群会出现以下问题:读取请求无法从片获得响应。由于集群或节点仍处于初始启动过程,导致无法搜索数据。片丢失或处于恢复模式,并且集群状态为red。报错原因 可能原因如下:...

运行失败

149)解决方法 聚类片在构建索引时,首先会基于 Graph引擎 做数据聚类,具体是执行对应的GraphJob来完成,GraphJob会默认申请一个Worker数量,当集群资源不足时会出现上述问题。可以在执行命令里限定执行GraphJob的Worker数量来限制资源...

配置网络

交换机所在的子网故障或子网中的IP地址已用尽,您可以在配置VPC时提供两个或者多个交换机ID,如果一个可用区出现故障,您的函数可以在其他可用区运行,提高容错能力。安全组配置错误,请您按照以下要求配置安全组。需要设置VPC中的安全组的...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

快速使用专属集群MyBase

背景信息 关于 专属集群MyBase 更多信息,详情请参见 什么是云数据库专属集群MyBase。操作步骤 步骤一:创建专属集群 登录 云数据库专属集群控制台。在页面左上角,选择目标地域。在 概览 页面,然后单击 创建集群。在 创建专属集群 面板,...

PolarDB MySQL版CPU使用率高

整个数据库系统的缓存区域,是数据交换最为频繁的位置,如果内存不足和内存页争抢,则会出现各种异常的堆积和慢查询。最典型的表现是数据库突然CPU上涨打满,并且出现慢查询。经过排查后发现该问题并非索引缺失,这个时候就有可能是内存...

常见问题

本文为您整合了使用Proxima CE过程中的常见问题。Proxima CE用的是哪里的资源?用户所在MaxCompute Project下的资源。输入表中的vector可以直接使用MaxCompute的Binary类型吗?目前不支持,Proxima CE当前版本构建索引的处理方法是将doc表...

自助升级普通型公网NAT网关

每个资源升级过程大约会持续5分钟,升级过程中会出现1~2次秒级闪断,业务重连即可恢复。相关文档 什么是增强型公网NAT网关 什么是普通型公网NAT网关 增强型公网NAT网关和普通型公网NAT网关对比 预约升级普通型公网NAT网关

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

管理主备切换

背景信息 自动切换:实例默认开启自动切换,当主实例出现故障无法访问时,自动切换到备实例。主备切换的触发时机,请参见 主备切换原因。手动切换:即使自动切换是开启状态,您也可以手动进行主备切换。手动切换可用于容灾演练或多可用区...

Redis Proxy特性说明

在 云数据库 Redis 版 集群架构和读写分离架构中,代理服务器(Proxy)承担着路由转发、负载均衡和故障转移等职责,可以帮助您简化客户端的逻辑,同时支持多数据库(DB)、缓存热点数据等高级功能。通过了解Proxy的路由转发规则和特定命令...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

远程连接FAQ

检查是否为海外服务器 中国内地访问其他国家和地区地域下的轻量应用服务器,可能会出现较大延迟和丢包,造成无法访问服务器的问题。该问题受国际运营商的影响,无法在服务器中修复。更多信息,请参见 远程连接非中国内地服务器时,提示连接...

什么是MX解析?

当您的域名解析记录中存在多条MX记录的时候,邮件发送方的服务器优先把邮件投递到MX优先级最高的服务器,当此服务器出现故障无法接收邮件的时候,发送方的服务器自动选择下一个优先级最高的服务器,直到邮件投递成功,或者所有服务器都...

数据库代理常见问题

如果您在使用RDS MySQL数据库代理过程中存在疑问或遇到问题,可以参考本文查看解决方案。目录 什么是数据库代理?通用型代理和独享型代理有什么区别?数据库代理是否占用主实例的QPS或者TPS?数据库代理地址和常规地址是否是一个地址?开通...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 Web应用防火墙 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用