Linux实例负载高问题排查和异常处理

内存使用率过高,可能会出现系统卡顿、内部服务响应速度变慢等问题。I/O使用率过高:一般来说,当前I/O读写≥该云盘I/O的80%时,定义为I/O使用率过高。I/O使用率过高,可能会出现文件读写变慢、应用性能下降或报错等问题问题排查 您可以...

Linux系统的ECS实例运行卡顿,在/var/log/messages...

系统内核问题:当系统内核存在漏洞或者其他问题时,可能会出现hung task故障系统资源紧张:ECS实例中应用或进程占用系统资源使用率(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考...

强弱依赖治理概述

强弱依赖治理的应用 强弱依赖治理主要可以被应用到以下场景:系统改造验收:对于分布式系统,至少在运行态中,不会因为依赖的系统后台出现故障,引起当前应用出现系统级可用性的故障,例如进程挂掉、频繁FullGC、负载飙高等,何时何地都应...

自动或手动主备切换

系统会在Serverless实例出现故障无法访问时,自动切换主备。注意事项 主备实例切换过程中会出现约30~120秒的服务不可用,请确保您的应用程序具有自动重连机制。如果实例下挂载有只读实例,那么主备实例切换后,只读实例的数据会有几分钟的...

签署代付协议

发起签署时,为什么会出现“身份证号码和社会统一识别代码必须为18位”的提示?A:出现如图提示时,表明您这边前期在认证阿里云账号时,使用其他证件认证,导致系统未能识别您的实名认证信息以及社会统一识别代码等,需要您手动发起 工单...

进入Linux系统的单用户模式

在某些特殊场景下(例如排查Linux实例启动故障、修复系统异常、维护硬盘分区或root用户被锁定,需要修改密码),您可以通过Linux系统系统引导器...说明 您也可以通过卸载系统盘功能来排查启动故障问题,具体操作,请参见 卸载或挂载系统盘。

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

4、如何做好迭代排期?

我们会看到,在期输入、期过程、期输出环节的要求比较多,如果没有要求的话,期会将会比较低效,后续的迭代推进也会出现各种问题。如下,是我们在辅导敏捷开发团队过程中总结的几个注意点:明确的迭代目标 迭代需要有比较明确的...

内网访问安全常见问题

一般情况下出现这种问题的电脑大部分是Windows 11系统。因为Windows 11系统的浏览器有安全DNS配置,需要关掉安全DNS才可以正常访问。如果Windows11系统DNS配置被安全软件或者是手动修改成使用DoH,需要改成非加密的模式。内网访问不通,...

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障”错误。问题原因 出现问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

ECS实例使用的Windows系统激活失败如何解决?

本文主要介绍ECS实例使用的Windows系统激活失败的原因以及解决方案。可能原因 Windows系统ECS实例默认配置激活脚本,正常情况下,实例能够与KMS服务器通讯来激活系统。但是可能因为以下原因导致激活失败:Software Protection异常导致激活...

常见问题

Q:当出现系统故障需要进行主备切换时,单节点集群地址下对应的只读节点能否切换为新主节点?A:主备切换时,单节点地址下对应的只读节点不会被自动切换为新主节点。但您仍可以通过手动切换将其设置为新主节点,详细操作请参见 主备切换。Q...

Windows系统ECS实例激活失败

问题分析 出现这个报错一般都是由于服务器到KMS之间的网络存在问题,导致服务器无法跟KMS进行通讯。网络存在问题可能是由于Windows系统的ECS实例中系统防火墙、IP安全策略,或其它网络安全管理软件阻断了服务器与ECS激活服务器之间的通信...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

使用实例时镜像相关问题

在使用ECS实例过程中,可能遇到一些与镜像有关的问题或咨询,比如实例启动慢、系统负载高、如何编译内核等。本文介绍在使用ECS实例过程中遇到的镜像相关问题及解决方案。Windows镜像问题 如何手动更新Windows实例的virtio驱动?Windows ...

读写访问文件类问题

当您访问文件系统中的文件时,文件系统中的文件受到某些限制影响,导致文件操作错误、挂载点无响应或访问无响应等。您可以在本文中查找一些常见文件操作错误、文件属主、数据不同步或访问无响应的解决方案。交叉挂载兼容性问题 Linux挂载...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

SDK相关FAQ

什么会出现内存泄漏?setSDKAuthSDKInfo的密钥如何获取?什么情况下会返回600005页面非法修改?当使用移动卡请求一键登录不成功,可能出现的报错日志及解决方法有哪些?若出现权限相关问题,该怎样做?检查App的权限是否可以正常申请。...

自动或手动主备切换

临时关闭主备自动切换 自动切换默认为开启,主实例出现故障会自动切换到备实例,在遇到如下情形时您可以选择临时关闭主备自动切换:大促活动等,不希望主备切换影响系统可用性。重要应用系统升级等,不希望主备切换引进其他变数。重大事件...

ack-node-repairer

当节点出现故障时,自愈系统会自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD会修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

开启或关闭SELinux

重要 完成修改 config 文件后,需要重启ECS实例使配置生效,但直接重启实例将会出现系统无法启动的错误。因此,在重启之前需要在根目录下新建 autorelabel 文件,以避免出现该问题。执行以下命令,在根目录下新建隐藏文件 autorelabel。...

常见问题

本文介绍在使用图数据库GDB过程中的常见问题。产品介绍 问:什么是图数据库GDB?答:GDB是Graph Database的简写。GDB是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache ...

ECS系统事件概述

说明 非预期运维事件一般指的是因底层宿主机发生了无法预测的故障,或者ECS实例的操作系统发生了内核错误等问题,导致ECS实例突然出现宕机或重启。因宿主机故障导致ECS实例宕机或重启事件(SystemFailure.Reboot)属于偶发现象,无法避免。...

实例FAQ

本章节汇总了使用云服务器ECS实例时的常见问题。购买实例问题 如何查看某个地域或可用区是否能购买实例?购买实例时,资源已经售罄怎么办?如何选择适合我业务的ECS实例?购买ECS实例如何付款?开通一台云服务器需要多久?购买实例付款成功...

升级内核小版本

问:升级过程中,为什么会出现实例切换?是否会有其他严重风险?答:为保证业务稳定,升级采用先备后主的方式,备实例升级完成后,业务自动切换至备实例。无其他严重风险。实例切换的影响请参见 实例切换的影响。问:升级版本是否会有兼容...

管理主备切换

临时关闭主备自动切换 自动切换默认为开启,主实例出现故障会自动切换到备实例,在遇到如下情形时您可以选择临时关闭主备自动切换:大促活动等,不希望主备切换影响系统可用性。重要应用系统升级等,不希望主备切换引进其他变数。重大事件...

集群管理FAQ

当Kubernetes集群出现问题或者节点异常时,您可通过容器服务ACK提供的一键故障诊断功能,辅助您定位集群中出现问题,详情请参见 使用集群诊断。如果集群诊断功能无法满足需求,您需要分别在Master节点和异常的Worker节点上收集Kubernetes...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

5、如何做好迭代跟进?

2.确认需求已经拆解完成 一般建议在需求期时把需求拆解到研发任务(前端、后端和联调),但时常会出现,需求拆解任务不到位的情况,所以站会的时候需要检查,需求是否已拆分到研发任务,以及是否已指派到具体的开发人员,如下图所示:3....

测试分析及调优

例如:SLB/WAF/高防IP,甚至是CDN/全站加速等)可能就会出现由于各种规格(带宽、最大连接数、新建连接数等)限制或者因为压测的某些特征符合CC和DDoS的行为而触发了防护策略导致压测结果达不到预期,详情请见 为什么后端压力不大但压测时...

Linux系统常用内核网络参数介绍与常见问题处理

什么/var/log/messages日志中会出现“Time wait bucket table overflow”错误信息?为什么Linux系统的ECS实例中,出现大量的处于FIN_WAIT2状态的TCP连接?为什么Linux系统的ECS实例中,出现大量的处于CLOSE_WAIT状态的TCP连接?为什么...

常见问题

本文为您整合了使用Proxima CE过程中的常见问题。Proxima CE用的是哪里的资源?用户所在MaxCompute Project下的资源。输入表中的vector可以直接使用MaxCompute的Binary类型吗?目前不支持,Proxima CE当前版本构建索引的处理方法是将doc表...

消息发送重试和流控机制

若由于服务端返回流控错误触发重试,系统会按照指数退避策略进行延迟重试。指数退避算法通过以下参数控制重试行为:INITIAL_BACKOFF:第一次失败重试前后需等待多久,默认值:1秒。MULTIPLIER:指数退避因子,即退避倍率,默认值:1.6。...

异地双活切流

此过程中,业务系统中依赖的MSHA-SDK开启数据库禁写控制,以此进行单元保护,避免更新规则推送到业务系统的时间不一致、机器时钟不一致,导致各机器规则生效时间不一致出现的数据脏写问题。各层切流。同时进行接入层和数据层切流。接入层...

块存储FAQ

本文汇总了使用块存储时的常见问题。存储容量单位包SCU问题 什么是存储容量单位包SCU?哪些块存储产品可以使用存储容量单位包SCU?存储容量单位包SCU可以单独使用吗?存储容量单位包SCU的抵扣规则是什么?SCU如何计费?SCU可以退款吗?ESSD...

Windows系统异常重启以及蓝屏的处理方法

Windows操作系统在遇到异常的情况下,为了防止数据丢失,系统自动崩溃蓝屏,如果有配置内存转储文件(crash dump)的收集,系统会自动生成蓝屏dump到指定的目录,默认文件为 C:\Windows\memory.dmp。问题原因 通常有多种原因导致操作系统...

Linux系统常用内核网络参数介绍与常见问题处理

sysctl-p 为什么/var/log/messages 日志中会出现“Time wait bucket table overflow”错误信息?问题现象 Linux系统的轻量应用服务器实例中,/var/log/messages 日志中频繁出现“kernel:TCP:time wait bucket table overflow”错误信息。...

ECS系统事件汇总

系统事件用于记录和通知云资源信息,例如运维任务执行情况、资源是否出现异常和资源状态变化等。您可以通过系统事件获取ECS资源的风险和异常信息,例如 某一实例到期、实例因底层升级需迁移或因系统维护重启了某一实例等,然后及时响应和...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
Web应用防火墙 负载均衡 商标服务 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用