如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

使用限制

SuSE Linux Enterprise Server 12.1由于系统本身的原因导致在VMware环境下存在重启后黑屏的问题,出现此类问题与CDR无关。Alibaba Cloud Linux 2.1903 LTS 64位 目前支持Alibaba Cloud Linux 2.1903 LTS 64位如下的内核版本:4.19.91-25.1....

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中打开Ftrace的Filter功能后异常导致系统宕机 Alibaba Cloud Linux 3系统的ECS实例中rq->nr_running在throttle场景下统计异常

多集群联邦发布容灾

容灾的主要目的是当自然或人为的原因导致生产系统发生灾难时,能够尽可能地保证业务的连续性。机房灾难感知 为实现容灾场景下 LHC 多集群的正常发布,可通过以下方式来判断机房灾难。集群状态:运维侧视角下,机房灾难的直接体现就是集群不...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

ECS容灾常见问题

SuSE Linux Enterprise Server 12.1由于系统本身的原因导致在VMware环境下存在重启后黑屏的问题,出现此类问题与ECS容灾服务无关。Alibaba Cloud Linux 2.1903 LTS 64位 目前支持Alibaba Cloud Linux 2.1903 LTS 64位如下的内核版本:4.19....

ECS容灾常见问题

SuSE Linux Enterprise Server 12.1由于系统本身的原因导致在VMware环境下存在重启后黑屏的问题,出现此类问题与ECS容灾服务无关。Alibaba Cloud Linux 2.1903 LTS 64位 目前支持Alibaba Cloud Linux 2.1903 LTS 64位如下的内核版本:4.19....

为什么选择安全沙箱?

当节点上某一应用异常和故障,如内存泄露、频繁CoreDump等等导致节点整体负载升高,单容器触发Host Kernel Bug导致系统宕机,单应用的故障延展到了整个节点,甚至进一步导致整个集群的不响应。安全沙箱(runV)容器通过独立的GuestOS ...

V5.3.x系列实例版本说明

修复流量型只读实例上默认创建系统导致报错的问题。修复DECIMAL函数的一些问题。V5.3.8-15517870 日期 2019.03.05 类别 说明 新增特性 支持映射规则。支持SHOW FULL PROCESSLIST语句携带WHERE条件。支持如下跨Schema(数据库)操作:支持...

【组件升级】NPD升级公告

更多信息,请参见 Alibaba Cloud Linux 2系统的ECS实例中Page Fault异常导致系统宕机。登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 运维管理>组件管理。在 组件管理 ...

ECS实例的服务进程自动关闭,如何排查?

检查以下可能导致服务进程关闭的系统原因。ECS的云盘空间被占满。解决方法请参见 解决Linux实例磁盘空间满问题、解决Windows实例磁盘空间满问题。CPU使用率较高。解决方法请参见 Linux系统ECS实例中CPU使用率较高问题的排查及解决方案、...

Windows系统实例的宕机问题排查

当Windows操作系统的ECS实例在运行过程中出现内核panic、内存溢出OOM(Out Of Memory)、蓝屏卡死等问题或收到系统事件通知实例出现操作系统崩溃时,说明该ECS实例发生宕机,您可以通过自助诊断工具或系统事件来定位原因并解决。定位宕机...

功能特性

数据源配置管理 您可以在产品中添加多种不同类型的数据源配置,每个数据来源配置代表一个核对系统在后续核对工作中可以用来读取数据的数据来源配置,当前支持如下类型的数据源配置:OSS:OSS 文件系统的读取配置,需要您输入访问信息,...

通过Mac系统的远程桌面连接Windows实例,提示“远程...

问题原因 在Windows系统的ECS实例内,计算机安全组策略配置不正确,导致使用Mac系统的远程桌面无法远程连接Windows系统的ECS实例。解决方案 通过VNC连接Windows实例。具体操作,请参见 通过密码认证登录Windows实例。右键单击 图标,然后...

ECS实例宕机并产生“VFS:Unable to mount root fs on ...

如果您的ECS实例在启动过程中循环宕机,且产生了 VFS:Unable to mount root fs on unknown-block 日志信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在启动过程中出现循环宕机,无法正常进入系统,且产生类似于如下所示的调用...

Windows Server 2008 R2因驱动签名无法验证导致启动...

本文介绍Windows Server 2008 R2系统因无法验证驱动的数字签名导致系统启动失败问题的原因和解决方案。问题现象 Windows Server 2008 R2系统无法启动,如下图所示,提示无法验证此文件的数字签名。问题原因 该问题是由于系统不支持SHA256...

为什么要升级到MongoDB的新版本

【现象】:会导致mongos异常宕机,重启后自愈 MongoDB 4.0~4.2 SERVER-43889 低【触发条件】:偶发。【现象】:服务端无法正确区分事务和retryable wirtes而导致请求失败报错。MongoDB 4.0~4.4 SERVER-51281 SERVER-50365 高【触发条件】:...

购买的域名为什么一直在处理中?

本文为您介绍购买域名后,订单状态一直处于处理中的常见场景、可能原因和相应解决方法。新购买的域名一直显示处理中状态 可能原因一:您的域名注册信息还在等待注册局实名核验系统进行数据关联。处理方法:根据《互联网域名管理办法》,...

计算机型号及浏览器版本常见问题

本文介绍由于计算机型号及浏览器版本的原因导致DataV产品使用卡顿的问题现象及解决方法。MacBook用户编辑器卡顿问题 问题现象 当您使用MacBook时,打开DataV编辑页面之后使用卡顿,CPU占用率飙升。该问题一般发生于如下场景:使用MacBook当...

计算机型号及浏览器版本常见问题

本文介绍由于计算机型号及浏览器版本的原因导致DataV产品使用卡顿的问题现象及解决方法。MacBook用户编辑器卡顿问题 问题现象 当您使用MacBook时,打开DataV编辑页面之后使用卡顿,CPU占用率飙升。该问题一般发生于如下场景:使用MacBook当...

Alibaba Cloud Linux 2系统的ECS实例...系统宕机如何处理...

本文介绍如何解决Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode导致系统宕机问题。问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 ...

Alibaba Cloud Linux 2系统的ECS实例...系统宕机如何处理...

本文介绍如何解决Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode导致系统宕机问题。问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 ...

主备方案介绍

由于软件Bug导致全集群宕机。由于慢盘或者坏盘造成的集群访问超时。故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾...

slmgr.vbs文件类型变化导致无法激活Windows系统如何...

本文介绍slmgr.vbs文件类型变化导致无法激活Windows系统问题的原因及解决方案。问题描述 Windows系统中无法运行slmgr.vbs文件,且slmgr.vbs文件类型发生改变,由VBScript改变为VBS,导致无法激活系统。如下图所示,右侧的文件类型为正常...

调整innodb_flush_log_at_trx_commit和sync_binlog...

因为DDL变更或其他InnoDB内部原因导致更新磁盘的操作独立于innodb_flush_log_at_trx_commit参数设置,不能完全保证每秒更新磁盘一次,没有被更新到磁盘中的事务可能会因宕机而丢失。当innodb_flush_log_at_trx_commit=0时,InnoDB会每...

域名或网站无法访问如何排查?

本文为您介绍域名或网站无法访问的可能原因及处理方法。说明 如您的网站无法访问,推荐你优先使用域名检查工具排查域名问题,相关操作链接请参见 使用域名检测工具排查域名问题。域名已过期 域名被锁定 域名未备案 备案未接入阿里云 备案...

诊断项与诊断结果说明

检查该实例的系统盘是否存在IO hang的情况(即磁盘内的文件系统因读写IO延迟过高导致系统不稳定或宕机)。如果出现IO hang,云盘无法进行读写操作。建议您查看云盘的性能指标,具体操作,请参见 查看云盘监控信息。如果您使用的是Alibaba ...

Windows系统组件损坏导致系统激活失败如何处理?

本文介绍Windows系统组件损坏导致系统激活失败的原因及解决方案。问题描述 Windows系统启动后,桌面背景为黑色,右下角出现“【此Windows副本不是正版】激活失败”提示。参考 如何使用KMS域名激活VPC网络中的Windows实例 步骤进行手工激活...

域名或网站无法访问如何排查?

本文为您介绍域名或网站无法访问的可能原因及处理方法。域名已过期 可能原因:域名已经过期,域名的解析记录被暂停,导致无法正常访问网站。处理方法:在 域名信息查询(WHOIS)中查询域名的到期日期,如果域名已经过期,您需及时对域名...

Alibaba Cloud Linux 2系统的ECS实例...泄漏导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-22.2.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[49.804600]RDX:...

Alibaba Cloud Linux 2系统的ECS实例...泄漏导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-22.2.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[49.804600]RDX:...

DMS执行数据变更任务时发生“No operations allowed ...

主要有如下几种问题场景:实例宕机 会话连接被人为结束(会话被kill)会话连接超时,连接自动断开 解决方案 根据不同的问题场景,解决方法也不一致:实例宕机:若您是RDS实例:此问题一般在10分钟内会自动修复,请您在10分钟后重新执行任务...

查看自定义监控系统显示数据不足

本文为您介绍在金融云环境下,部分集群因数据上报地址调整导致自定义监控数据不足的原因及处理方法。问题现象 金融云用户下载自定义监控SDK并成功部署后,在控制台无法查看相关监控数据,状态显示为 数据不足。进一步测试发现,在系统内 ...

存储资源

可能原因包含数据库服务进程异常退出、数据库节点宕机、数据库网络异常等,常见的容错策略如下:自动重启:当数据库实例异常终止或崩溃时,可以设置自动重启和恢复机制,自动重新启动数据库服务,并进行必要的数据恢复操作,以确保数据库的...

版本说明

本文为您介绍云监控插件的版本...当系统负载较重或其他原因导致云监控插件的系统资源占用超过限制时,插件会自动退出。修复问题 解决Go版本的云监控插件自动修改系统时间等问题。早期版本 云监控插件的早期版本说明,请参见 早期版本说明。

Alibaba Cloud Linux 2系统的ECS实例...指针导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:4.19.91-21.al7.x86_64及之前的内核版本。系统宕机,且出现如下调用栈信息。[7674143.032169]...

Alibaba Cloud Linux 2系统的ECS实例...指针导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:4.19.91-21.al7.x86_64及之前的内核版本。系统宕机,且出现如下调用栈信息。[7674143.032169]...

Spark

解决方法:通过日志中的报错信息查看异常的具体原因,大部分异常原因跟业务逻辑相关,您可以对进行排查或搜索相关报错信息自行解决。说明 如果出现OOM异常,则需要检查业务逻辑是否有大内存占用,特别是某个字段特别大的情况。如果确实...

ECS服务器内操作出现卡顿的排查步骤

检查服务器内进程与服务否占用过多的内存,或者内存没有正常释放,导致出现内存溢出或系统宕机。检查/var/spool/cron 目录等系统配置中,是否有添加计划任务在对应的时间段执行。检查Web服务器的参数是否超过了服务器的性能,例如最大连接...

告警规则指标说明

JVM实例数 无 是 当前实时运行的Java虚拟机实例数量,常用于服务宕机告警配置。节点机发送的字节数 无 不是 节点机通过网络连接发送的数据量,其中包括应用程序发送的数据、系统消息和错误信息等。节点机发送的报文数 无 不是 节点机通过...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS Web应用防火墙 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用