组复制简介

数据 强 一致性 在组复制中,事务总是先传输到集群中其他节点,然后写入Binlog文件,这保证无论主节点在什么时刻发生故障,重新启动后数据都不会比集群选出的新主节点多。旧主节点故障重启后,能够自动加回集群,拉取它缺失的Binlog,就...

捕获内核的内存污染问题(KFENCE)

发生内存污染问题时,KFENCE会检测到并触发错误报告,并提供有关问题的详细信息。关于KFENCE的更多信息,请参见 KFENCE文档 和 龙蜥社区。阿里云在Alibaba Cloud Linux 3中对KFENCE功能进行了增强,能够灵活动态开关KFENCE和全量捕获内存...

如何处理Windows Server 2003/2008...虚拟内存不足问题...

本文介绍Windows Server 2003/2008系统的ECS实例虚拟内存不足导致的问题及解决方案。问题现象 一般而言,Windows Server 2003/2008系统的ECS实例缺少虚拟内存时会引起很多问题,包含但不限于如下现象:操作系统运行缓慢,甚至出现宕机,...

代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

JVM内存不足

当您遇到JVM内存不足的问题时,请按本文提供的方法尝试解决。错误信息 java.lang.OutOfMemoryError 解决方案 设置内存大小,具体方案请在互联网中搜索 JVM内存设置。

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

ListPrometheusAlertTemplates-查看告警模板列表

调用...10","Duration":"1m","Labels":{"Value":"warning","Name":"severity"},"Annotations":{"Value":"节点 {{$labels.instance }} 可用内存不足10%,当前可用内存 {{$value }}%","Name":"message"} } } XML 格式...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<块网关IP地址>访问本地块网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域,...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<文件网关IP地址>访问本地文件网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域...

出错提示“To ensure the migration,this machine ...

问题原因 待迁移的操作系统的根目录磁盘空间不足2 GiB或者内存不足600 MiB,导致操作系统迁移失败。解决方案 远程连接ECS实例。具体操作,请参见 通过密码或密钥认证登录Linux实例。清理磁盘空间或者暂停业务程序。根目录磁盘空间不足2 GiB...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

Windows实例系统负载的查询及分析

虚拟内存 如果Windows实例虚拟内存不足,请参考 Windows虚拟内存不足问题的处理。系统内存 如果Windows实例系统内存问题,请参考 Windows系统内存分析工具的介绍。带宽使用率 如果Windows实例带宽使用率较高,请参考 Windows实例中带宽使用...

Linux系统的ECS实例的系统、内存或进程出现异常,查看...

问题现象 Linux系统的ECS实例的系统、内存或进程出现异常,通过查看系统日志提示"page allocation failure"错误,表示系统因内存不足导致无法为新的内存页分配内存空间,内存页分配失败。什么是内存页 内存页(Memory Page)是操作系统中对...

DeviceWanLinkDown

DeviceWanLinkDown事件提示您设备WAN链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

集群内存使用率告警

内存不足可能会都导致建连接失败,频繁内存交换也可能会影响请求失败。可能原因 业务发展过快导致容量不足内存增加。转储文件过大。处理方法 容量不足需要进行节点资源升配。转储文件过大一般公有云人员会进行处理,如果紧急请发工单联系...

DLC常见问题

本文汇总使用 DLC 模块遇到的常见问题、定位思路以及解决办法。“exited with code 137...您可以结合任务详情中worker的内存水位来进一步判断内存不足的原因,或更换内存规格更大的实例,或增加worker数量,或修改您的代码中内存申请的数量。

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

自动增加分片

当Redis数据库实例数据规模增大、读写流量暴增时,通过自动增加分片功能,可以快速弹性适配可用内存不足的情况,确保实例内存利用率处于安全水位,帮助您规避Redis内存溢出的风险,可有效保障线上业务稳定性。本文介绍开启Redis自动增加分...

链路状态

发生故障时,及时进行切换。操作步骤 登录 智能接入网关控制台。在 智能接入网关 页面,单击目标实例ID。在智能接入网关实例详情页面,单击 高可用配置,可查看链路状态。绿灯:表示链路正常。红灯:表示链路故障。icmsDocProps={'...

快速入门Java堆分析

本文演示如何通过ATP的Java堆分析,寻找应用出现内存不足错误的原因 1.生成数据源,上传到ATP 假设我们观察到生产环境中的应用出现如下内存不足的报错:java.lang.OutOfMemoryError:Java heap space Exception in thread"Thread-3...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

作业投递

24 查询是否因为内存不足失败的 结果 是否因内存不足而导致查询作业失败,默认值为 否。否 投递目标资源组 目标资源组名称。test 重要 查询作业满足作业投递规则中的任意一个条件,就会被投递至指定资源组执行。单击 确认。(可选)管理...

应用场景

当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务,CLB 已在各地域部署了多可用区以实现同地域容灾。当...

Hive服务内存参数调整

调整场景 如果业务量上升,作业在元数据且作业执行相对延迟较大以及HiveMetaStore异常,且相关指标提示内存不足(例如HiveMetaStore内存指标(GC相关)超过阈值),可尝试将HiveMetaStore内存调大,如果HiveServer2也出现上述类似场景,可...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

高可用版

优势 可用性 采用经典高可用架构,主备之间通过复制(默认半同步)实现数据同步,一旦主库发生故障,将迅速检测并触发主备切换来保证可用性。备库故障对业务无影响,但会快速被检测到并触发备库自愈。可靠性 计算与存储分离,计算节点的...

ECS实例宕机并报错“Out of memory and no killable ...

出现该问题的可能原因有:系统内核存在内存泄漏,从而导致系统可用内存不足。oom_score_adj 为-1000 的进程占用过多内存,该类进程无法被杀死从而导致系统可用内存不足。说明 oom_score_adj 的值是一个整数,表示进程在Out of Memory(OOM...

Spark作业异常排查及处理

其他Spark Driver OOM内存不足场景 您可以按照以下方案解决:在EMR控制台中Spark服务的配置页面,调大 spark.driver.memory 的值。查看是否有collect等把数据拉取到driver的操作,如果collect的数据比较大,建议使用foreachPartitions在...

查询执行模式

相比较于全内存计算的 Interactive 模式,Batch 模式可以对查询的任务进行分批执行,每个子任务在内存不足的情况下,自适应地将内存数据换出到磁盘,降低数据计算的成本,提升数据处理的容量上限。Interactive模式 AnalyticDB MySQL 接收到...

应用内存不足

本文介绍在使用消息队列时出现应用内存不足时的一些常见问题及解决方法。现象 在应用部署的机器上查看内存已消耗完。在/{user.home}/logs/sofamq.log 能搜索到 OutOfMemory 关键字。在消息队列控制台查看目标 Group ID 的消费者状态,堆积...

Trino集群选型与内存配置建议

如下就是一个较为均衡的Trino集群:节点种类与数量 单台实例CPU核数 单台实例内存大小 1 Master 16核 64 GB 5 Core 16核 64 GB Trino内存配置建议 内存不足是导致Trino查询任务失败的主要原因。与Trino内存相关参数主要有(单位为GB、MB等...

备份和灾难恢复

阿里金融云可以支持同城双活/灾备、两地三中心等架构方式。1.同城双活 同城双活、灾备是阿里金融云的...故障切换回切:DNS将生产IP从原生产中心修改到灾备中心,实现跨Region的故障切换和服务恢复机制,主站发生故障时,由备站继续提供服务。

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用