主从(备)切换

注意事项 实例切换过程中会出现闪断,请确保您的应用程序具有自动重连机制。实例切换后,只读实例的数据会有几分钟的延迟,因为需要重建复制链路、同步增量数据等。手动切换主备实例 说明 仅 MyBase MySQL 高可用版实例支持主备切换。登录 ...

自动故障剔除

自动故障剔除功能自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

自动故障转移和读写分离

libpq实现自动故障转移和读写分离 通过libpq函数连接多个数据库,当出现故障自动切换到可用的数据库。命令 postgresql:/[user[:password]@][netloc][:port][,.][/dbname]?param1=value1&.]示例 如下示例为连接1个RDS PostgreSQL主实例...

应用场景

如果现有计算资源突然出现故障导致业务受到影响,很难及时进行故障修复或者替换。您可以利用弹性伸缩的高可用优势,开启健康检查模式。阿里云自动检查实例的健康状态,当发现存在实例不健康时,自动增加实例替换不健康的实例,确保...

在/var/log/messages日志中出现“INFO:task jbd2/vda1...

系统内核问题:当系统内核存在漏洞或者其他问题时,可能会出现hung task故障。系统资源紧张:ECS实例中应用或进程占用系统资源使用率(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考...

节点异常问题排查

常见排查方法 节点故障诊断 当节点出现故障时,您可以使用容器服务ACK提供的故障诊断功能,一键诊断节点异常。登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...

节点异常问题排查

常见排查方法 节点故障诊断 当节点出现故障时,您可以使用容器服务ACK提供的故障诊断功能,一键诊断节点异常。登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...

使用云监控功能监控网站环境(部署于ECS实例)

设置合理的监控可以让您实时了解系统业务的运行情况,并能帮助您提前发现问题,避免可能会出现的业务故障。同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。前提条件 在开始设置云监控前,您需要...

ZooKeeper的使用场景和MSE ZooKeeper的优势

节点故障自愈:依托于K8s的Liveness能力,在节点出现故障时,自动恢复故障节点,及时地保障服务的可持续性。数据安全:MSE ZooKeeper专业版提供了快照的备份能力,在集群出现非预期的情况时,能够快速重建恢复集群中的数据,保障数据的...

副本集实例连接说明

重要 不建议在生产环境的应用程序通过该地址连接实例,当主节点出现故障时,发生主备切换,主节点地址发生变化,您需要连接新的主节点确保读写操作不受影响。Secondary:从节点,连接从节点地址仅能执行数据库的读操作。Readonly:只读...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

使用限制

故障切换 对于高可用系列、集群系列实例,当主节点出现故障时,RDS在30秒内切换到备节点(某些主备不一致等特殊场景可能切换时间较长)。切换过程中有30秒左右的连接闪断,需要您设置好程序的自动重连,避免因为切换导致服务不可用。切换...

使用须知

实例升级 GDB实例升级的过程中会出现短时间的连接闪断,需要您提前做好准备,并设置好程序的自动重连,避免因为升级导致服务不可用。故障切换 GDB高可用版实例主节点出现故障时,系统会快速切换到备节点。切换过程中有短时间的连接闪断,...

响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

云盒计算资源配置最佳实践

反之,如果选择最大实例规格为ecs.g6.26xlarge的SKU,由于该规格族的vCPU和内存配比1:4,则会出现内存浪费的情况。根据业务需求选择SKU时,可能会需要多种不同配比的ECS实例,此时可以选择多种规格族混合的SKU,以减少资源浪费。例如:您...

切换接入点

智能接入网关设备连接阿里云时,因公网质量影响,上云链路可能会出现不稳定等情况,您可以根据业务需求切换智能接入网关设备的接入点,方便您更加灵活、稳定地使用上云服务。背景信息 接入点是智能接入网关设备接入云连接网时的连接点。...

自动切换可用区

开启可用区容灾 自动切换 后,如果 主可用区出现故障,集群将自动切换至备可用区,如下图所示:(可选)开启 半同步模式进行跨可用区的数据复制。说明 半同步模式:在事务提交时,需要等待此次事务产生的redo日志在跨可用区备份节点完成...

云数据库Redis版是否开放了从节点?

当主节点出现故障,HA系统自动进行主从切换,保证业务平稳运行。高可用类型的集群架构也是由多个主从(Master-Replica)双节点组成,其中从节点仅用于故障切换(HA),不提供读写服务。如需使用只读节点实现读写分离场景,您可以使用读写...

集群版-单副本

纯缓存应用 单副本集群版的分片服务器由单节点组成,分片服务器某节点出现故障时,系统重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,数据将丢失,有可能流量被冲击到后端数据库,需要做好应用程序的预热保护机制...

MSE注册配置中心高可用最佳实践

多可用区实例将物理服务器部署在不同的可用区,当可用区A出现故障时,流量在短时间内切换到另一个可用区B。整个过程您无需感知,应用代码无需变更。您只需配置多个节点部署,MSE自动部署到多个可用区。图 1.MSE三节点同城双活架构图 图 2...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

移动性能监控简介

应用场景 网络性能问题定位 通过网络全链路数据监控,及时发现网络问题定位故障链路问题节点,辅助用户进行网络诊断。页面性能问题定位 通过对页面加载时长指标进行监控,发现慢加载页面,从而定位问题页面,帮助技术人员进行问题排查。...

创建实例

当主可用区出现故障时,将自动切换到备可用区继续提供负载均衡服务,可以有效提升本地可用性。备可用区 选择实例的备可用区。备可用区默认不承载流量,主可用区不可用时才承载流量。实例名称 自定义新建实例名称。长度限制为1~80个字符,...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现故障 ...

回切至本地VMware

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到云下VMware环境中。前提条件 已部署CDR网关。更多信息,请参见 步骤三:部署CDR网关。已在被保护的Windows服务器上安装阿里云复制...

故障排查

如果您在使用 ACK Serverless集群 时出现故障,可根据以下故障分类匹配故障场景和解决方案,帮助您快速排查问题,提升运维效率。分类 相关文档 集群资源和集群组件异常问题排查 集群检查项及修复方案(包括升级集群、迁移集群、安装组件、...

什么是用户体验监控

数据探索 为满足您在日常问题追踪过程中对指标维度的灵活分析需求,用户体验监控 数据探索能力已开放全部维度与指标数据的组合分析,可以通过配置筛选出任意维度与指标的数据,帮助您进一步缩短问题分析路径,快速定位故障影响范围。...

某在线教育领导品牌推荐业务迁移至阿里云Lindorm

存储成本降低50%以上,使用集群内单表冷热分层存储可进一步降低存储成本 云Lindorm基于AJDK ZGC(阿里JDK)实现GC优化,内核层面优化消除GC带来的请求不稳定问题,迁移后至今稳定未出现故障 通过云Lindorm管控实现一键扩缩容,轻松应对春晚...

什么是应用实时监控服务ARMS?

完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能表现情况,并支持日志数据查询,帮助您快速跟踪定位故障原因,提升用户体验。...

单节点架构

单节点架构只有一个副本,极端情况下如发生故障会造成30分钟左右服务不可用状态,建议您在生产环境中使用副本集架构或分片集群架构。问:单节点实例是否支持增量数据迁移与同步、按时间点创建实例恢复数据功能?答:不支持。云数据库...

概述

分布式链路跟踪具备以下特点:全链追踪:能够深入应用,服务,数据库,消息,捕获性能异常,识别出现故障的组件及服务。易于使用:可以与 SOFAStack 上的应用进行无缝对接,用户的业务代码无需任何修改即可轻松接入,实现性能可视化与问题...

创建MySQL集群

主实例的数据同步到备实例,当主实例出现故障无法访问时,自动切换到备用实例。说明 高可用 支持本地盘存储和云盘存储。专属集群名称 专属集群的名称。专有网络 专属集群归属的专有网络VPC。如需创建新的专有网络,您可登录 VPC控制台...

高可用版

支持版本 MySQL 8.0 MySQL 5.7 MySQL 5.6 拓扑图 优势 高可用性 高可用版实例有一个备节点,主节点的数据通过半同步或异步复制方式同步到备节点,当主节点出现故障无法访问时,自动切换到备节点。说明 当只读节点故障时,只读节点的备...

产品原理

当主地址池集合中,有一个应用服务地址出现故障时,HeathCheck模块准确的检测到异常情况,同时HeathCheck模块和DNS模块进行交互,最终是通过DNS模块将异常地址从向用户返回的应用服务地址列表中暂时删除;如果HeathCheck模块检测到应用...

在Windows实例无法访问外部网络如何处理?

此时,您可以在CMD命令提示符中使用 ping 网段 命令对相关的多个网段进行对比测试,操作步骤如下:说明 ping 网段 命令仅针对特定网络不通而不适合排查所有网络故障问题。打开命令提示符。在桌面左下角,单击 图标,然后在搜索框输入 cmd。...

诊断决策树

对于已知的明确故障,可以根据诊断现象,编排诊断决策树,进而故障发生时执行,完成故障定位。对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策树 登录高可用管理控制台。在左侧导航栏上,单击 ...

产品原理

当 Pool A 中,有一个应用服务地址出现故障时,HeathCheck模块 准确的检测到异常情况,同时 HeathCheck模块 和 DNS模块 进行交互,最终是通过 DNS模块 将异常IP地址从向用户返回的应用服务IP地址列表中暂时删除;如果 HeathCheck模块 ...

ack-node-repairer

当节点出现故障时,自愈系统自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

标准版-双副本

当主节点出现故障,自研的HA系统自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

SanityCheck:算力健康检测

功能介绍 在执行DLC任务时,可能遇到以下问题:在任务花费一定时间加载模型Checkpoint或其他初始化操作后,由于申请的资源存在故障,无法顺利开始训练,需要调查定位故障问题并重新提交任务。该过程中导致GPU资源的浪费。在任务运行...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 商标服务 负载均衡 Node.js 性能平台 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用