单实例快速恢复

该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问恢复中的节点,则查询会立即失败。节点恢复速度在一分钟左右,当表数量明显增加时,恢复时间会更长。Hologres...

什么是应用配置管理ACM?

凭借配置变更、配置推送、历史版本管理、灰度发布、配置变更审计等配置管理工具,ACM能帮助您集中管理所有应用环境中的配置,降低分布式系统中管理配置的成本,并降低因错误的配置变更造成可用性下降甚至发生故障的风险。迁移到MSE Nacos ...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

主备方案介绍

灾备方案 说明 单可用区高可用方案 主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统监控主备节点的健康状态并自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案 主备节点...

设计方案

基于稳定性支柱设计原则,整体稳定性设计方案可参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量级的通信机制...

产品优势

安全可靠 DTS底层为服务集群,如果集群内任何一个节点宕机或发生故障控制中心都能够将这个节点上的所有任务快速切换到其他节点上,链路稳定性高。DTS内部对部分传输链路提供7×24小时的数据准确性校验,快速发现并纠正传输数据,保障传输...

Tair选型指南

选择容灾方案 图 3.Tair容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

互联网行业

一旦设备发生故障需要维修,将严重影响业务和工作效率。弹性不足:传统的电脑办公系统无法满足战略和项目的快速调整,资源不足或过剩都会影响业务和成本。方案介绍 安全办公研发:无影云电脑、安全策略、无影云盘或NAS(加上AD连接器和云...

网络资源

容灾:建立容灾和高可用的系统架构,将系统部署在多个地理位置或数据中心,并使用负载均衡和故障切换技术,以确保即使发生网络分区,系统仍然可以继续提供服务。网络闪断故障 指网络连接在短时间内频繁中断和恢复,造成网络连接不稳定的...

集群系列

且单个只读实例没有灾备,因此为了保障业务的可用性和连续性,建议至少创建两个只读实例,以确保某一个只读实例发生故障时,另一个只读实例可以继续提供服务。购买集群系列实例时,建议您选择多可用区部署,以实现跨可用区的容灾能力。架构...

词汇表

边缘云计算节点基于飞天内核技术架构,主要搭载边缘节点服务ENS,通过靠近客户侧的去中心化小型云计算平台能力,实现了广覆盖、低时延、大带宽的技术特点,为用户提供安全稳定、可靠的全球内容分发加速服务和边缘计算服务,帮助客户解决...

围绕混沌工程的平台实践

因此混沌工程是一门学科,它提供了基本的理论指导,而故障演练是混沌工程的具体实践,通过向目标系统注入真实可能发生故障来考量系统稳定性。混沌工程和AHAS Chaos AHAS Chaos是以混沌工程为理论指导的故障演练平台,目标是成为混沌...

ECS系统事件概述

说明 非预期运维事件一般指的是因底层宿主机发生了无法预测的故障,或者ECS实例的操作系统发生了内核错误等问题,导致ECS实例突然出现宕机或重启。因宿主机故障导致ECS实例宕机或重启事件(SystemFailure.Reboot)属于偶发现象,无法避免。...

集群高可用架构推荐配置

容器服务 Kubernetes 版 基于Kubernetes架构提供了多种集群高可用保障机制,以确保集群控制面、节点与节点池、工作负载、负载均衡等维度的高可用,帮助您构建稳定安全、可靠的集群和应用架构。本文使用指引 本文主要面向 容器服务 ...

网络架构容灾

网络是数字世界的基础设施,没有网络的联通,所有信息都无法交互,因此网络架构的设计在应用系统中至关重要,特别是针对网络架构的高可用及容灾能力的设计,是业务在异常发生时,实现快速恢复、降低业务损失的关键。云上网络规划设计 为...

部署高可用及共享存储Web服务

1个公网负载均衡CLB:基于对流量按需分发的能力,可以将流量分发到不同的后端服务器,可消除系统中的单点故障,当某个服务器发生故障时,CLB会自动将请求分配到其他正常的服务器上,从而保证服务的连续性和稳定性。2个文件存储NAS:实现多...

云服务器ECS安全

凭借配置变更、配置推送、历史版本管理、灰度发布、配置变更审计等配置管理工具,ACM能帮助您集中管理所有应用环境中的配置,降低分布式系统中管理配置的成本,并降低因错误的配置变更造成可用性下降甚至发生故障的风险。更多信息,请参见 ...

ADP底座/本地运维控制台

ADP底座/本地运维控制台发布记录。V1.4.6 Bug Fix 修复某些场景下垂直扩缩容运维操作报错的问题 修复Redis水平扩容运维操作无效的问题 修复Redis sentinel模式下不支持垂直扩容的问题 修复运维操作执行结果被后续运维操作回滚的问题 修复...

无法远程连接Windows实例的排查方法

您可以在云安全中心的 设置 中,添加本地IP至白名单,这样就不会对本地IP远程登录此服务器进行拦截,具体操作如下:登录 云安全中心控制台。在左侧导航栏,选择 系统配置>功能设置。在 设置 页签的 其它配置 子页签,单击 安全管控 区域的 ...

监控、诊断和故障排除

另外,通过日志的时间戳,不仅可以迅速查找和定位日志范围,还能够了解在请求发生时间点范围内,客户端应用、网络或者服务系统发生的其他事件,有利于问题的分析和调查。RequestID OSS服务会为接收的每个请求分配唯一的服务器请求ID,即...

诊断项与诊断结果说明

实例管控系统异常 ECS实例后台管控系统发生异常。检查该实例的后台管控系统是否正常工作。如果后台管控系统未正常工作,可能会导致实例运行异常。您可以尝试通过重启实例进行恢复。实例性能短暂受损 检查实例是否受到底层软硬件问题的影响...

前言

稳定性:无论在何种环境都无法避免单个组件故障发生稳定性的目标就是要尽量降低单个组件故障对业务带来的整体影响。该支柱侧重于如何让业务系统利用现代云平台的基础设施达到高可用,做到面向失败设计,具备一定容灾性的能力。同时把控...

附录:SOFAStack 产品目录

SOFAStack 源于自蚂蚁内部沉淀十多年的金融级分布式中间件技术体系,吸收了支付宝自创立以来在关键金融交易系统锤炼出来的架构实践。SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

专家成长计划服务内容说明

30人 基于ITSM/ITIL的阿里云运维最佳实践工作坊 8 数字化时代业务形态越来越复杂,IT技术已经是业务发展的主要驱动力,面对复杂不确定的业务形态,如何让运维体系保障业务的安全稳定和灵活性?阿里云集合传统IT运维理论并通过大规模商业...

基于Kubernetes容器集群的容灾架构与方案

在进行系统架构设计时,您必须考虑到信息系统和基础设施可能遇到的各种潜在威胁,例如:硬件故障、软件系统崩溃、人为操作失误、安全攻击、自然灾害等。为了确保系统能够在各种异常故障场景下快速恢复并保持业务连续性,您必须为系统设计...

远程桌面无法连接到Windows实例的快速排查方法

案例二:安全狗程序异常 使用控制台远程连接功能登录到Windows实例后,在系统桌面右下角,安全狗弹出错误提示,系统显示类似如下。该问题可能是由于安全狗软件出现异常导致的。可通过Windows系统卸载安全狗软件后,重启服务器,网络即可...

功能特性

转移账号 使用FTP或Windows资源管理器管理文件 开启和关闭FTP功能 为了保障网站的安全运行,Linux操作系统云虚拟主机管理控制台支持开启和关闭FTP功能。关闭该功能后您将无法通过FTP工具上传或下载网站文件,后续如果有需求时再次开启FTP...

大数据实时计算性能调优服务

本项目计划、实施时间和工作量评估是基于本SOW约定范围制定的,如果项目范围发生调整,双方应依照本工作说明书附件一《项目变更流程与项目变更控制申请单》中规定的程序评估对项目价款、计划和工作量的影响,并在签署《项目变更控制申请单...

挂载访问FAQ

目前仅支持Linux操作系统挂载NFS文件系统,Windows操作系统挂载SMB文件系统、Windows操作系统挂载NFS文件系统及Linux操作系统挂载SMB文件系统场景,请您登录ECS实例执行命令挂载。更多信息,请参见 Windows系统挂载SMB文件系统、Windows...

产品优势

然而,企业在建设物联网系统的过程中往往存在各类阻碍。针对这些严重制约企业物联网发展的问题,阿里云物联网平台相比企业自建MQTT集群、MQTT服务器具有不可比拟的优势。本文从能力、费用两方面将自建MQTT集群与阿里云物联网平台进行了对比...

基本概念

熔断 熔断可以使应用程序具备应对来自故障、潜在峰值和其他未知网络因素影响的能力,避免网络和服务调用故障级联发生系统整体性能下降或者崩溃。ASM支持在流量策略中配置熔断功能,在网络访问超出熔断配置时能够拒绝请求。更多信息,请...

同城容灾架构概述

非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免单点逻辑出现。幂等...

性能优化与诊断简介

在RDS MySQL日常运维中,您可以通过数据库自治服务DAS(Database Autonomy Service)来处理数据库故障、优化性能、提升效率、降低运维成本。DAS是一种基于机器学习和专家经验的云服务,实现数据库自感知、自修复、自优化、自运维和自安全,...

阿里云上稳定性保障服务(架构优化)

业务目标梳理 确认架构优化目标 确认业务范围 现有系统分析 阿里云提供现有系统的承载能力分析(流量、并发、请求RT、数据库等)改造实施 阿里云根据现有系统的能力输出改造方案 安全加固 根据客户业务安全需求,提供安全加固建议 提供安全...

漏洞管理常见问题

因此,您可以通过以下方式查看当前软件版本的漏洞信息:在云安全中心中查看当前软件版本及漏洞信息 您可以在 云安全中心控制台 风险治理>漏洞管理 页面,查看云安全中心在您的服务器上检测到的系统软件版本及漏洞信息。系统软件漏洞各项...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

什么是全局流量管理?

⑤ 容灾预案:容灾预案可以帮助用户实现容灾演练,或发生故障时快速切换访问流量,包括创建容灾预案、执行/回滚等相关信息。系统架构 全局流量管理是由管控层和解析层两部分组成:管控层:管控层通过控制台和OpenAPI对外提供服务,主要实现...

安全响应

系统安全类事件 勒索病毒 系统遭受勒索病毒攻击,核心数据被加密 高 系统事件往往会来自云安全中心,云安全中心同样会对入侵事件进行定级,建议参考云安全中心的定级说明 故障稳定性类事件 云稳定性事件 网络或应用宕机 高 稳定性事件通常...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
阿里邮箱 云安全中心 数字证书管理服务(原SSL证书) 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用