同城容灾架构概述

非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障时系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免单点逻辑出现。幂等...

高可用拓扑

背景信息 您可以通过购买两台智能接入网关设备组成高可用网络接入阿里云,智能接入网关设备备份方式分为双机冷备和双机热备两种:双机冷备:主设备在线,当主设备发生故障时,用备设备替换主设备连接入网,且需在智能接入网关管理控制台...

应用场景

以此,降低产品使用过程中故障发生概率,提高故障恢复效率,进而实现产品高可用性的有效提升。机房级容灾 同城双活 同一个城市,建设两个机房环境,两地距离 50 km 以内,万兆光纤专线互连,业务应用层面可以两个机房同时提供业务服务,当...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

网络架构容灾

网络是数字世界的基础设施,没有网络的联通,所有信息都无法交互,因此网络架构的设计在应用系统中至关重要,特别是针对网络架构的高可用及容灾能力的设计,是业务在异常发生时,实现快速恢复、降低业务损失的关键。云上网络规划设计 为...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

容灾管理服务介绍

针对有高可用需求的用户,CADT容灾管理服务提供规划、优化、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行容灾演练,验证系统是否能够抵御资源故障或者AZ故障,保障系统健壮性。主要功能 容灾规划 在用户部署资源前,通过...

企业单AZ架构升级到多AZ

多可用区部署的常见应用:关键业务系统:对于需要高可用性和连续性的关键业务系统,如金融服务、医疗保健和电子商务平台,多AZ部署可以确保系统即使在一个数据中心发生故障的情况下也能继续运行。容灾要求高的场景:当组织需要符合特定的...

步骤1:创建实例

设置项 说明 实例类型 高可用:具有多副本,支持高可用,当主节点发生故障后能够自动切换节点。适用于数据有可靠性要求场景。单副本:仅单副本,适用于测试、开发以及对数据可靠性无要求的场景。版本兼容性 根据需求选择兼容的Redis版本。...

附录:SOFAStack 产品目录

SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,帮助业务需求敏捷迭代;同时满足异地容灾、低成本快速扩容的需求,能够解决传统集中式架构转型的困难,并通过打造大规模高可用分布式...

AIOps 解决方案专家服务内容说明

在方案设计中我们提供包括时序预测和根因分析、历史数据预测的3大类算法场景的设计,更多具体算法详见《10.1算法列表》《智能故障发现设计方案》3 定制化业务风险巡检方案设计 基于阿里云业务资源和技术能力,为企业定制化业务风险巡检能力...

步骤1:创建实例

主节点提供日常服务访问,备节点提供HA高可用,当主节点发生故障,系统会自动在30秒内切换至从节点,保证业务平稳运行。单副本:仅使用单个数据库节点部署,无实时同步数据的从节点,适用于数据可靠性要求不高的纯缓存业务场景使用。单副本...

公共汇总粒度事实层(DWS)

公共汇总粒度事实层以分析的主题对象作为建模驱动,基于上层的应用和产品的指标需求构建公共粒度的汇总指标事实表。公共汇总层的一个表通常会对应一个派生指标。公共汇总事实表设计原则 聚集是指针对原始明细粒度的数据进行汇总。DWS公共...

公共汇总粒度事实层(DWS)

公共汇总粒度事实层DWS(Data Warehouse Summary)以分析的主题对象作为建模驱动,基于上层的应用和产品的指标需求构建公共粒度的汇总指标事实表。公共汇总层的一个表至少会对应一个派生指标。公共汇总事实表设计原则 聚集是指针对原始明细...

代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

大数据实时计算性能调优服务

数据产品设计需求对接 IT架构组 1.总体系统架构设计 2.全状态产品、服务安装部署 3.系统保障性运维支持 数据开发组 1.现有监测指标联调部署 2.定制化中台监测指标开发部署 3.数据测试及验证 应用开发组 1.现有监测产品、服务部署调测 2....

基本概念

本文列出了 SOFAStack 涉及的基本概念,以便于您更好地理解产品。A|B|C|D|F|G|H|I|J|K|L|M|O|P|Q|R|S|T|W|X|Y|Z A AKE 容器引擎(Ant Financial Kubernetes Engine,AKE)是将底层物理资源按照计算、网络、存储等进行切分和抽象的容器引擎...

专家成长计划服务内容说明

30人 公共云-深入运维故障处理技术能力 阿里云弹性计算产品运维 8 基于海量云上的诊断排查实战经验,针对使用ECS产品场景,提供针对阿里云产品功能特性、架构设计、性能调优、疑难诊断等方面技术赋能,包括但不限于如下场景的综合技术项:1...

用云成本需求分析

捕获成本需求 企业级客户主要从以下几个方面获取用云成本需求:业务地域性 合规性 安全性 业务连续性和稳定性 技术团队管理 自动化和标准化 成本优化目标 分析成本需求 业务地域性 选择云地域,在全球跨国企业的客户上云过程中,选择一个...

什么是多活容灾

多活容灾MSHA(Multi-Site High Availability)是在阿里巴巴电商业务环境演进出来的多活容灾商业化产品,是应用高可用服务AHAS的核心模块,为客户提供容灾架构建设能力。横向支持容灾架构的上线、运维、演练、切流,升级到下线。纵向支持...

商米:DevOps转型实现精益开发与自动化运维

优势 劣势 资源不易空闲,需求排着队任何一个组员都能随时顶上 延续性差:分配任务时可能熟悉需求的成员在另一个需求研发中,其他成员不熟悉此业务 组长参与需求把关,设计方案得到保障 归属感差:团队成员不对业务成果负责,有任务就做...

产品优势

智能高效 计算巢集成了阿里云一系列底层产品能力,为服务商提供了一个智能简捷的服务发布和管理平台,覆盖了服务的整个生命周期,包括服务的交付、部署、运维等。提升了服务的交付、部署和运维效率,解决了传统模式下依赖人工经验带来的...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

应用容灾

当灾难发生时,多活系统可以分钟级内实现业务流量切换,用户甚至感受不到灾难发生。“同城多活架构”和“异地多活架构”(代号“单元化”)都是典型的应用多活实现技术。应用多活的优势 分钟级RTO:恢复时间快,阿里内部生产级别恢复时间...

上海博卡:借助云效+ACK实现3分钟快速发布

主要产品是门店运营所需要的,管理软件,智能硬件以及营销小程序等。作为一个不足30人的研发团队,并且没有真正专职的运维人员,面对快速增长的客户以及越来越多的需求,拥有20多个微服务,几十个前端应用(web,小程序,app等),传统的...

Tair开发运维规范

云原生内存数据库Tair 拥有极强的性能,阿里云结合多年的运维经验,从业务部署、Key的设计、SDK、命令、运维管理等维度展示 Tair 开发运维规范,为您设计高效的业务系统提供参考,帮助您充分发挥Tair的能力。了解 Tair 性能边界 图 1.Tair ...

关于连接Tair、Redis实例的客户端程序的重要提示

阿里云不承担其相关的稳定性、服务限制与安全合规等责任,其服务质量也不计入云服务SLA,您应及时关注对应SDK的官网、代码托管平台的版本更新动态,确保能够及时应对此类第三方SDK可能发生的问题、风险。Tair、Redis 支持的命令列表,请...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<块网关IP地址>访问本地块网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域,...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<文件网关IP地址>访问本地文件网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

AccessGatewayFailover

AccessGatewayFailover事件提示您智能接入网关设备主IPsec链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。...

DeviceWanLinkDown

DeviceWanLinkDown事件提示您设备WAN链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

链路状态

发生故障时,及时进行切换。操作步骤 登录 智能接入网关控制台。在 智能接入网关 页面,单击目标实例ID。在智能接入网关实例详情页面,单击 高可用配置,可查看链路状态。绿灯:表示链路正常。红灯:表示链路故障。icmsDocProps={'...

设备级高可用

在购买智能接入网关设备时,您可以选择购买两台设备,两台设备绑定到同一实例中,互为备份,在一台设备发生故障时进行设备切换,保障业务不中断。通过本文您可以在智能接入网关控制台查看设备级备份信息。前提条件 您购买的智能接入网关...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

业产技融合分层协作方案

主题会包含哪些具体的产品需求及实现路线图 由产品团队创建,也是产品团队负责 需求 产品类需求 技术类需求·产品设计方案(PRD)·交互/视觉设计·更细的任务拆分(工作量评估)·技术方案/测试方案 产品团队创建,技术团队负责 任务 设计...
共有102条 < 1 2 3 4 ... 102 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
应用高可用服务 数据库自治服务 云数据库 OceanBase 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用