附录:SOFAStack 产品目录

金融行业的日 金融行业的日是一个很复杂的操作,需要多个任务按照指定顺序协同工作才可以完成。传统实现方式是在系统代码里指定任务的执行顺序,当业务发生变化时需要修改代码才可以正常工作,可维护性很差。使用 SOFAStack 任务调度中...

云市场常见问题

本章节介绍阿里云OCR在云市场官方店铺(“阿里云计算有限公司”)的常见问题。产品功能相关问题 对图片的格式大小有怎样的要求?阿里云文字识别服务要求单张图片大小不超过10M,图片最长边不超过4096像素,最短边不小于15像素,当长边超过...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

产品优势

简单易用 服务开箱即用:支持即开即用的方式,购买之后即可使用,方便业务快速部署。...高可用 每个实例均有主从双节点:避免单点故障引起的服务中断。硬件故障自动检测与恢复:自动侦测硬件故障并在数秒内切换,恢复服务。

功能相关

本地盘来自单台宿主机,数据可靠性取决于宿主机的可靠性,存在单点故障风险和数据丢失风险。如果您对数据可靠性要求高,建议在应用层做数据冗余保证数据的可靠性。icmsDocProps={'productMethod':'created','language':'zh-CN',};

产品架构介绍

特殊场景下,可以将机房流量零,从而实现故障情况下的流量切换。精准路由:接入层支持根据HTTP请求Header/Cookie/Query String Parameters中携带的路由标识,以及配置好的路由规则名单,将流量路由到对应的机房。由于DNS域名解析的随机性...

应用场景

消除单点故障 您可以在 CLB 实例下添加多台ECS实例。当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务...

自动故障剔除

自动故障剔除功能会自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

云盒计算资源配置最佳实践

背景信息 云盒的硬件设计中,各类硬件设备的保障如下:网络设备:采用双机冗余双上连设计,确保云盒内网络的高连续性,且不存在单点故障。存储设备:可以 确保在两台存储服务器同时宕机的情况下,数据的安全可靠。计算设备:支持宕机迁移和...

产品高可用

CLB系统的高可用 负载均衡实例采用集群部署,可实现会话同步,以消除服务器单点故障,提升冗余,保证服务的稳定性。其中四层负载均衡通过LVS(Linux Virtual Server)+keepalived的方式实现,七层负载均衡通过Tengine(淘宝网发起的Web...

ECS灾备解决方案

这个过程确保业务访问的持续性,且最大化减少了单点故障或热迁移过程中可能出现的故障对业务的影响。如果热迁移失败,系统事件会记录并通知故障信息。您可以通过系统事件获知故障信息并部署新的ECS节点来替换受影响的节点,以此维持服务的...

应用场景

Node.js 提供的精确到虚拟机级别的深度监控,能够如实的反应应用运行状态,通过配置报警规则,用户可以在发现系统出现故障(内存泄露或者 CPU 热点等)趋势时,通过诊断接口迅速定位故障点。Node.js 性能平台特别适合业务发展迅速、应用...

计算资源

除以上五外,常见计算资源风险还有“资源相互影响”、“资源节点崩溃”、“依赖服务异常”、“服务进程无响应”、“数据格式异常”、“证书过期”等。可以使用资源隔离、配额控制、多副本冗余、服务降级、服务熔断、心跳上报、主动探活...

同城多活常见问题

本文介绍同城多活的常见问题以及解决方案。假设数据库主备,ECS双可用区部署,是否就是同城多活?和EDAS、MSE集群流量同可用区优先的差异和优势?消息是基于Shutdown机制实现多活么?数据库是两个机房各一个主备,还是主机房一主一备,备...

网络架构容灾

负载均衡实例采用集群部署,可实现会话同步,以消除服务器单点故障,提升冗余,保证服务的稳定性。其中四层负载均衡通过LVS(Linux Virtual Server)+keepalived的方式实现,七层负载均衡通过Tengine(淘宝网发起的Web服务器项目,在Nginx...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

同城容灾演练产品概述

灾备回:核心系统或组件进行自动灾备回。预期评判:结合业务侧核心指标预期值和实际值的差距,判断演练是否符合预期。常见的名词解释 名词 说明 可用区 可用区(Availability Zone,简称AZ)是指在同一地域内,电力和网络互相独立的...

应用场景

故障复盘:基于最佳实践经验,沉淀了对故障进行深度复盘的结构化要求,形成了线上检查,以产品的方式承载流程落地。故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

功能概览

故障恢复 Failback 当生产站点故障恢复时,将业务从容灾站点回到生产站点的过程。正向保护 Forward 用于保护组和ECS的状态。生产站点数据和业务复制到容灾站点。反向保护 Reverse 用于保护组和ECS的状态。当故障切换后,容灾站点B变为...

K8s应用运维管理最佳实践

在Java类型应用中,如果出现故障Pod实例,可以借助Arthas诊断,排查Pod故障点。相关文档,请参见 Arthas诊断。如果应用无法正常启动,可以将启动命令修改为 sleep,再通过 kubectl exec 手动启动进程,观察输出并分析原因。相关文档,请...

功能概览

故障恢复 Failback 当生产站点故障恢复时,将业务从容灾站点回到生产站点的过程。正向保护 Forward 用于保护组和ECS的状态。生产站点数据和业务复制到容灾站点。反向保护 Reverse 用于保护组和ECS的状态。当故障切换后,容灾站点B变为...

什么是应用实时监控服务ARMS?

产品计费 用户体验监控 专注于对Web场景、App移动应用场景和小程序场景的监控,以用户体验为切入,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)...

测试与验证

功能测试及联调测试依赖企业自己的测试团队及流程工作,不作过多描述,仅在此建议,对应用功能进行分级,优先测试验证核心功能,对不同级别功能测试问题,制定不同紧急程度的问题跟踪。性能测试 性能测试方案 性能测试流程 业务测试...

关键技术竞争力

灰度发布:灵活调拨灰度流量 灰度蓝绿发布:新旧版本按权重分配流量 – 七层负载,流量百分比 通过小规模的生产流量来充分验证新版本,可以及时的回应急,避免问题被放大,保证新产品的平滑上线,提高发布效率。蓝绿发布:新老调用单元...

Demo体验

关注主播 赞直播间 分享直播 屏样式(企业直播)移动设备套件封装了若干场景UI组件,仅作交互展示,需要您对接业务系统。赞直播间 分享直播 功能四:主播端-观众端音视频连麦 申请连麦,若主播同意连麦,则观众二次确认后上麦。连麦...

AUI Kits

关注主播 赞直播间 分享直播 屏样式(企业直播)移动设备套件封装了若干场景UI组件,仅作交互展示,需要您对接业务系统。赞直播间 分享直播 功能四:主播端-观众端音视频连麦 申请连麦,若主播同意连麦,则观众二次确认后上麦。连麦...

应用场景

场景一:面向大中型企业的多地容灾高可用网络架构 当本地数据中心的关键业务对可用性要求极高时,建议在多个接入建立专线连接,该拓扑确保了因光纤切断、设备故障或接入位置故障导致的连接故障的恢复能力。自主申请专线和共享合作伙伴...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

切换接入

说明 如果您选择的接入出现故障,阿里云会自动帮您切换至无故障接入。您选择的接入正常后,如果您想继续使用,需再次进行手动切换。相关文档 ListAccessPoints:查询接入信息。UpdateSmartAGAccessPoint:切换智能接入网关设备的接...

操作日志

MSHA控制台提供查看操作日志功能,出现故障时,您可以通过查看操作日志来排查故障。操作步骤 登录 AHAS控制台。在控制台左侧导航栏中单击 多活容灾。在控制台左侧导航栏选择 监控中心>操作日志。在 操作日志 页面,可以通过设置过滤...

基于MSE云原生网关实现同城多活

说明 两个可用区各一个SLB,可有效避免SLB单点故障,当单可用区SLB发生故障后,可通过DNS流。一个云原生网关,多可用区部署,实现跨可用区、多业务集群的全局流量管理能力,可有效保证多集群的请求负载均衡,可实现单可用区故障后秒级、...

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则流。流后可能有5分钟...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则流。流后可能有5分钟...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 MongoDB 版 数据库自治服务 应用身份服务 (IDaaS) 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用