流水单据型业务场景多活实践

验证爆炸半径是否控制故障单元内:预期:UserID为2000的用户路由到杭州单元,不受北京单元故障的影响。结果:下正常,符合预期。切流恢复 验证故障场景下的容灾恢复能力。在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的...

读多写少型业务场景多活实践

验证爆炸半径是否控制故障单元内:预期:UserID为2000的用户路由到北京单元,不受杭州单元故障的影响。结果:导购页访问正常,符合预期。切流恢复 接下来将验证故障场景下的容灾恢复能力。在杭州单元发生故障的情况下,可以使用MSHA切流...

自动化

从应用程序发布周期、客户服务到故障管理以及其他内部支持流程,一切都需要更快,而所有这些流程都依赖于基础设施。基础设施自动化不仅仅是加速基建,也加速了业务应用的部署过程,加速了整个业务转型的启动,进而提升了企业探索和发现机会...

K8s应用运维管理最佳实践

重要 禁止从负载均衡控制台直接修改SLB实例的监听配置(含监听+证书),可能导致SLB控制台修改的配置回退,引发应用入口相关的故障。请勿配置私网SLB进行集群内部服务的访问。Pod实例之间无法直接访问私网SLB地址,私网SLB只是用来提供VPC...

基本概念

什么是弹性容器实例 负载均衡实例 负载均衡实例是一种对流量进行按需分发的服务,通过将流量分发到不同的后端服务来扩展应用系统的服务吞吐能力,并且可以消除系统中的故障,提升应用系统的可用性。负载均衡SLB产品家族介绍 RDS实例 云...

开通备份恢复

常见问题 Q:故障时最近可以恢复到哪个时间点?A:正常不积压情况下,取决于持久HBase Log到OSS周期,默认是30m或30s刷新一次,最多丢30s数据。Q:多长时间可以恢复?A:取决于数据量和带宽限制。全量数据恢复速度:OSS最大带宽1 GB/s,BDS...

三网合一卡2.0使用入门

步骤四:验证重启是否切网成功 设备手工重启后自动切换网络,查看运营商信息是否更新 步骤五:验证网络故障设备自动重启切网 登录阿里云控制台,对当前使用的运营商卡片进行停机操作,模拟断网场景,在 步骤二 的基础上等触发检测后,设备...

应用强弱依赖治理

创建强弱依赖治理 登录 AHAS控制台,在左侧导航栏选择 故障演练>演练方案。在左侧导航栏选择 演练方案>微服务演练。在 微服务演练 页面,单击左侧 强弱依赖治理。在 强弱依赖治理 页面,单击 创建治理方案,进入 应用接入 配置向导页。参数...

什么是消息演练

消息演练概述 目前市面上有RocketMQ、Kafka、RabbitMQ等流行的消息中间件服务,消息演练功能将这些常见的中间件进行了统一抽离,为消息服务安排分配了精选后的演练最佳实践。您无需分析每种消息服务需要什么演练场景,仅需选择演练方案即可...

查看并管理计划内事件

为确保您收到 云数据库故障或运维通知 的通知,请您需要登录 消息中心,开启通知并设置消息接收人(推荐设置为数据库运维人员),否则您将无法收到相应的通知信息。通知方式为 短信、语音、邮件、站内信或控制台等。说明 如需第一时间获知...

查看并管理计划内事件

为确保您收到 云数据库故障或运维通知 的通知,请您需要登录 消息中心,开启通知并设置消息接收人(推荐设置为数据库运维人员),否则您将无法收到相应的通知信息。通知方式为 短信、语音、邮件、站内信或控制台等。说明 如需第一时间获知...

AIOps 解决方案专家服务内容说明

常见的AIOps应用路径为:对监控的各种关键性能指标(KPI)行实时异常检测;对多维指标进行根源分析,快速下钻到异常维度和元素;基于应用拓扑和实时Trace,实现根因定位;结合CMDB、关联等、构建异常根因上下文,帮助快速修复问题等等。...

退订方式说明

常见的支持自助退订的云产品:产品线 商品名称 弹性计算 云服务器ECS(包月)轻量应用服务器 数据库 ClickHouse(包年包月)Lindorm Tunnel Service通道服务 重要 Lindorm节点预付费仅用于开发测试和学习,请勿用于生产和性能压测。...

常见问题

本文列举了阿里云 表格存储 的常见问题,帮助您快速了解 表格存储。一般性常见问题 什么是 表格存储?表格存储 面向海量结构化数据提供Serverless表存储服务,同时针对物联网场景深度优化提供一站式的IoTstore解决方案。适用于海量账单、IM...

为ECS实例自动绑定有EIP的辅助弹性网卡

本教程介绍如何使用弹性伸缩生命周期挂钩挂起ECS实例,并结合 系统运维管理 OOS(CloudOps Orchestration Service)的模板,实现为ECS实例自动绑定有弹性公网IP(EIP)的辅助弹性网卡。前提条件 使用本教程进行操作前,请确保您已经注册了...

常见问题

一般常见问题 什么是阿里云OSS?阿里云对象存储服务OSS(Object Storage Service),是阿里云提供的海量、安全、低成本、高持久性的云存储服务,并可无限扩展。其数据设计持久性不低于99.9999999999%(12个9),服务可用性(或业务连续性)...

功能概览(本地数据库)

HBR通过简单、安全及可靠的方式将数据库的数据备份上云,确保客户数据库系统或所在服务器出现故障,生产系统数据发生误删、勒索病毒等事故时可以从云上HBR备份库完整恢复数据。重要 本地数据库服务器的网络必须通过专线或者VPN和阿里云专有...

备份MySQL

为避免灾难、硬件故障、数据丢失、损坏和意外删除事故发生,建议您通过 云备份 及时对MySQL数据库进行备份。云备份 支持备份云服务器ECS实例或本地服务器中部署的MySQL数据库,将数据备份至云端。您可以随时根据时间点恢复数据库至源数据库...

备份Oracle

为避免灾难、硬件故障、数据丢失、损坏和意外删除事故发生,建议您通过 云备份 及时对Oracle数据库进行备份。云备份 支持备份云服务器ECS实例或本地服务器中部署的Oracle数据库,将数据备份至云端。您可以随时根据时间点恢复数据库至源数据...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

基于最后一次访问时间的生命周期规则

注意事项 规则数量 通过控制台最多可配置100条生命周期规则,条生命周期规则中可同时包含最后一次修改时间以及最后一次访问时间的策略。如果您需要配置更多数量的生命周期规则,请使用SDK或者命令行工具ossutil。费用说明 Object监控管理...

限流算法选择

可以通过拉长限流周期来应对突发流量。如 1 秒限流 10 个,想要放过瞬间 20 个请求,可以把限流配置改成 3 秒限流 30 个。拉长限流周期会有一定风险,用户可以自主决定承担多少风险。缺点:没有很好的处理单位时间的边界。比如在前一秒的...

按量付费

若启用了节省停机模式:从按量付费实例创建完成开始计费,通过控制台停止实例时暂停计费,通过控制台重新启动实例后重新开始计费,实例释放时结束计费。更多信息,请参见 按量付费实例节省停机模式。秒级计费 重要 单个出账周期(1小时)内...

计量计费项

表格存储对账单周期内实例下所有表的按量读吞吐量之和进行计费。单位为 CU。写吞吐量 预留写吞吐量 按量付费 资源包 实例所有表的预留写吞吐量之和,按小时计费(账单周期内每小时预留写吞吐量的平均值)。单位为 CU。说明 仅高性能实例...

混合云应用双活容灾最佳实践

多活控制台提供MSFE集群界面白屏化的部署、扩缩容、监控等常规运维能力,以及应对故障场景的分钟级切流能力。服务互通和同单元优先调用:业务应用需要按业务产品线分批上云,过程中存在下游应用仅IDC部署的情况。利用MSHA注册中心同步功能...

健康检查最佳实践

检查周期 通常用于控制探测的灵敏度,理论上如果高频率的检查不会对业务有实质影响,则检查周期越短越好。但是,如果Liveness的检查周期太短,可能会让业务容器更容易重启。因此,可以根据计算公式(节点最大可容忍故障时间/3),来确定...

我的试用功能介绍

说明 规格描述与 免费试用频道页 的卡片描述一致,图示如下:查看周期内试用总额、周期内试用余量、超额资费规则 说明 试用总额、试用余额均对应单个试用周期,如图单个试用资源可能有多个试用周期,每个周期内都有试用额度。周期内试用...

故障应急

故障管理体系是围绕故障全生命周期采取的一系列控制流程,包括故障基础数据管理(故障等级定义、应急场景监控覆盖、服务组&值班表管理、故障订阅管理),故障发现(7*24监控值班、智能基线告警),故障应急协同(故障通告及更新、故障应急...

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制常见问题 网站耗资源(客户程序故障常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

EMR Kafka磁盘故障运维

原Broker数据恢复方式 方案描述 当磁盘故障时,如果磁盘IO性能已经明显下降,则需要快速隔离故障磁盘避免因故障影响集群性能。磁盘隔离之后,对应kafka日志目录处于offline状态。此时,如果分区存在ISR副本或者允许分区数据丢失,可以...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

域名控制台授权

本文为您介绍域名控制台授权的功能使用说明,以及开启和关闭域名控制台授权的操作指导。适用场景 当实际注册域名的阿里云账号(如注册代理商的阿里云账号)和域名所有者分属不同人员时,注册代理商可以在域名控制台上开启域名控制台...

无法开启域名控制台功能

如果您无法在控制台上开启域名控制台功能,请参见本文进行排查。问题现象 在阿里云域名控制台上无法找到开启域名控制台功能的入口。可能原因 如果在域名控制台上无法找到开启域名控制台功能的入口,可能是因为您当前登录的账号不是...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

生命周期配置示例

本文档提供多个常见的生命周期配置示例,以便您更好地使用生命周期规则管理您存储空间(Bucket)内的文件(Object)。单个筛选条件 每个生命周期规则都包含至少一个筛选条件,筛选条件可用于确定Bucket中适用生命周期规则的部分或所有...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

AICS实现对积分过程的稳定控制

本文以水箱为研究对象,阐述如何运用AICS的系统模型辨识和DT-MPC功能,将一个出的积分过程控制稳定。背景介绍 积分环节是流程行业生产中常见的动态过程。积分环节过程的特点是,当过程的所有MV为常数时,过程的CV不会到达一个稳态值...

查询用户OSS或专属存储的归档数据

本文介绍查询用户OSS或专属存储的归档数据的操作步骤以及常见问题。前提条件 已完成 数据归档至用户OSS 或 数据归档至专属存储 的用户,包含老用户和新用户。说明 老用户:数据归档查询功能未上线(上线时间:2022年09月14日)前,使用过...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
容器镜像服务 数据库自治服务 轻量应用服务器 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用