开源ChaosBlade与商业化AHAS CHAOS故障演练对比

运维侧 项目 AHAS CHAOS故障演练 ChaosBlade 主子账号权限控制 支持 不支持 基于人员项目权限多维度的演练空间管理 支持 不支持 咨询侧 项目 AHAS CHAOS故障演练 ChaosBlade 阿里云演练专家答疑 支持 不支持 说明 您可以通过购买 故障演练...

API概览

故障演练 API 标题 API概述 CreateFailoverTestJob 创建高速通道故障演练任务 调用CreateFailoverTestJob接口创建高速通道故障演练任务。StartFailoverTestJob 开始高速通道故障演练任务 调用StartFailoverTestJob接口开始高速通道故障演练...

常见问题

Q:购买 PolarDB 后,如果需要分库分表是否还需要购买 PolarDB-X 数据库中间件?A:是的。Q:PolarDB 是否支持表的分区?A:支持。Q:PolarDB 是否已经自动包含了分区机制?A:PolarDB 在存储层做了分区,对用户透明,无感知。Q:不同产品...

ECS系统事件汇总

Canceled:因系统维护实例重新部署已取消 阿里云检测到ECS实例的底层宿主机存在潜在的软硬件故障风险,该风险会导致ECS实例重新部署,且该风险还未直接成为故障,在系统维护计划执行时间前24~48小时发送该系统事件。重要 使用了本地SSD盘...

应用FAQ

如何进行ACK应用故障排查?如何手动升级Helm的版本?如何支持私有镜像?Cloud Controller Manager(CCM)组件升级检查失败 在Kubernetes集群中如何支持私有镜像编排容器 容器镜像服务源码绑定失败问题排查 容器镜像仓库构建服务失败问题...

DDH常见问题

阿里云为您提供DDH故障迁移服务,开启服务后,DDH因故障停机时,会自动迁移至健康的DDH。更多信息,请参见 修改DDH故障迁移配置。购买DDH时怎么选择云盘和公网带宽?创建DDH的时候不需要选择云盘和公网带宽,在DDH上创建ECS实例的时候才...

RDS与自建数据库对比优势

备节点的故障发现时长为秒级,在99%的场景下,备节点从故障发生到节点恢复不超过10分钟。在好的架构下才能实现高可靠性。实现RPO=0的成本极高,需要单独购买研发服务。数据可靠性一般,取决于单块磁盘的损害概率。实现RPO=0的成本极高,...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

实例列表

如何购买实例 使用全局流量管理,首先需要先购买一个全局流量管理实例。您可以参阅 创建实例 来完成操作。实例列表介绍 ID/名称 ID:购买 GTM 服务后,系统会自动生成一个实例ID,实例ID是该应用服务的唯一标识,应用于产品升级、续费、...

查询任务日志

任务时间轴以时间线的维度展示购买、配置、运行、故障、运行完成等关键节点的任务状态信息;运行日志可根据时间范围或任务的状态信息进行筛选,以便快速定位所需的日志信息。操作步骤 登录 数据传输新版控制台。根据实例类型,在左侧导航栏...

MSE注册配置中心和自建注册配置中心对比

MSE Nacos和自建Nacos对比 对比项 MSE Nacos专业版 自建Nacos 系统搭建及运维成本 资源全托管免运维,内置SLB,自动绑定域名,故障节点自动摘除。需自行购买各种资源搭建系统,运维升级需投入精力,人工成本高。易用性 系统参数已调优,...

ZooKeeper的使用场景和MSE ZooKeeper的优势

需自行购买各种资源搭建系统,运维升级需投入精力,人工成本高。易用性 提供可视化的配置数据查询和更新功能。系统参数已调优,支持页面修改全局参数,自动重启生效。不支持可视化,需通过黑屏命令行手动操作。针对每个节点手动修改配置...

本地盘最佳实践

如果本地盘发生故障、物理服务器发生宕机,或者人为误操作,本地盘会丢失数据。请勿在本地盘上存储需要长期保存的业务数据。但云盘采用分布式三副本机制,能防止意外硬件故障导致的数据不可用。如果应用没有多节点数据冗余架构,强烈建议您...

响应云盒维修事件

背景信息 配置云盒计算资源时,您需要配置一定的冗余资源或购买SLA服务包,以便在硬件故障时,可以迁移业务。关于如何更好地配置计算资源,请参见 云盒计算资源配置最佳实践。流程说明 运行中的ECS实例出现故障风险时,会向您发送ECS故障 ...

【通知】故障演练功能模块退市公告

暂停购买 2023年11月01日起,新用户暂停购买应用高可用服务AHAS下的故障演练模块以及相关套餐的服务。对于2023年11月01日前已经购买该模块及相关套餐的用户,该功能可以正常使用,不会受到影响。暂停续订 2024年05月01日起,暂停已有用户的...

名词解释

CNAME接入域名 购买了全局流量管理,系统生产实例时,会自动为每个实例分配一个域名记录,您可以将需要使用全局流量管理服务的域名通过CNAME的形式接入全局流量管理实例。基于地理位置的访问策略 通过智能解析为不同网络或区域来源的访问...

分片集群架构

您可以通过购买多个Mongos实现负载均衡及故障转移。单个分片集群实例默认支持最多32个Mongos。Shard 副本集架构(主备三节点(主节点、从节点和隐藏节点)+只读节点)负责存储数据库数据。您可以通过购买多个Shard来横向扩展实例的数据存储...

功能更新记录

本文介绍故障演练Chaos历次发布涉及的功能变更,帮助您了解故障演练的发布动态。2021年10月 功能名称 功能概述 支持资源包类型 支持地域 发布时间 微服务强弱依赖支持Dubbo 在应用强弱依赖治理的基础上,微服务强弱依赖治理功能,通过接入...

故障演练常见问题

欢迎您反馈在使用故障演练过程中遇到的问题,目前提供以下常见问题供您参考。单个演练活动成功状态怎么判断?因为一个活动可能会有很多目标机器,当所有机器执行完毕之后,如果有机器没有执行成功,那么这个演练活动就会被系统判断为失败。...

快捷入口

全局流量管理 产品简介:公网健康检查与故障切换,提供全局容灾能力。购买入口:立即前往 控制台入口:立即前往 帮助中心入口:什么是全局流量管理?云解析PrivateZone 产品简介:基于阿里云VPC环境下的私有域名解析服务。开通入口:立即...

归档存储服务等级协议

服务赔偿条款 2.13.1 赔偿范围:因阿里云设备故障、设计缺陷或操作不当导致用户所购买的归档存储服务无法正常使用,阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起...

混合云容灾服务的审计事件

Create 实例或者资源包等的购买操作。CreateSitePair 创建站点对。DeleteSitePair 删除站点对。DeployGateway 部署一个按量付费的网关。DescribeAvailableInstanceTypes 查询可用规格。DescribeGateway 查询指定网关的基本信息。...

云盒计算资源配置最佳实践

购买 SLA增值服务包,为计算资源通过SLA保证。SLA增值服务包 会根据您当前的资源配置情况,自动选择合适的冗余资源。这些冗余资源对用户来说是不可见资源,可以在硬件故障期间立即启动,确保有可用的资源,以应对硬件故障风险,提升业务...

产品价格

实例主机单节点价格:说明 对于生产系统,需配置多节点,并设置数据多副本,且节点数量需大于等于数据副本数量,这样主机节点和数据副本才有冗余,当发生主机节点或存储故障时,才具备故障切换能力。产品实际价格,请以产品购买页为准。...

集群系列

MySQL集群系列 RDS MySQL集群系列实例采用计算与存储分离、一主多备的架构,支持自动故障切换、任意备节点可切换为主节点、备节点可读、按需增删节点、变更节点配置、多可用区容灾、节点粒度的监控、集群节点拓扑管理等功能,同时还可启用...

PostgreSQL只读实例简介

云盘实例的只读实例为单节点架构,没有备节点,因此无法保障可用性,建议您购买多个只读实例,使用libpq或JDBC实现自动故障转移,详情请参见 自动故障转移和读写分离。您也可以通过数据库代理实现读写自动分离,更多信息,请参见 什么是...

运维事件中心的审计事件

Create 登录产品售卖页面进行的购买操作。CreateEscalationPlan 创建升级计划。CreateIncident 手动新增事件。CreateIncidentSubtotal 事件新增小计。CreateIntegrationConfig 创建集成配置。CreateProblem 故障升级。...

FAQs

GSLB 子域名开启 不支持,需要结合网站监控 需要另行购买监控服务 必须在域名账号下使用 受子域名的TTL限制 不支持,需要结合云解析的线路配置 随机选择正常链路,不可控 全局流量管理(GTM)的CNAME接入域名是否能直接通过URL访问?...

什么是PolarDB PostgreSQL标准版

本文介绍了PolarDB PostgreSQL标准版的背景、特点、与企业版区别以及如何购买等内容。什么是 PolarDB PostgreSQL标准版 自 PolarDB 正式上线以来,它已成功支撑成千上万的客户应用,并在真实的商业环境中展现了卓越的表现。PolarDB 凭借其...

CreateSmartAccessGateway-智能接入网关实例

testdesc Period integer 是 智能接入网关实例的购买时长,单位:月。取值:1~9、12、24、36。12 AutoPay boolean 是 是否自动支付预付费实例的账单。取值:true:是。false(默认值):否。如果您选择不自动支付账单,在您调用本接口后,...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

运维服务内容说明

2.服务范围 运维产品范围:阿里公共云云产品(详见 附录一:运维服务产品清单)阿里云运维服务范围 包含:阿里云 产品使用咨询、问题处理、故障救援、配置指导、最佳实践等。阿里云 产品相关的操作或系统问题的技术指导。阿里云 管理控制台...

多链路聚合立方解决方案简介

自动驾驶:自动驾驶属于户外移动场景,需要解决单运营商的基站覆盖空洞,网络故障或资源拥挤而饱和,带宽不足以及高速移动基站快速切换的网络使用问题,保证设备的实时在线与低延时。产品优势 稳定在线 云网端三级稳定性提升,多链路网络...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

产品专家服务说明

云安全中心产品专家服务是由丰富经验的阿里云安全专家通过钉钉群提供服务,面向购买阿里云云安全中心产品专家服务的客户,提供云安全中心产品的配置建议、漏洞修复建议、入侵告警处置建议、等保配置检查功能使用建议等贴身的技术咨询服务,...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...
共有98条 < 1 2 3 4 ... 98 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
应用高可用服务 数据库自治服务 负载均衡 云数据库 OceanBase 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用