ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

故障演练

高速通道故障演练功能是一种模拟故障场景的工具。例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过...

管理探针

在左侧导航栏选择 故障演练>概览。在 概览 页面的 欢迎体验故障演练 区域单击 安装演练探针。请选择您要安装的探针环境,根据不同的环境,选择不同的安装方式。阿里云ECS:如果您需要安装的探针环境为阿里云ECS,请单击 阿里云ECS,具体...

使用可视化演练

登录 AHAS控制台,在左侧导航栏选择 故障演练>概览。在故障演练页面的左侧导航栏选择 可视化演练。界面展示可视化演练的全局架构视图。左侧显示所有应用列表。列出了应用的机器数量和演练数量,并支持按名称搜索。您可通过应用名称来搜索...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

接入演练应用

登录 AHAS控制台,在左侧导航栏选择 故障演练>概览。在左侧导航栏单击 探针管理,然后单击右上角的 接入探针。在 选择环境 页面单击 阿里云ECS。在 安装应用高可用插件 页面安装探针,在目标主机右侧 操作 列 单击安装。填写应用、应用分组...

功能特性

运维人员可以根据常见故障场景的处理过程,选择需要的原子能力进行编排组合,形成可执行的应急预案。当风险事件发生时,风险事件中心会推荐可执行的应急预案,供运维快速选择并自动化执行,从而通过标准化处理流程,实现故障快速恢复。故障...

报警演练

在控制台左侧导航栏选择 故障演练>演练方案。在左侧导航栏选择 演练方案>容器演练。在 容器报警演练 页面,从 集群名称 下拉列表中选择演练的集群。在 容器报警演练 页面,选择待验证的报警事件(可多选),然后单击 批量触发警报。报警...

如何配置流转规则

选择 触发故障 需要配置故障影响服务、故障等级覆盖。配置完成之后点击 提交即可。仅触发报警:确定 报警触发规则:设置触发的持续时长和次数对报警进行收敛降噪;如,某个规则在持续5分钟内触发3次才会触发报警,只要将时长和次数分别设置...

管理演练空间

在左侧导航栏选择 故障演练>数据管理,然后在左侧导航栏选择 数据管理>空间管理。您可以在 空间管理 页面进行以下操作:①:演练执行分布 区域,可以查看近30天内此账号演练执行的总数、成功数以及不符合预期数。②:累计演练数据统计 区域...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

主机视图

查看拓扑图 登录 AHAS控制台,从左侧导航栏选择 故障演练>架构感知。在 基础视图 区域,单击 主机视图 的 查看视图,进入详情页。默认的拓扑图将显示当前环境中所有的主机信息。在 主机视图 详情页页面右上角选择需要进入的环境和页面模式...

停止演练

在左侧导航栏选择 故障演练>我的空间,然后在演练列表中单击目标演练任务右侧 操作 列的 停止,在 停止演练 的对话框中单击 确定。在演练详情页右上角单击 终止,然后在 停止演练 的对话框中单击 确定。在演练详情页 执行情况 区域执行节点...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

异地应用双活切流

场景一:选择 故障>应用故障,会自动选中 切流组件。说明 用户应用出现故障,将故障应用对应的单元(地域)流量切0,由正常单元(地域)承担全部流量。a.选择 故障单元,代表此时,该单元当前出现故障,无法承接流量,MSHA会自动将该单元的...

接入ARMS监控

故障演练时通过接入应用实时监控服务ARMS(Application Real-Time Monitoring Service)可以对演练过程的指标进行监控,包含JVM内存、JVM线程数、JVMGC相关、网络出入口流量、磁盘、CPU等指标。本文介绍如何在故障演练中接入ARMS并监控演练...

同城多活切流

场景一 选择 故障>单元格故障,会自动选中 切流组件。说明 指单元格(机房)出现故障,将故障单元格(机房)流量切0,由正常单元格(机房)承担全部流量。a.选择 故障单元格,代表此时,该单元格当前出现故障,无法承接流量,MSHA会自动将...

风险视图

查看风险 登录 AHAS控制台,从左侧导航栏选择 故障演练>架构感知。在 场景视图 区域,单击 风险视图 的 查看视图,进入详情页。默认进入的是 缩略图 视图模式。将鼠标悬浮在图标上,可查看该产品需重点关注的TOP5风险和风险总数。在页面右...

创建演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 登录 AHAS控制台,在左侧导航栏中选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练。选择 新建空白演练 或 从经验库新建。...

异地双活切流

场景一:选择 故障>单元故障,会自动选中 切流组件。说明 单元(地域)出现大面积故障,将故障单元(地域)的流量切0,主数据库在该单元(地域)的切换到正常单元。a.选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA会自动...

云资源视图

操作步骤 登录 AHAS控制台,在左侧导航栏选择 故障演练>架构感知。在 基础视图 区域,单击 云资源视图 的 查看视图,进入详情页,默认进入缩略图模式。缩略图模式下只支持查看各可用区的各个云产品的个数,具体详情需要选择 默认 或其他...

流水单据型业务场景多活实践

在 AHAS控制台 的左侧导航栏选择 故障演练>我的空间。在 我的空间 单击演练准备中创建的演练,然后单击 演练。在 开始执行演练 对话框中单击 确认。若故障注入成功,UserID为7000的用户路由到的北京单元会受到影响,下单页访问异常,符合...

同城多活架构实践

在 AHAS控制台 的左侧导航栏选择 故障演练>我的空间。在 我的空间 单击演练准备中创建的演练,然后单击 演练。在 开始执行演练 对话框中,单击 确认。若故障注入成功,打开电商首页,有概率出现访问异常,符合预期。切流恢复 接下来将验证...

读多写少型业务场景多活实践

在 AHAS控制台 的左侧导航栏选择 故障演练>我的空间。在 我的空间 单击演练准备中创建的演练,然后单击 演练。在 开始执行演练 对话框中单击 确认。若故障注入成功,UserID为1000的用户路由到的杭州单元会受到影响,导购页访问异常,符合...

强弱依赖治理最佳实践

在左侧导航栏选择 故障演练>演练方案,然后在 微服务演练 页面单击 强弱依赖治理。在 强弱依赖治理 页面,单击 创建治理方案。输入 方案名称,单击 新应用接入,选择 Kubernetes,接入新应用。登录 容器服务管理控制台。在左侧导航栏选择 ...

混合云应用双活容灾最佳实践

越来越多的企业在数字化转型和上云进程中选择混合云的形态(云+自建IDC或云+其他厂商云)来进行容灾建设,一方面不会过度依赖单一云厂商,另一方面还能充分利用已有的线下IDC资源。MSHA云原生多活容灾解决方案,支持混合云多活容灾产品能力...

混沌工程缓存实战系列-Redis

登录 AHAS控制台,在左侧栏选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练>新建空白演练。在 演练配置 页面,填写相关参数,选择 演练内容 为 主机内网络延迟。更多参数信息,请参见 创建演练。单击 主机内网络延迟,在 本地...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

通过一致性复制组实现容灾恢复

当您创建并启动一致性复制组后,如果生产站点中的云盘发生严重故障,您可以通过一致性复制组批量对生产站点的云盘数据进行容灾恢复。本文主要介绍如何通过一致性复制组进行容灾恢复。背景信息 一致性复制组支持故障切换和反向复制功能,当...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

基于ack-lingjun-aiast组件实现集群自动化运维

组件介绍 安装灵骏AI助手开启PAI的作业监控和恢复功能后,当发生故障或异常时,灵骏AI助手的告警系统可以自动和PAI进行交互,并上报故障信息,并根据故障触发阶段和并行策略选择规避故障的方法,自动隔离故障节点,并通过checkpoint快速...

AI助手使用说明

当发生故障或异常时,通过AI助手底层的告警系统可以自动和PAI进行交互,上报故障信息,并根据故障触发阶段和并行策略选择规避故障方法,对故障机自动进行隔离,并从Checkpoint快速恢复任务。AI助手提供的具体功能如下:异常采集和上报:...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

数据脱敏

常见的可逆脱敏算法和方式如下:替换脱敏:部分可逆算法,适用于证件号等构成规则固定的字段脱敏。使用替换码表进行映射替换(可逆Tokenization),或使用随机区间进行随机替换(不可逆),实现字段整体或者部分内容的脱敏。加密脱敏:可逆...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

耗资源用户处理流程

为了保证您的站点能够安全、...关于网站耗资源的原因以及排查方法,更多信息,请参见 网站耗资源(客户程序故障常见问题。增强版共享虚拟主机和独享虚拟主机可以更好地应对耗资源问题,避免站点被关停。更多信息,请参见 云虚拟主机官网。

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

常见问题

网站耗资源(客户程序故障常见问题 通过Robots协议屏蔽搜索引擎抓取网站内容 流量统计常见问题 云虚拟主机可以升级到云服务器ECS吗?如何取消云虚拟主机的自动续费功能?产品计费问题 计费常见问题 安装网站程序问题 安装完WordPress程序...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
应用身份服务 (IDaaS) 数据库自治服务 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用