功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

故障演练

常见故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制台常见问题 网站耗资源(客户程序故障常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

导航

my.getTitleColor 该接口用于获取导航栏背景色。版本要求:基础库 1.13.0 或更高版本,若版本较低,建议做 兼容处理。代码示例/API-DEMO page/API/get-title-color/get-title-color.json {"defaultTitle":"获取导航栏背景颜色"}!API-DEMO ...

耗资源用户处理流程

为了保证您的站点能够安全、...关于网站耗资源的原因以及排查方法,更多信息,请参见 网站耗资源(客户程序故障常见问题。增强版共享虚拟主机和独享虚拟主机可以更好地应对耗资源问题,避免站点被关停。更多信息,请参见 云虚拟主机官网。

常见问题

网站耗资源(客户程序故障常见问题 通过Robots协议屏蔽搜索引擎抓取网站内容 流量统计常见问题 云虚拟主机可以升级到云服务器ECS吗?如何取消云虚拟主机的自动续费功能?产品计费问题 计费常见问题 安装网站程序问题 安装完WordPress程序...

故障演练

高速通道故障演练功能是一种模拟故障场景的工具。例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过...

诊断决策树

对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策树 登录高可用管理控制台。在左侧导航栏上,单击 故障诊断>诊断决策树。单击 新建,在 创建诊断决策树 页面,配置诊断决策树信息,包括决策树...

管理探针

在左侧导航栏选择 故障演练>概览。在 概览 页面的 欢迎体验故障演练 区域单击 安装演练探针。请选择您要安装的探针环境,根据不同的环境,选择不同的安装方式。阿里云ECS:如果您需要安装的探针环境为阿里云ECS,请单击 阿里云ECS,具体...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

使用可视化演练

登录 AHAS控制台,在左侧导航栏选择 故障演练>概览。在故障演练页面的左侧导航栏选择 可视化演练。界面展示可视化演练的全局架构视图。左侧显示所有应用列表。列出了应用的机器数量和演练数量,并支持按名称搜索。您可通过应用名称来搜索...

接入演练应用

登录 AHAS控制台,在左侧导航栏选择 故障演练>概览。在左侧导航栏单击 探针管理,然后单击右上角的 接入探针。在 选择环境 页面单击 阿里云ECS。在 安装应用高可用插件 页面安装探针,在目标主机右侧 操作 列 单击安装。填写应用、应用分组...

管理演练空间

在左侧导航栏选择 故障演练>数据管理,然后在左侧导航栏选择 数据管理>空间管理。您可以在 空间管理 页面进行以下操作:①:演练执行分布 区域,可以查看近30天内此账号演练执行的总数、成功数以及不符合预期数。②:累计演练数据统计 区域...

报警演练

在控制台左侧导航栏选择 故障演练>演练方案。在左侧导航栏选择 演练方案>容器演练。在 容器报警演练 页面,从 集群名称 下拉列表中选择演练的集群。在 容器报警演练 页面,选择待验证的报警事件(可多选),然后单击 批量触发警报。报警...

停止演练

在左侧导航栏选择 故障演练>我的空间,然后在演练列表中单击目标演练任务右侧 操作 列的 停止,在 停止演练 的对话框中单击 确定。在演练详情页右上角单击 终止,然后在 停止演练 的对话框中单击 确定。在演练详情页 执行情况 区域执行节点...

主机视图

查看拓扑图 登录 AHAS控制台,从左侧导航栏选择 故障演练>架构感知。在 基础视图 区域,单击 主机视图 的 查看视图,进入详情页。默认的拓扑图将显示当前环境中所有的主机信息。在 主机视图 详情页页面右上角选择需要进入的环境和页面模式...

执行演练

在左侧导航栏中选择 故障演练>我的空间。在演练列表中单击目标演练任务右侧 操作 栏的 演练,然后在弹出的对话框中单击 确认。在 演练名称 列单击目标演练名称,在该演练详情页可以看出故障开始注入之后,目标机器的CPU指标开始增加,说明...

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

风险视图

查看风险 登录 AHAS控制台,从左侧导航栏选择 故障演练>架构感知。在 场景视图 区域,单击 风险视图 的 查看视图,进入详情页。默认进入的是 缩略图 视图模式。将鼠标悬浮在图标上,可查看该产品需重点关注的TOP5风险和风险总数。在页面右...

故障排查

本文介绍微服务引擎MSE在使用过程中常见问题的故障分析和排查流程。微服务注册配置中心问题排查 在浏览器中输入 XXX:8848/nacos,访问MSE的Nacos注册中心时返回404错误。具体操作,请参见 通过“XXX:8848/nacos”访问MSE的Nacos注册中心时...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

微服务强弱依赖治理

在应用强弱依赖治理的基础上,微服务强弱依赖治理功能,通过接入MSE,可分析出应用所依赖的Dubbo、Spring Cloud服务,并能够快速的发起方法级别的故障注入,帮助您快速分析出应用与所依赖的各种方法之间的强弱依赖关系。本文介绍如何进行微...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

接入ARMS监控

操作步骤 登录 AHAS控制台,在左侧导航栏选择 故障演练>我的空间。单击 新建演练,选择 新建空白演练,进入 演练配置 页面。单击 新建空白演练 后,在 演练配置 页面,填写 演练名称、演练描述、演练标签 和 演练空间。配置项 配置说明 ...

应用强弱依赖治理

创建强弱依赖治理 登录 AHAS控制台,在左侧导航栏选择 故障演练>演练方案。在左侧导航栏选择 演练方案>微服务演练。在 微服务演练 页面,单击左侧 强弱依赖治理。在 强弱依赖治理 页面,单击 创建治理方案,进入 应用接入 配置向导页。参数...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

流水单据型业务场景多活实践

在 AHAS控制台 的左侧导航栏选择 故障演练>我的空间。在 我的空间 单击演练准备中创建的演练,然后单击 演练。在 开始执行演练 对话框中单击 确认。若故障注入成功,UserID为7000的用户路由到的北京单元会受到影响,下单页访问异常,符合...

同城多活架构实践

在 AHAS控制台 的左侧导航栏选择 故障演练>我的空间。在 我的空间 单击演练准备中创建的演练,然后单击 演练。在 开始执行演练 对话框中,单击 确认。若故障注入成功,打开电商首页,有概率出现访问异常,符合预期。切流恢复 接下来将验证...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数知地球 AI Earth 数据库自治服务 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用