系统运维工具集SysAK使用说明

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。运维场景 阿里云通过对百万服务器运维经验...

实例启动异常常见错误与对应解决方案

针对实例启动过程中因操作系统内配置异常、异常关机等问题导致操作系统无法正常启动的情况,您可以通过VNC登录实例发现的启动异常或者实例健康诊断工具返回的异常字段,在本文查看此类问题的解决方案。Windows 1662001135:Windows系统因...

常见问题

更多产品定价常见问题 挂载访问FAQ Linux挂载NFS文件系统常见问题 Windows挂载SMB文件系统常见问题 Linux挂载SMB文件系统常见问题 Windows挂载NFS文件系统常见问题 为什么卸载旧NAS并重新挂载新NAS后,容器Pod仍将数据写入旧NAS?...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

网关一体机告警介绍

本文介绍网关一体机中磁盘故障电源故障等硬件告警,以及CPU使用率、内存使用率等软件告警信息。监控项 报警阈值 报警通道 恢复是否通知 疲劳度 是否实时 CPU使用率 一分钟内平均使用率超过95%客户邮箱 是 每日最多5封 是 内存使用率 一...

单实例快速恢复

为了能够快速恢复系统故障,Hologres提供了单实例快速恢复的机制。本文为您介绍单实例快速恢复的触发条件和行为。实例快速恢复逻辑说明 Hologres在 V2.0版本之前,Hologres计算节点均为容器调度(即下图中的Worker Node),资源管理器...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障

ECS整机恢复

当ECS整机发生系统故障或者错误操作时,您可以通过备份点的克隆和恢复功能,实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。重要 当源ECS存在时,支持直接...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

错误处理

自定义代码错误 除了函数计算和 Serverless 工作流 系统常见的错误类型外,您也可以自定义错误类型,在函数代码中主动抛出异常,方便将函数执行的状态或错误传递给 Serverless 工作流,然后 Serverless 工作流 再根据流程对任务进行重试或...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行恢复原盘或者创建新盘操作实现数据恢复。本文介绍云盘恢复的相关操作。前提条件 已创建云盘备份。更多信息,请参见 创建云...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

捷顺

DAS服务自动SQL限流和自动SQL调优,帮助DBA从救火员转向数据库架构师,有更多时间和精力帮助研发优化系统架构,审核数据库的变更和各种操作,进一步降低系统故障的概率。DAS服务自动对数据库实例进行治理,帮助捷顺科技把数据库的运维成本...

Nginx网站常见问题排查

systemctl restart nginx#CentOS/Alinux系统 常见错误排查。Nginx 502可以参考:网站报“Nginx 502 bad gateway”错误的解决方法 及 使用Nginx进行访问网页出现“502”和“connect upstream time out”报错。Nginx网站访问卡慢排查 检查...

备份和恢复数据

当出现系统故障或错误操作时,如果在此之前已经创建了快照,您可以使用该快照恢复数据。本文以Windows客户端为例,为您介绍如何利用系统快照和自定义快照备份和恢复数据。背景信息 自定义快照:您可以根据业务需要在某一时间点创建快照,...

挂载文件系统失败故障排查

Linux挂载NFS协议文件系统失败自动检查脚本 Windows挂载SMB协议文件系统失败自动检查脚本 交叉挂载失败排查思路 Linux挂载SMB协议文件系统失败排查思路 Windows系统挂载NFS协议的通用型NAS文件系统失败排查思路 常见挂载报错FAQ 如何解决子...

功能概览

跨地域容灾 容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免...

畅捷通

畅捷通通过日志服务的异常预测函数,从海量指标中快速定位异常,将有问题的地方显示出来,快速发现系统故障。畅捷通通过日志服务将各块汇集过来的数据进行标记后,与应用的配置信息进行关联和整合,通过时序发现故障的根因,从而可以实现...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

ReportInstancesStatus-反馈一台或者多台ECS实例异常...

取值范围:hardware-cpu-error:CPU 故障 hardware-motherboard-error:主板故障 hardware-mem-error:内存故障 hardware-power-error:电源故障 hardware-disk-error:磁盘故障 hardware-networkcard-error:网卡故障 hardware-raidcard-...

客户案例

唐家才 网商银行 CTO“网商银行选择 OceanBase 三地五中心部署架构,不仅在数据上从具备抵御同城机房故障提升到具备异地城市容灾的能力,同时内置的多租户隔离的能力,满足全行多应用系统的管理与使用需求,让应用系统多活架构设计上变的...

HaaS 510开板式DTU

在精简连接设计时,可以从该口提供系统电源,或通过该口向外部传感器供电。在JS脚本中通过 port2 进行使用。② 调试串口 使用轻应用开发时的调试信息输出串口。默认波特率115200。③ 4G天线IPX插座 外接IPX接口天线或馈线。配送天线为5dB...

存储资源

磁盘性能下降,读写速度变慢,任务执行时间增加,系统的实时性降低,当磁盘IO负载过大无法承受时,可能导致磁盘故障系统崩溃或数据丢失。常见的容错策略如下:数据缓存:将数据暂时存储在内存中,减少对磁盘IO的频繁访问。可以利用内存...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

存储空间地域属性

✓×转换存储冗余类型 OSS支持将存储空间(Bucket)的存储冗余类型从本地冗余存储转换为同城冗余存储,从而具备抵抗可用区级别故障的能力。✓×OSS高防 OSS高防是OSS结合DDoS高防推出的DDoS攻击代理防护服务。当受保护的Bucket遭受大流量...

部署数据库

Oracle是一个多用户系统,能够自动从批处理或在线环境的系统故障中恢复运行。系统提供了一个完整的软件开发工具Developer2000,包括交互式应用程序生成器、报表打印软件、字处理软件以及集中式数据字典,用户可以利用这些工具生成自己的...

网络资源

网络资源是流量入口和数据交互的基础设施,常见的网络资源风险点如下:网络带宽不足 指网络连接的带宽无法满足系统或应用程序的需求,导致网络传输速度慢,影响系统的响应和性能。针对网络资源带宽不足的情况:带宽监控预警:实时监控网络...

服务发布策略

蓝绿部署 蓝绿部署需要对服务的新版本进行冗余部署,一般新版本的实例规格和数量与旧版本保持一致,相当于该服务有两套完全相同的部署环境,只不过此时只有旧版本在对外提供服务,新版本作为热备。当服务进行版本升级时,只需将流量全部...

设备无法上电

问题现象 设备的系统指示灯(SYS或RUN)和电源指示灯都不亮。可能原因 未打开设备电源开关。设备电源线缆没有插牢。设备的外接电源故障。设备的电源适配器有故障。解决方案 确认设备电源开关是否打开。确认设备电源线缆是否插牢。确认...

企业单AZ架构升级到多AZ

多可用区部署的常见应用:关键业务系统:对于需要高可用性和连续性的关键业务系统,如金融服务、医疗保健和电子商务平台,多AZ部署可以确保系统即使在一个数据中心发生故障的情况下也能继续运行。容灾要求高的场景:当组织需要符合特定的...

最佳实践

存储服务数据容灾最佳实践 冗余存储 阿里云对象存储OSS提供本地冗余存储和同城冗余存储两种存储冗余类型,覆盖从单可用区到多可用区的数据冗余机制,以保证数据的持久性和可用性。其中本地冗余存储采用单可用区(AZ)内的数据冗余存储机制...

配置健康检查

如果健康检查探测到物理专线链路故障系统默认会将当前物理专线的流量切换至其他任意一个正常的物理专线进行传输。在您配置健康检查时,您也可以通过健康检查的 切换路由 功能自定义是否允许路由切换。前提条件 您已经将物理专线关联的VBR...

产品架构

TSCompute 是负责时序数据实时计算的组件,重点解决监控领域常见的降采样转换和时间线聚合需求,通过Lindorm Stream进行数据订阅,并完全基于内存计算,所以,整体非常的轻量、高效,适合系统已预置的计算功能。针对部分灵活复杂的分析需求...

本地IDC通过负载冗余专线连接上云

您可以使用两条物理专线通过负载冗余方式将本地数据中心IDC接入阿里云,从而提高网络的可靠性,并确保物理专线连接的高可用性。正常情况下,两条物理专线会同时转发流量。当阿里云检测到其中一条物理专线的网络连接不通时,该物理专线上的...

本地IDC通过主备冗余专线连接上云

健康检查探测到物理专线连接故障时,如果云企业网实例中存在冗余的路由,健康检查则会立刻触发路由切换使用可用链路。若您取消选中 是,则表示不开启健康检查的路由切换功能,健康检查仅执行链路探测功能。若健康检查探测到物理专线连接...

创建同城冗余存储Bucket

整个故障切换过程用户无感知、业务不中断、数据不丢失,满足关键业务系统对于恢复时间目标(RTO)以及恢复点目标(RPO)等于0的强需求。注意事项 华东1(杭州)、华东2(上海)、华北2(北京)、华北 3(张家口)、华北6(乌兰察布)、华南...

计算资源

计算资源常指用于执行计算任务的软硬件资源,包括CPU、GPU、内存、操作系统和特定计算任务的软硬件环境等。计算资源的主要作用是执行各种计算任务,包括数据处理、算法运算、业务逻辑执行等。计算资源的性能和容量直接影响到系统的计算能力...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用身份服务 (IDaaS) 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用