设备显示离线

可能原因 设备软件故障设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的运营商网络正常。如果不正常,请处理运营商网络问题。如果正常,请跳转至 步骤2。请检查设备本身是否上电。电源状态...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

归档存储服务等级协议

服务赔偿条款 2.13.1 赔偿范围:因阿里云设备故障、设计缺陷或操作不当导致用户所购买的归档存储服务无法正常使用,阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

配置使用持久内存

重要 持久内存中数据的可靠性取决于物理服务器和持久内存设备的可靠性,因此存在单点故障风险。建议您在应用层做好数据冗余,将需要长期保存的业务数据存储到云盘上,以保证应用数据的可靠性。将持久内存配置为一块本地盘 本文示例中使用的...

实例规格族

实例规格 vCPU 内存(GiB)网络带宽基础/突发(Gbit/s)网络收发包PPS 连接数 多队列 弹性网卡 单网卡私有IPv4地址数 单网卡IPv6地址数 云盘IOPS基础/突发 云盘带宽基础/突发(Gbit/s)ecs.g8a.large 2 8 1.5/最高12.5 90万 最高25万 2 3 6...

诊断项与诊断结果说明

实例所在宿主机告警 实例所在的物理设备出现故障告警。检查该实例所在的底层物理机是否有故障。如果底层物理机存在故障,则可能会影响实例的运行状态或性能。您可以尝试通过重启实例进行恢复。实例性能受限 积分型实例当前处于性能受限模式...

实例FAQ

持久内存作为内存使用时,我想用持久内存型实例来运行我的参数服务器(PS),持久内存设置为内存使用方式,可以直接部署吗?购买持久内存型实例后,我如何将持久内存设置为本地盘使用方式?我的哪些应用需要更高性能的本地盘?持久内存作为...

如何使用Prometheus监控Windows

出于效率因素,内核和这些设备直接访问物理内存,而不是像用户模式进程那样通过虚拟内存方式。这些特殊的内存池不受磁盘分页的影响。如果使用这些非分页池内存的组件出现问题可能会对系统造成致命影响。例如,使用非分页池的驱动程序中的...

如何使用Prometheus监控Windows

出于效率因素,内核和这些设备直接访问物理内存,而不是像用户模式进程那样通过虚拟内存方式。这些特殊的内存池不受磁盘分页的影响。如果使用这些非分页池内存的组件出现问题可能会对系统造成致命影响。例如,使用非分页池的驱动程序中的...

如何将一棵LSM-Tree塞进NVM

简介 持久化内存简介 PM在提供相比DRAM更大容量、更低功耗的同时,还具备字节寻址等诸多特点,旨在大幅度提升设备内存容量以及降低设备静态功耗的同时,提供可持久化字节寻址等特性以简化系统的设计,为数据库存储引擎的设计带来了新的契机...

节点诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。基于专家经验和AI智能诊断两种诊断模式,节点诊断可以深入定位问题根因。节点诊断包括诊断检查项和诊断根因。诊断检查项:包括Node检查、...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

容器L3 Cache及内存带宽隔离

Kubernetes支持将多种类型的应用以容器化的方式部署在同一台宿主机上运行,不同优先级的应用会共享宿主机的三级缓存L3 Cache(Last Level Cache)和内存带宽MBA(Memory Bandwidth Allocation)。ack-koordinator提供了对L3 Cache及内存...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

快速入门

本文介绍如何使用ack-koordinator快速搭建一套在离线混部环境,并将应用切换为混部模式运行...关于在离线混部功能的更多信息,请参见:动态资源超卖 容器CPU QoS 弹性资源限制 CPU Burst性能优化策略 容器内存QoS 容器L3 Cache及内存带宽隔离

故障处理流程

本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下流程排查故障:用户收到告警信息或者发现应用不可用。登录智能接入网关控制台,查看设备状态。访问其他公共网站,...

网络域

CPU与内存 2核CPU,4G内存 带宽 10 Mbit/s。说明 实际带宽使用与运维并发数量有关。当多个会话使用远程桌面进行复杂图形操作等行为时,可能会导致远程会话卡顿。如果有此类情况发生,请及时购买带宽扩展包。HTTP和SOCKS5代理服务器 配置项 ...

流量监控

WAN口带宽 设备WAN口带宽 包含以下内容:流入带宽(bit/s):从外部访问智能接入网关设备经过设备WAN口每秒消耗的带宽。流出带宽(bit/s):智能接入网关访问外部经过设备WAN口每秒消耗的带宽设备WAN口包转发率 包含以下内容:流入数据包...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

监控指标说明

DCGM_FI_PROF_DRAM_ACTIVE Gauge%表示内存带宽利用率(Memory BW Utilization)将数据发送到设备内存或从设备内存接收数据的周期分数。该值表示时间间隔内的平均值,而不是瞬时值。较高的值表示设备内存的利用率较高。该值为1(100%)表示...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

无法远程连接Windows实例的排查方法

无法远程连接Windows实例的原因较多,请您根据实际情况,通过相应的排查方法,排查并解决无法远程连接Windows实例的问题。本文主要介绍无法远程连接Windows实例的处理方法。快速登录Windows实例 如果您遇到紧急情况,需要尽快登录Windows...

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

调度概述

容器内存QoS 容器L3 Cache及内存带宽隔离 通过控制L3 cache和MBA,对不同优先级的任务进行隔离,在保障高优先级任务QoS的前提下,提高资源利用率。容器L3 Cache及内存带宽隔离 容器资源参数动态修改 在不重启Pod的情况下,动态修改Pod的CPU...

ping不通云服务(SAG-100WM)

可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请参见...

无法连接到同一个云连接网内的本地客户端

本文介绍SAG-1000设备无法连接到同一个云连接网内的本地客户端的原因和处理方法。问题现象 SAG-1000设备无法连接到同一个云连接网内的其他本地客户端。可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标PC环境的网络故障。...

ping不通云服务ECS(SAG-1000)

可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请跳转...

应用场景

场景一:面向大中型企业的多地容灾高可用网络架构 当本地数据中心的关键业务对可用性要求极高时,建议在多个接入点建立专线连接,该拓扑确保了因光纤切断、设备故障或接入点位置故障导致的连接故障的恢复能力。自主申请专线和共享合作伙伴...

指标说明

nginx_ingress_controller_success-process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。process_open_fds 通过...

指标说明

nginx_ingress_controller_success-process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。process_open_fds 通过...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

海外门店上云最佳实践

部署流程 步骤一:购买智能接入网关设备带宽 您购买智能接入网关设备后,可在智能接入网关管理控制台为智能接入网关设备购买带宽。购买带宽后,阿里云会创建一个智能接入网关实例方便您管理设备。登录 智能接入网关管理控制台。在顶部菜单...

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享带宽 物联网无线连接服务 NAT网关 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用