解析设置类常见问题总结

服务器故障时,如何通过智能DNS实现将用户请求流量切换到正常的服务器上?答:智能解析不支持摘除故障IP和自动切换的功能。如果您需要实现此效果,建议您参阅 什么是全局流量管理?产品操作手册。如何通过API来添加解析记录?答:云解析...

如何解决MSE Nacos实例域名无法解析的问题?

请 提工单 联系网络技术支持协助排查DNS服务器或NameServer故障原因。如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则...

实例健康诊断

实例健康诊断功能可以对 轻量应用服务器 实例的计算服务状态、网络服务、存储服务和配置管理等进行全方位的诊断,帮助您了解实例的健康状态,及时发现并解决常见的问题。前提条件 轻量应用服务器...轻量应用服务器故障问题,请参见 故障排除。

故障隔离

最大隔 离数量 设置服务器的隔离数量,即多台服务器故障时最多隔离几台。取值≥0。流量精确匹配(可选)符合流量精确匹配的流量才进行隔离。可配置多条匹配规则,各匹配规则之间是与的关系。参数配置如下:字段:选择 系统字段。字段名:...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障原因 故障原因 ...

云盒故障服务器维修流程

本文介绍当云盒内的服务器出现故障时,阿里云如何进行更换和维修,保证数据安全。背景信息 当云盒内的服务器出现故障,需要更换和维修时,出于客户成本考虑,云盒内没有部署数据擦除服务,阿里云不在客户现场进行数据擦除。重要 在您购买...

更新故障复盘改进详情

更新故障复盘改进详情。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 ...

网络资源

DNS服务异常可能由多种原因引起,如DNS服务器故障、网络连接问题、配置错误等。DNS服务异常可能会造成域名解析失败,导致无法外部服务调用等,或导致服务不可用。常使用的容错策略如下:DNS缓存:在客户端或本地网络环境中设置DNS缓存,将...

部署高可用及共享存储Web服务

sudo chmod+x/etc/systemd/system/sync_nas.sh sudo chmod+x/etc/systemd/system/sync_check_switch.sh 配置上述脚本的开机自动启动,确保服务器故障恢复后,NAS可用性检测及容灾切换服务可以正常执行。创建 sync-check-switch.service ...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,数据库、MQ等中间件异常事件),以及集成各业务自建的定位工具能力,并在故障及风险预警的应急过程中进行可疑原因定位,帮助促进故障及风险预警初因定位的时长缩短。...

什么是故障

定义 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。“用户体验下降”说明故障的核心要关注用户感受,可通过客服渠道获知用户投诉,也可...

CentOS系统时区错误的排查思路

概述 本文主要介绍CentOS系统时区错误的排查思路。详细信息 CentOS系统时区错误,显示为UTC时区,以下为...将正常服务器/usr/share/zoneinfo/Asia/Shanghai 文件拷贝到故障服务器后,执行 date 命令,确认时区恢复正常。适用于 云服务器ECS

新功能发布记录

2023-06-30 响应云盒维修事件 新增地域 新增以下两个地域:华东2(上海)华北1(青岛)2023-06-21 关联地域 2023年5月 功能名称 功能概述 发布时间 相关文档 故障服务器维修方案 云盒内的服务器出现故障时,阿里云将按照流程拆除和更换故障...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

Linux系统的ECS中没有禁ping却ping不通的解决方法

问题原因 服务器系统内部防火墙策略对客户端进行了设置。解决方案 开始排查 登录服务器,执行以下命令,进行抓包准备。tcpdump-i eth0 host[$Eth0_IP]|grep ICMP 说明[$Eth0_IP]为eth0网卡的IP地址。登录客户端,执行以下命令,测试客户端...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

配置远程鉴权

如果您有自己的鉴权服务器,可以通过配置远程鉴权,将用户请求转发至您指定的鉴权服务器,由鉴权服务器对用户请求进行校验。功能介绍 远程鉴权和URL鉴权的作用一样,都用于保护资源,让资源只被授权成功的用户访问,非授权用户将无法访问。...

轻量应用服务器网速较慢与预期带宽不符

问题原因 服务器的地域为中国香港。中国内地访问中国香港以及海外地域部分轻量应用服务器,出现网络无法连通的情况(海外客户端访问正常)。根据路由跟踪分析,异常节点处于跨境互联出口处,阿里云已向运营商报障,目前运营商尚未反馈恢复...

响应云盒维修事件

具体维修流程,请参见 云盒故障服务器维修流程。操作步骤 当您收到云盒维修事件通知时,可以在控制台授权阿里云上门更换硬件设备。打开 云盒列表页。单击目标云盒ID。在云盒详情页,单击 监控 页签。在页面下方,单击 云盒维修 页签。找到...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

ECS实例的状态显示为已停止

问题原因 服务器负载过高或者启动实例之后,没有在ECS管理控制台中刷新实例列表页面所导致。解决方案 说明 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、RDS)...

系统路由表问题导致Windows系统网络不通

问题原因 服务器内部能ping通服务器网关,说明服务器本身安全策略等关系不大,ping不通不和服务器同网段的地址,说明还是服务器路由方面的问题。解决方案 说明 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

云盒计算资源配置最佳实践

本文介绍如何配置云盒计算资源,在满足业务需求的同时,有效降低成本,并提升硬件风险应对能力。背景信息 云盒的硬件设计中,各类硬件设备的保障...关于如何授权维修以及维修相关流程,请参见 响应云盒维修事件 和 云盒故障服务器维修流程。

远程连接Windows实例失败

问题原因 服务器的3389端口监听在IPv6地址上,导致Telnet端口不通。解决方案 说明 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、RDS)等进行配置与数据修改,...

云服务与IP地址FAQ

产品验证错误提示:产品已经提交过网站备案 可能原因 服务器可备案的主体已达到上限,系统提示 产品已经提交过网站备案,备案主体数已经达到了规定的主体上限,请更换其他产品。处理方法 建议您更换其他符合备案要求的阿里云服务器进行产品...

监控、诊断和故障排除

所以当出现E2E延时突然升高的情况下,如果服务器延时并没有很大的变化,那么可以判定是网络的不稳定因素造成的性能问题,排除OSS系统内部故障。最大延时,包括E2E最大延时和服务器最大延时 成功请求操作分类 流量 流量指标从用户或者具体的...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

部署高可用架构应用集群

当应用服务器B创建完成后,如果您直接访问服务器B的公网IP,将会出现如下图所示的报错信息:造成该问题的原因是因为在宝塔面板中,网站对应的域名设置仍然为应用服务器A的公网IP,因此,您需要登录宝塔面板将应用服务器B的公网IP添加至域名...

自建VPN无法连通

问题描述 在线下服务器与ECS实例(网关)之间建立了SSL VPN隧道。其他ECS实例无法通过该网关连接线下服务器,但在网关的安全组里添加入方向来源为0.0.0.0/0且包含所有协议端口的规则后,其他ECS实例可以连通线下服务器。问题原因 安全组未...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

轻量应用负载均衡概述

当其中一部分轻量应用服务器发生故障后,负载均衡会自动屏蔽故障的轻量应用服务器,将请求分发给正常运行的轻量应用服务器,保证应用程序仍能正常工作。弹性管理应用程序的服务能力。您可以根据业务发展的需要,自行添加或移除轻量应用负载...

什么是MX解析?

当您的域名解析记录中存在多条MX记录的时候,邮件发送方的服务器会优先把邮件投递到MX优先级最高的服务器,当此服务器出现故障无法接收邮件的时候,发送方的服务器会自动选择下一个优先级最高的服务器,直到邮件投递成功,或者所有服务器都...

健康检查

为确保ALB后端服务器的业务可用性,您可以通过为ALB服务器组配置健康检查来检查服务器组的运行状况,以避免后端服务器异常对业务的影响,并提升业务可靠性。本文为您介绍如何创建、编辑和删除健康检查等操作。背景信息 ALB 支持基于每个...

配置负载均衡实例

创建负载均衡实例后,您需要对负载均衡实例进行配置才能进行流量转发,您需要添加至少一个监听和一组后端服务器。本指南指引您配置一个TCP监听并添加部署了静态网页...这表明在单台后端服务器出现故障时,负载均衡仍然能够保证业务的可用性。

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启后,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...

移动推送到达率能达到多少

但是,实际的推送到达率,会受到很多因素影响的,例如:第三方推送服务器故障,导致 mPaaS 向其推送信息的失败。第三方推送服务器与设备端的问题,导致信息未能成功送达。推送服务器与互联网间的通讯问题,导致信息未能成功送达。用户...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

服务器迁移至轻量应用服务器

服务器迁移中心支持将其他厂商轻量服务器(腾讯云轻量应用服务器、AWS Lightsail Instance和华为云云耀云服务器)、IDC服务器、虚拟机和其他云平台的云主机迁移至阿里云轻量应用服务器。本文介绍如何将其他厂商轻量服务器迁移至轻量应用...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 云服务器 ECS Web应用防火墙 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用