下线原因 云数据库Redis版单副本实例只有一个数据库节点(即只有master),节点出现故障时,系统会重新启用一个新的Redis节点,并自动将服务切换到没有数据的新节点。切换完成后,应用程序需要将数据重新预热。为避免不知情用户在需要数据...
系统内核问题:当系统内核存在漏洞或者其他问题时,可能会出现hung task故障。系统资源紧张:ECS实例中应用或进程占用系统资源使用率(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考...
在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...
6)重置以及更换系统务必要了解的事项 重置以及更换系统会导致被操作磁盘数据跟快照丢失并不可找回,如有重要数据一定要提前备份,谨慎操作。7)Linux系统下不能开启NetWorkManager服务 linux系统请不要开启NetWorkManager服务,该服务会跟...
本文介绍ECS实例操作系统内部(GuestOS)的常见问题,以及对应的修复方案。...检查磁盘容量 Windows系统有时会出现C盘的磁盘空间不断减小的情况,导致系统不能正常操作。具体操作,请参见 Windows系统临时文件占用过多磁盘空间。
背景信息 当主机发生故障时,系统会通过短信通知您某台主机有故障待修复,同时对应的主机状态会显示为 待替换。您可以在 计划内事件 中查看本次故障信息。影响 执行替换主机操作会有如下影响:系统会将主机设置为停止分配实例。迁移走本...
背景信息 当主机发生故障时,系统会通过短信通知您某台主机有故障待修复,同时对应的主机状态会显示为 待替换。您可以在 计划内事件 中查看本次故障信息。影响 系统会将主机设置为停止分配实例。迁移走本主机上所有实例。系统会保证把实例...
当节点出现故障时,自愈系统会自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD会修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...
当宿主机存在故障风险和出现突发故障时,阿里云会通过系统事件方式通知宿主机上的用户,您可以响应该系统事件。在您响应该系统事件时,ECS实例的默认行为是自动重启。如果您希望在这种情况下不自动重启ECS实例,可以通过修改维护属性来调整...
Normal:当前应用进程可能会出现异常。建议对当前应用采取措施,例如 kill、重启或迁移。Fatal:可能会对系统产生致命影响。建议立即进行业务迁移。事件报告 UKFEF将通过以下方式输出事件报告:通过内核日志输出单次事件的详细信息。信息...
如果扩充的是包含系统分区的磁盘,那么扩充的这部分空间会被ECS自动填充给系统分区,这样在恢复到本地的物理机时可能会出现分区越界的问题。如果系统分区相对源端机器被扩容,将会收缩相应的空间,确保和源端机器保持一致。反向注册。确认...
当主节点出现故障,自研的HA系统会自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...
当主节点出现故障,自研的HA系统会自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...
当磁盘水位(磁盘使用率)>=90%时,集群将被锁定,系统会发出报警通知并拒绝您的写数据请求,即写入数据会报错,读数据不受影响。一旦发生磁盘异常立刻为您发出报警通知,让您及时知晓磁盘水位并管理磁盘空间,但每个报警联系人一天最多被...
同时,您可以通过控制台的切流操作,将出现故障的可用区隔离,这时系统会自动在剩余的可用区中补充计算资源,满足业务对资源的需求。本文介绍如何部署和使用(切流和恢复)跨可用区实例。应用场景 跨可用区部署支持单可用区、跨2个可用区、...
升级须知 升级操作系统内核是一个比较复杂和风险较高的操作,可能会导致系统不稳定或出现兼容性问题。在进行升级前,建议备份重要数据,了解升级过程和可能出现的问题,并谨慎操作。操作步骤 以CentOS和Debian系列操作系统为例,指导您如何...
磁盘显示为 外部 或 脱机 将Windows的系统更换到更高版本的系统后,可能会出现看不到数据盘的情况。在运行窗口输入 diskmgmt.msc 命令,运行磁盘管理,磁盘可能会显示为 外部 或 脱机。请参考如下步骤修复磁盘。显示为 外部 的磁盘,在磁盘...
基于监控指标的自动恢复,如果指标触发了恢复规则,系统会自动执行演练恢复操作。基于演练时长的自动恢复。更多信息 关于AHAS Chaos的更多信息,请参见 Chaos Engineering的历史、原则以及实践 和 混沌工程实践经验:如何让系统在生产环境...
问题原因 该问题可能是因为Windows系统引导配置数据(Boot Configuration Data,BCD)配置异常或者磁盘文件系统故障,导致系统无法加载。解决方案 在存有快照的情况下,您可以使用快照来恢复系统盘。具体操作如下:警告 回滚云盘是不可逆...
更多产品定价常见问题 挂载访问FAQ Linux挂载NFS文件系统常见问题 Windows挂载SMB文件系统常见问题 Linux挂载SMB文件系统常见问题 Windows挂载NFS文件系统常见问题 为什么卸载旧NAS并重新挂载新NAS后,容器Pod仍将数据写入旧NAS?...
消息接收管理设置 若您在 消息接收管理 页面,已勾选 产品运维通知 并添加 消息接收人,那么在创建引擎时,系统会默认打开 接收通知。通知以短信、站内信、邮件方式发送。针对于某一项风险提醒,您可以关闭 接收通知 开关。关闭接收通知...
消息接收管理设置 若您在 消息接收管理 页面,已勾选 产品运维通知 并添加 消息接收人,那么在创建引擎时,系统会默认打开 接收通知。通知以短信、站内信、邮件方式发送。针对于某一项风险提醒,您可以关闭 接收通知 开关。关闭接收通知...
当匹配规则被触发时,系统会以您指定的通知方式向通知对象发送告警信息,以提醒通知对象采取必要的问题解决措施。前提条件 已创建通知对象,具体操作,请参见 通知对象概述。新建通知策略 登录 ARMS控制台,在左侧导航栏选择 告警管理>通知...
当分派条件被触发时,系统会以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。前提条件 创建联系人,具体操作,请参见 创建联系人。新建通知策略 登录 Prometheus控制台,在左侧导航栏选择 告警管理>通知策略...
当规则被触发时,系统会以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。前提条件 创建联系人,具体操作,请参见 创建联系人。新建通知策略 登录 EDAS控制台。在左侧导航栏,单击 应用管理>应用列表,在顶部...
问题原因 通过阿里邮箱邮件发送服务器发送邮件,如果发送失败会返回系统退信的通知。解决方案 发信失败 收到该退信通知时,说明您的阿里邮箱发送邮件失败。退信通知中通常会包括邮件主题、时间、收信地址、退信原因、解决方案和参考信息,...
节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障,会导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...
重要 由于该命令可能会更新系统内核,导致出现系统无法启动、内核与软件不兼容等问题。建议您完成不升级系统内核的配置后,再运行该命令。yum update 执行以下命令,查看软件版本号。软件名>-V#请将<软件名>替换为您需要查看版本号的软件 ...
当告警规则被触发时,系统会以您指定的通知方式向告警联系人或钉群发送告警信息,以提醒您采取必要的解决措施。前提条件 已将应用数据上报至 可观测链路 OpenTelemetry 版,具体操作,请参见 接入指南。配置阈值检测 登录 可观测链路 ...
当告警规则被触发时,系统会以您指定的通知方式向告警联系人或钉群发送告警信息,以提醒您采取必要的解决措施。前提条件 已接入 应用监控 eBPF 版,具体操作,请参见 一键接入应用至应用监控 eBPF 版 和 手动接入应用至应用监控 eBPF 版。...
当告警规则被触发时,系统会以您指定的通知方式向告警联系人或钉群发送告警信息,以提醒您采取必要的解决措施。前提条件 已接入应用监控,具体操作,请参见 应用监控接入概述。操作视频 您可以参考以下视频配置阈值检测。配置阈值检测 登录...
在通知策略中添加升级策略后,系统会以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。前提条件 已创建通知对象。具体操作,请参见 通知对象概述。新建升级策略 登录 ARMS控制台,在左侧导航栏选择 告警管理>...
在通知策略中添加升级策略后,系统会以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。前提条件 创建联系人,具体操作,请参见 创建联系人。新建升级策略 登录 EDAS控制台。在左侧导航栏,单击 应用管理>应用...
在通知策略中添加升级策略后,系统会以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。本文介绍如何在 SAE 控制台为应用配置升级策略。前提条件 已创建联系人 新建升级策略 登录 SAE控制台。在左侧导航栏,...
在通知策略中添加升级策略后,系统会以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。前提条件 创建联系人,具体操作,请参见 创建联系人。新建升级策略 登录 Prometheus控制台。在左侧导航栏中选择 告警...
新建报警联系人 当出现备份失败时,系统会向报警联系人发送通知。单击 报警联系人。在 报警联系人 页签,单击 新建联系人。在 新建联系人 面板,设置联系人姓名和描述信息。根据需要选择联系方式并执行相应联系方式。如果选择 联系方式 为 ...
监控邮件推送结果,例如大量邮件推送失败时,系统会及时向用户发送通知。邮件推送结果消息通过多种方式推送到不同的接收端,以进行不同处理,例如多个业务部门都关心这些数据。如果用户A将邮件推送的权限授予用户B,用户A可以通过邮件推送...
Serverless应用引擎SAE(Serverless App Engine)的监控告警通知集成了阿里云ARMS的告警运维中心能力,告警运维中心...告警通知模板配置成功后,后续的通知信息中会出现命名空间信息。如果需要扩展其他展示的字段,可以参考本示例的操作步骤。
常见问题 为什么删除文件没有触发事件通知?相关文档 您可以在事件通知规则中自定义您关注的Object,当这些Object发生指定事件时,您可以通过消息服务指定的接收终端,收到Object的事件通知。具体操作,请参见 结合消息服务实现OSS事件通知...
业务场景 Kafka将日志数据存储到磁盘中,当磁盘出现故障时,会导致磁盘IO能力下降、集群吞吐下降、消息读写延时或日志目录offline等问题。这些情况有可能影响到线上业务平稳运行、数据丢失、Kafka集群容错能力下降,单块盘故障甚至有可能...