未收到告警通知的排查思路

本文介绍未收到告警通知的排查思路。排查流程 操作步骤 登录 日志服务控制台。在Project列表区域,单击目标Project。该Project为您告警监控规则...如果全局配置错误数和通知渠道错误数为0,说明无故障,请提 工单 联系日志服务技术支持人员。

切换接入点

说明 如果您选择的接入点出现故障,阿里云会自动帮您切换至无故障接入点。您选择的接入点正常后,如果您想继续使用,需再次进行手动切换。相关文档 ListAccessPoints:查询接入点信息。UpdateSmartAGAccessPoint:切换智能接入网关设备的接...

光伏发电异常检测提效

例如:如下图所示:光伏发电系统的P-T曲线具有强烈的非线性,在光线充足、电池无故障的情况下,其几何形态近似于一个开口向下的马蹄形抛物线。该抛物线顶点对应的功率即为该日最大输出功率点。正常状态下P-T曲线:如下图所示:当出现外界...

应用场景

报警事件分级管理:系统触发的报警、事件、故障无分级,不能第一时间区分任务的紧急和影响程度导致重要紧急的任务未及时处理,加大业务损失。打破数据烟囱:同一个业务运营下所有层级的报警数据统一汇聚,不同监控源数据互联互通,真实反应...

名词解释

另一方面是在⼀个数据中心发⽣故障或灾难的情况下,其他数据中心可以正常运行并对关键业务或全部业务实现接管,实现用户的故障无感知。两地三中心 即生产数据中心、同城灾备中心、异地灾备中心建设方案。这种模式下,两个城市的三个数据...

常见问题FAQ

4.HDMI信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

什么是容器报警演练

容器演练是针对Kubernetes集群定制的故障演练,可以对Kubernetes集群中至关重要的高可用特性进行验证。目前AHAS仅支持容器演练中的报警演练。...侵入。无需在用户集群中安装探针以注入故障,所有事件投递都是通过API Server来进行网络请求。

测试指标

网络吞吐量 定义及解释 网络吞吐量是指在网络故障的情况下单位时间内通过的网络的数据数量。单位为Byte/s。网络吞吐量指标用于衡量系统对于网络设备或链路传输能力的需求。当网络吞吐量指标接近网络设备或链路最大传输能力时,则需要考虑...

接入演练应用

重要 在已部署故障演练探针的机器上,修改JVM启动参数并重启,应用会自动识别并生效,无需重新部署故障演练探针。启动应用。登录 AHAS控制台,在左侧导航栏选择 故障演练>概览。在左侧导航栏单击 探针管理,然后单击右上角的 接入探针。在 ...

使用前须知

专属仪表盘 使用场景 故障定位 您可以根据访问日志快速定位和解决故障。例如,根据 status 字段查看全球加速应答报文的状态,排查访问请求未获得预期响应的原因。业务规划 您可以根据访问日志进行数据分析,提前规划业务规格。例如,...

单实例快速恢复

数据状态保存在盘古分布式存储系统中,无需从计算节点迁移,计算节点轻量状态,系统可以快速从故障中恢复。该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问...

查看节点健康状态

节点健康状态展示了当前节点的运行状态是否正常,它是由多个健康检查项结果汇总而成的。本文将介绍如何查看节点的健康状态和相关的健康检查项。前提条件 已创建集群,详情请参见 创建集群。...阈值,有故障补偿发生即为异常。

主从实例读写分离部署(共享存储)

数据状态保存在盘古分布式存储系统中,无需从计算节点迁移,计算节点轻量状态,系统可以快速从故障中恢复。该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问...

集群高可用

此外,为了保证处于活跃状态NameNode宕机之后,能自动切换到备用的NameNode,在两台Master节点上部署了FailoverController,整个故障切换过程无需人工介入。YARN ResourceManager 和NameNode类似,阿里云Cloudera CDP在两台Master节点上...

ECS系统事件概述

说明 计划内运维事件也称主动运维事件,是阿里云基于百万级服务器的管理运维经验,服务上万家大型企业客户的能力沉淀,以及达摩院的前沿机器学习算法,对底层宿主机的软硬件故障风险进行预测和主动规避。当宿主机上的故障风险无法规避时,...

微服务引擎MSE的审计事件

AddAuthPolicy AddRoutePolicy AddSeataServer AddServiceTimeConfig ApplyCanaryPolicy CheckAuthPolicyName CheckKmsStatus CheckRole CreateLicenseKey CreateOutlierConfig CreateVGroup ...

可运维性咨询服务内容说明

序号 文档名称 1 验收 交付物《XXX应用可运维性咨询启动报告》2《XXX应用可运维性咨询调研报告》3《XXX应用可运维性咨询评估报告》4《XXX应用可运维性咨询改造方案》上述项目报告提交后,客户应在5个工作日内确认方案,如异议,双方签署...

API概览

故障演练 API 标题 API概述 CreateFailoverTestJob 创建高速通道故障演练任务 调用CreateFailoverTestJob接口创建高速通道故障演练任务。StartFailoverTestJob 开始高速通道故障演练任务 调用StartFailoverTestJob接口开始高速通道故障演练...

性能监控最佳实践

后端接入:Java 应用推荐优先使用 ARMS Agent,侵入式埋点无需代码改造,支持边缘诊断、无损统计、精准采样等高阶功能。用户自定义方法可以通过 OpenTelemetry SDK 主动埋点。非 Java 应用推荐接入 可观测链路 OpenTelemetry 版,将数据...

常见问题

产品系列 目标系列 集群版 单节点 高压缩引擎(X-Engine)源系列 集群版 不支持 不支持 单节点 不支持 不支持 高压缩引擎(X-Engine)不支持 不支持 Q:单节点 系列是如何保证服务可用性和数据可靠性呢?A:单节点 是基于单个计算...

错误码

如果数据节点故障解决后仍然出现PXC-4200错误,请联系技术支持。PXC-4201 ERR_GROUP_NO_ATOM_AVALILABLE 描述:PolarDB-X 分库内暂时没有可用数据节点。示例:ERR-CODE:[PXC-4201][ERR_GROUP_NO_ATOM_AVALILABLE]All weights of DBs in ...

探针安装常见问题

常见问题 本文介绍了以下常见问题:AHAS架构感知和故障演练探针limits配置 ECS探针安装常见问题 容器服务安装ack-ahas-pilot常见问题1 容器服务安装ack-ahas-pilot常见问题2 容器服务安装ack-ahas-pilot常见问题3 容器服务安装ack-ahas-...

数据安全

利用可用区,您可以设计和操作应用程序和数据库,使其在可用区之间实现中断的自动故障转移。与传统的单个或多个数据中心基础设施相比,可用区具有更高的可用性、容错性和可扩展性。有关阿里云区域和可用区的更多信息,请参见 地域和可用...

使用限制

历史故障 公测期间暂存储限制。通知订阅 通知订阅 每个租户最大可以配置50个通知订阅规则。服务 服务 每个租户最大可以配置100个服务。权限使用限制 功能 模块 限制规则 人员管理 人员 仅阿里云主账号可以新增、删除、修改并查看所有人员...

AccessGatewayFailover

AccessGatewayFailover事件提示您智能接入网关设备主IPsec链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

DATASOURCE:CDDC:DedicatedHostGroups

HostReplacePolicy String 主机故障处理策略。 示例 YAML 格式 ROSTemplateFormatVersion:'2015-09-01' Parameters:DedicatedHostGroupId:Description:Dedicated Host Group ID.Type:String Resources:ExtensionDataSource:Properties...

产品优势

故障定位时,服务商和用户之间沟通时间长,且故障排查前,服务商需要先熟悉用户的云平台和应用平台,再排查故障,排查过程耗时长,导致业务长时间处于受损状态。服务流程可审计、可追溯,打造可信任的企业服务。操作过程难以记录和追溯,...

数据容灾

当断网、断电或者发生灾难事件导致某个机房不可用时,仍然能够确保继续提供强一致性的服务能力,整个故障切换过程用户感知,业务不中断、数据不丢失,可以满足关键业务系统对于“恢复时间目标(RTO)”以及“恢复点目标(RPO)”等于0的...

可用性

QUORUM HA机制 Raft Region 故障感知 Coordinator/客户端重试、等待超时时间+log回放,选主时间 客户端重试、超时检测、log回放 客户端重试、重新选leader 客户端重试、超时检测、log回放 感知时间 毫秒 10秒~10分钟 10秒~10分钟 1...

无法连接Windows实例

故障现象 存在实例密码修改记录,但重启实例记录。故障原因 可能是修改了实例密码,但是未重启实例。解决方法 登录 云服务器管理控制台,单击左侧导航栏中的 实例。在页面顶部的选择对应的地域,在目标实例右侧单击 更多>实例状态>重启,...

网络类场景

网络延迟 网络延迟场景可以指定网络延迟因素(例如网卡、本地端口、远程端口、目标IP等)和延迟时间,对应用或服务注入网络调用延迟故障。验证网络延迟情况下系统的容错能力。表 1.参数说明 参数名称 参数说明 网卡名称 具体的网卡设备,为...

产品优势

与共享宿主机(多租户环境)相比,DDH为您...高可用 DDH提供自动宕机迁移能力,在物理机故障时自动迁移,您无需准备备机,故障迁移自动完成。同时支持在不停机的情况下将ECS实例在不同宿主机间迁移,在需要时进行负载均衡,保障业务的高可用。

高性能版实例

即使计算节点发生故障,也可以保证实例数据丢失。高可用 AnalyticDB PostgreSQL版 高性能版由于减少了一个副本,在高可用方面出现了一些下降,在物理机故障等极端情况下,集群恢复的时间会变长(8小时以内)。高性能版通过ESSD多副本技术...

错误码

错误码 描述 故障排除指导 0 成功 -1 通用错误 请根据示例Demo进行比对排查,调用逻辑是否正确。2 输入参数错误 请检查输入参数是否正确。3 输入的缓冲区大小不足 请检查输入参数缓冲区大小是否太小。4 请求数据长度过长 请检查输入参...

高级模板支持的AE功能及插件

VE Super Glitch 模仿电视故障画面抖动。暂 VE Face Touch 简易版皮肤美白插件,能够对画面进行简单的美白、红润和粉嫩效果调整。暂 VE Chroma Key 简易版蓝绿屏抠图插件,主要用于调整实时抠图的速度,实际抠图效果比AE内置的Key...

产品架构

安全可靠:Agent本身对应用入侵。除演练的故障场景需要作用于应用进程的情况外,例如Java类的故障场景。网络异常可自动重试。数据传输通道严格加密,保证数据安全。完善的自我保护:实时监控系统资源,不占用过多带宽。非用户手动卸载...

查看实例的系统日志和屏幕截图

您可以利用这些功能分析排查实例故障,例如诊断操作系统响应、异常重启或者无法连接实例等。前提条件 实例必须处于 运行中(Running)状态才能获取系统日志和屏幕截图。背景信息 云服务器ECS的系统日志是运维诊断的重要一环。如果您需要...

概述

PolarDB 的感秒切技术从故障探测、切换速度和切换体验三个方面对切换场景进行了优化,包括计划内的切换,如集群升降配和小版本升级,以及计划外的容灾切换。整合了多项技术,来解决用户的痛点问题:引入全新的高可用模块Voting Disk...

免费体验PolarDB MySQL热备感秒切

背景 PolarDB MySQL版 的热备感秒切技术,通过VDS、全局预热系统、连接保持和事务保持三大特性,解决了 PolarDB 的故障探测、切换速度和切换体验问题。用户可以在任意时刻对集群进行升配,而无需担心连接中断或事务中断问题,真正实现了...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库Cassandra版 云数据库 Redis 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用