故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

功能特性

设备诊断 针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。查看运维大盘 展示设备的地区热力图分布,方便您直观、快速地了解所有设备的状态。在线调试 直接从物联网平台控制...

设备显示离线

本文介绍智能接入网关设备显示离线的原因和处理方法。问题现象 登录 智能接入网关控制台,查看设备状态为 离线。可能原因 设备软件故障设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

共享内存通信(SMC)常见问题

SMC发生回退时会提供回退原因编号,根据回退编号可以帮助分析和定位问题。解决方案 运行 smcss-a 命令,查看SMC连接的回退编号。返回结果示例:State UID Inode Local Address Peer Address Intf Mode ACTIVE 00000 0156721 192.168.99.21:...

指标趋势图

智能洞察 波动分析 波动原因分析通过机器智能算法自动拆解分析核心指标波动的原因。您可以拆解维度或度量来分析波动原因。具体设置请参见 波动原因分析。说明 波动分析 功能目前处于Beta版本。标注-当图表中的数据存在异常或需要重点关注时...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

UploadAudioData-上传音频质检

unsolved Boolean 否 是否未解决,用于原因分析模块,该字段若为 true,则将归类到未解决原因分析数据中进行分析。回调参数说明 假设调用方传入的回调地址是:http://aliyun.com/callback ,那么回调时的完整 URL 为 ...

什么是设备诊断

设备诊断是阿里云物联网平台针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。服务架构 服务优势 丰富的数据诊断指标 提供网络连接成功率、设备离线原因、云对接次数等丰富的...

附录:SOFAStack 产品目录

分析服务性能:调用拓扑中的应用都可以单独进行下钻分析,可以从吞吐、错误率、响应时间等指标对应用性能进行详细分析。应用性能和架构的优化 在调用关系拓扑中能对各个应用的调用次数和耗时情况进行查看和分析,找到负载较高和负载较少的...

App端性能体验功能说明

性能监控产品通过轻量级的集成接入即可拥有实时、可靠、全面的应用崩溃、ANR、自定义异常等捕获能力,及卡顿、启动分析等性能能力,支持多场景、多通道智能告警监控,帮助开发者高效还原异常、卡顿用户的访问路径和业务现场,缩短故障排查...

自助诊断GPU节点问题

通常是您手动退出或者其他故障(硬件、资源限制等)导致的GPU应用退出,XID 45只提供一个结果,具体原因通常需要进一步分析日志。68 NVDEC0 Exception.通常是硬件或驱动问题。工单排查列表 当遇到下列XID错误时,请 提交工单 联系技术支持...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

离线分析

根据离线发生的时间区间、设备的未重连时长来统计离线设备的特征,帮助您全面了解、分析设备离线的原因。前提条件 设备已接入阿里云物联网平台。具体操作,请参见 设备接入。已开启设备诊断服务。具体操作,请参见 开启和关闭设备诊断。...

应用场景

场景一:面向大中型企业的多地容灾高可用网络架构 当本地数据中心的关键业务对可用性要求极高时,建议在多个接入点建立专线连接,该拓扑确保了因光纤切断、设备故障或接入点位置故障导致的连接故障的恢复能力。自主申请专线和共享合作伙伴...

功能介绍

背景信息 在物联网边缘计算业务中,由边缘一体机分析的告警事件、设备故障等消息,需要及时发送通知给特定的人员处理,避免出现安全风险或者业务停滞等情况。对此场景,物联网边缘计算研发了 智慧立方 钉钉程序,您只需要配置程序,...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

原因分析

原因分析时通过对通话内容的挖掘,分析出客户投诉或者问题未解决的具体原因分析客户投诉或问题未解决的热门、冷门原因、变化趋势、涨跌幅等情况。未解决原因分析 分析维度 未解决原因分析是以时间和数据来源的维度对未解决数据进行分析。...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

配置设备级高可用

动态HA功能无需配置虚IP地址,系统会主动帮您探测设备状态,在主网关设备故障时,自动帮您切换流量。智能接入网关仅支持同一实例中的两台设备组建HA备份组,系统会指定默认的主设备和备设备,您可以登录智能接入网关管理控制台查看设备的...

云盒计算资源配置最佳实践

由于这些冗余资源对于用户来说是可见资源,随时可以被用来创建ECS实例或其他云产品实例,因此该方式对于日常业务使用有一定的灵活性,但无法保证在硬件设备故障期间,一定存在可用的备机资源。购买 SLA增值服务包,为计算资源通过SLA保证。...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

API概览

ListProblemSubtotals 故障小计列表 RecoverProblem 故障恢复 ReplayProblem 故障复盘 RevokeProblemRecovery 故障撤销恢复 UpdateProblemNotice 更新故障通告 CreateProblemMeasure 创建故障改进措施 DeleteProblemMeasure 删除故障改进...

什么是用户体验监控

RUM)专注于对Web场景、App移动应用场景和程序场景的监控,以用户体验为切入点,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用...

硬件功能说明

当主设备故障时,用备设备替换,保证业务的高可用性。安全 VPN加密 加密连接。访问控制(ACL)允许或者拒绝访问控制规则内IP对公网或私网的访问。说明 不支持公网访问控制。设备离线锁定 防盗,长期离线锁定。运维 远程重启 通过控制台远程...

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...

设备分析

从左侧导航栏进入 移动分析>基础分析>设备分析 页面。筛选分析数据。在页面右上方,单击 添加过滤条件 按钮,选择平台、版本、渠道,并选择数据分析的日期,即可查看相应的设备分析数据。说明 统计数据基于历史的日级汇总,数据库中记录了...

查看升级包版本和成功率

物联网平台的OTA升级提供了数据分析功能,可供您查看指定产品下升级包版本和各升级批次成功率的统计信息,帮助您分析OTA升级失败原因,进而提高设备升级成功率。功能说明 功能模块 展示样式 说明 版本分布 升级包版本分布 条形图 按照版本...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

分析预警

本文为您介绍辅助线、趋势线、预测、异常检测、波动原因、聚类六种 分析方式。背景信息 分析预警支持从多个角度对当前数据进行分析,通过该功能可以直观了解数据的变化趋势和异常点。分析预警目前支持辅助线、趋势线、预测、异常检测、波动...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

应用场景

电力化工及工业制造监控分析 传统电力化工以及工业制造行业需要通过实时的监控系统进行设备状态检测,故障发现以及业务趋势分析设备通过工业接口协议将自身状态数据和生产业务数据接入工业设备网关,然后通过 MQTT 协议发送到物联网平台...

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

ping不通云服务(SAG-100WM)

可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请参见...

应用场景

智能对话分析(Smart Conversation Analysis)从对话录音、对话文本或者视频对话中,基于智能算子...对话内容分析 通过挖掘标签和分类,展示海量对话session的来电内容,具体分为基础分析、重复来电分析原因分析(未解决原因&客诉原因分析)。

无法连接到同一个云连接网内的本地客户端

本文介绍SAG-1000设备无法连接到同一个云连接网内的本地客户端的原因和处理方法。问题现象 SAG-1000设备无法连接到同一个云连接网内的其他本地客户端。可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标PC环境的网络故障。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
检索分析服务 Elasticsearch版 物联网无线连接服务 云安全中心 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用