通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

资产暴露分析

资产暴露分析功能可以对阿里云上的云资源(例如ECS、网关资产、系统组件、端口等)进行全面扫描和分析,识别出可能暴露在公网的安全风险和漏洞,帮助您及时发现和解决问题,提高云资源的安全性。本文介绍如何使用云安全中心资产暴露分析...

DeviceWanLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'productMethod':'created','language':'zh-CN',};

同城双活

在日常业务链路中,会出现多次跨机房调用,增加性能损耗。同城双活模式:会优先调用同可用区,同可用区找不到调用目标,再调用其他可用区。最佳实践 最佳实践方案建议包含下述逻辑:每个应用的所有节点对等部署在同城的两个可用区。每个...

ConnectionDisconnect

ConnectionDisconnect事件提示您智能接入网关的主备IPsec链路出现故障。告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障。处理...

什么在控制台看不到数据?

使用开源客户端上报数据后,如果遇到控制台或日志中打印了错误日志,或者控制台上没有观察到报错数据,可以根据本文档进行问题排查。控制台没有数据的可能原因:网络无法连通 控制台中上报开关设置有误 SLS数据源上报失败 HTTP上报数据失败...

什么在控制台看不到数据?

使用开源客户端上报数据后,如果遇到控制台或日志中打印了错误日志,或者控制台上没有观察到报错数据,可以根据本文档进行问题排查。控制台没有数据的可能原因:网络无法连通 控制台中上报开关设置有误 SLS数据源上报失败 HTTP上报数据失败...

通过调用链路和日志分析定位业务异常问题

当应用出现业务异常问题时,应用指标统计图会出现明显波动,您可据此粗略地分析异常问题;通过完整的调用链路和业务日志分析,可以精准定位业务异常问题。关联业务日志与TraceId 登录 ARMS控制台,在左侧导航栏选择 应用监控>应用列表。在 ...

使用场景

边缘节点服务ENS提供CDN边缘节点的就近接入和节点间互联互通,实现低延时、高稳定的互动通信链路。SDN SDN厂商致力于数据传输的问题,提供优质、稳定、低成本的互联网内容传输解决方案。利用边缘节点组建SDN网络架构,可以自主调度构建低...

什么是AI分布式训练通信优化库AIACC-ACSpeed

AIACC_CPU_BINDING_ENABLE=1 如果程序本身存在问题,例如负载不均衡导致性能波动,开启CPU-Affinity功能后可能会出现性能损失,所以该特性作为优化选项进行使用。Bucket-Tuning:ACSpeed默认开启Bucket-Tuning,可以对梯度的融合进行自适应...

实例管理常见问题

问题列表 启用KMS实例时为何一直显示连接中 启用KMS硬件密钥管理实例时提示“连接失败”启用KMS软件密钥管理实例时出现报错提示 启用KMS硬件密钥管理实例时出现报错提示 如何配置KMS硬件密钥管理实例关联的密码机集群 应用程序是否可以跨...

0041-00000009

问题描述 请求触发的镜像回源出现了循环回源。问题原因 您发起的请求触发了镜像回源,在镜像回源过程中出现了循环回源。...当请求Bucket A中的文件时,会出现循环回源报错。解决方案 梳理镜像回源链路,修改镜像回源规则。相关文档 镜像回源

使用ping命令丢包或不通时的链路测试方法

网络区域 通常情况下,从客户端到目标服务器的整个链路显著的包含如下区域:客户端本地网络 本地局域网和本地网络提供商网络,如前文链路测试结果示例图中的区域A,一般为前2~3个节点。如果该区域出现异常,如果是客户端本地网络相关...

功能特性

建议您从运营商处购买一个可以传输数据的4G卡,该4G卡插入智能接入网关设备后可作为宽带备份链路,在宽带链路故障时为您传输数据。专线备份:在客户网络中已有专线链路的情况下,可增加智能接入网关作为备份上云链路。专线+Internet备份:...

日志关联

当应用出现业务异常问题时,您可以分析业务日志,精准定位业务异常。本文介绍如何在调用链分析中关联日志服务SLS的日志。前提条件 已将应用数据上报至 可观测链路 OpenTelemetry 版,具体操作,请参见 接入指南。已创建Project。具体操作,...

链路流量控制简介

多应用问题排查 当部署在EDAS中的HSF微服务应用出现问题时,可以通过全链路流量控制将特定流量引入到某个应用,排查链路中具体应用的问题,保证整个微服务应用正常运行。入口应用与流量控制规则 在全链路流量控制中首先要指定入口应用,并...

与可观测链路 OpenTelemetry 版前后端打通

如果API请求与页面域名非同源时,要实现前后端链路追踪,则需要同时配置enableApiCors:true,并且需要后端服务支持请求跨域及自定义header值,重要 请确认所有请求都配合联调正常,否则会出现请求失败的问题。若请求失败,请参见上述在Node...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

基本概念

设备 一般指IP网数通类网络通信设备,比如交换机、路由器、防火墙等,根据业务场景也可以涵盖无线网络AP/AC的管理和运维。电路(链路)根据管理域链路包括单端链路和双端链路,业务类型包括自有业务或者对接外部的如专线等。安全域 设备等...

集成Windows SDK时的常见问题

编译代码时报x64编译报错 问题现象:编译代码时可能会出现以下错误:可能原因:使用64位编译。解决方案:SDK目前只支持32位,请切换编译选项。头文件或静态库路径设置错误 问题现象:编译代码时可能会出现以下错误:可能原因:头文件或静态...

集成iOS SDK时的常见问题

编译代码时报x86或i386错误 问题现象:编译代码时可能会出现以下错误:可能原因:使用模拟器调试和运行。解决方案:请使用真实设备调试和运行。编译代码时报bitcode错误 问题现象:编译代码时可能会出现以下错误:可能原因:SDK暂不支持...

异常分析

将应用数据上报至 可观测链路 OpenTelemetry 版 后,可...相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 创建告警规则。

调用链分析

将应用数据上报至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,可观测链路 OpenTelemetry 版 的调用链分析功能是基于已存储的全量链路明细数据,自由组合筛选条件与聚合维度进行实时分析,可以满足...

集成Mac SDK时的常见问题

编译代码时报bitcode错误 问题现象:编译代码时可能会出现以下错误:可能原因:SDK暂不支持bitcode配置。解决方案:关闭bitcode编译选项。编译代码时报image not found 问题现象:编译代码时可能会出现以下错误:可能原因:SDK 1.6及之前...

提供服务

将应用数据上报至 可观测链路 OpenTelemetry 版 后,可...相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 创建告警规则。

如何使用全链路流量控制排查应用问题

当部署在EDAS中的HSF微服务应用出现问题时,可以通过全链路流量控制排查链路中具体应用的实际问题,提升排查效率,保证整个微服务应用正常运行。本文将以一个示例介绍如何通过全链路流量控制排查链路中的应用问题。限制说明 使用灰度发布...

什么是HTTPS加速

配置TLS版本控制与加密套件 设置TLS版本后,仅支持客户端使用对应版本TLS与 CDN 节点之间发送和接收请求,以满足通信链路的安全性要求。加速SSL证书校验 配置OCSP Stapling CDN 节点预先缓存在线证书验证结果并下发给客户端,无需浏览器...

可观测性的设计原则

链路追踪 当系统出现问题时,需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求...

什么是HTTPS加速

配置TLS版本控制 设置TLS版本后,仅支持客户端使用对应版本TLS与 DCDN 节点之间发送和接收请求,以满足通信链路的安全性要求。加速SSL证书校验 配置OCSP Stapling DCDN 节点预先缓存在线证书验证结果并下发给客户端,无需浏览器直接向CA...

集成Web SDK时的常见问题

摄像头和麦克风无法使用 问题现象:程序运行时可能会出现以下错误:解决方案:AppServer和网页需要使用HTTPS协议。检测是否禁用或者占用摄像头和麦克风设备。Web端和其它端无法互通 需要在其他端调用setH5CompatibleMode,设置兼容模式。...

基本概念

本文介绍在使用 可观测链路 OpenTelemetry 版 之前需要了解的基本概念,包括分布式追踪系统的作用,什么是调用链,可观测链路 OpenTelemetry 版 所依赖的OpenTracing数据模型,以及在 可观测链路 OpenTelemetry 版 产品里数据是如何上报的...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

等待资源

什么会出现等待资源?为什么任务一直在等待gateway调度资源?为什么数据集成任务一直显示wait?为什么会出现等待资源?问题现象 调度将任务下发到对应执行引擎上,此过程可能会出现以下等待资源问题:等待调度资源组。数据集成任务等待...

什么是物联网平台

通信链路 说明 上行通信 设备通过MQTT协议与物联网平台建立长连接,上报数据(通过Publish发布Topic和Payload)到物联网平台。通过AMQP消费组,将设备消息流转到您的业务服务器上。通过物联网平台的云产品流转功能,处理设备上报数据,将...

通过Jaeger上报Go应用数据

通过Jaeger为应用埋点并上报链路...常见问题 Q:在运行过程中,为什么会出现以下报错?2021/06/28 21:11:54 ERROR:error when flushing the buffer:error from collector:403 A:出现上述报错,说明输入的接入点信息不正确。请更正并重试。

通过Zipkin上报Go应用数据

通过Zipkin为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用Zipkin为Go应用埋点...

TCP连接超时时间配置

概述 用户的客户端调用API网关的引擎,API网关的引擎调用用户的后端服务,目前都使用的是TCP连接,关于TCP连接,一些超时时间的配置影响到整个通信过程,配置不合理导致不同情形的问题,甚至导致故障。本文档站在API网关的角度对API...

集成Android SDK时的常见问题

gradle中未正确引用Android SDK依赖文件导致编译报错 问题现象:编译代码时可能会出现以下错误:可能原因:gradle中未正确引用Android SDK依赖文件。解决方案:请按照正确步骤导入aar包和jar包,并在gradle中配置引用。具体操作,请参见 ...

诊断应用卡顿问题

排查、解决网站卡顿、页面加载过慢等问题过程复杂,耗时较长,原因如下:应用链路太长 从前端页面到后台网关,从Web应用服务器到后台数据库,任何一个环节出现故障都有可能导致整体卡顿。采用微服务架构的应用,链路更加复杂,而且不同组件...

2023年

无 缺陷修复 修复带SORT KEY的内存攒批任务执行后可能会出现的查询报错问题。修复Serverless实例读取字符串类型数据可能出错的问题。修复WHERE子句中过滤条件过多可能出错的问题。修复SQL包含like语句时可能出现报错的问题。修复扩缩容等锁...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
可观测链路 OpenTelemetry 版 短信服务 物联网无线连接服务 边缘网络加速 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用