在使用阿里云服务的过程中我应该避免哪些操作?

7)Linux系统下不能开启NetWorkManager服务 linux系统请不要开启NetWorkManager服务,该服务会跟系统内部网络服务出现冲突,导致网络异常。8)Windows系统中的shutdown.exe进程不可以结束 shutdown.exe进程是系统重要进程,如果结束该进程会...

通过可观测性能力进行故障处理最佳实践

设计思路 核心问题 运维场景下,故障处理的核心问题如下:服务出现异常如何预警并上报 出现异常问题如何快速定位 解决方案 云消息队列 RocketMQ 版 定义的Metrics、Tracing指标覆盖消息收发各阶段的状态信息、云消息队列 RocketMQ 版 服务...

修复单台JournalNode异常

当您的集群中只有一个节点上的JournalNode服务出现异常时,可以尝试从其他节点恢复。本文介绍如何从其他节点恢复异常的JournalNode服务。操作步骤 找到健康状态的JournalNode。您可以通过HDFS WebUI查看JournalNode的状态,详细信息请参见 ...

语音通知实现告警功能

当您的系统检测到服务器出现异常,或者物联网等设备出现异常时,可以通过语音通知功能,以语音电话的形式,给告警处理人拨打电话,电话将播报您预先申请的语音通知模板中的内容,在语音通知模板中,您也可以添加变量,从而在实际使用时替换...

应用场景

全面消除偶发问题引发的风险 依托于限流、降级、熔断、隔离等能力,可以在出现偶发的流量洪峰和依赖服务出现异常时,有效地限流保护、削峰填谷、隔离故障、降级保护。低成本实现微服务敏捷开发 依托于开发环境隔离能力,可以在不增加物理...

网关结果码说明

4002 远程调用业务系统异常 MGS 调用业务系统服务出现异常。专有云用户可以在服务端日志 gateway-error.log 中查看详细信息。4003 API 分组 HOST 异常 MGS 调用 HTTP 业务系统服务出现 UnknownHostException 异常。请检查 API 分组配置的...

应用场景

全面消除偶发问题引发的风险 依托于限流、降级、熔断、隔离等能力,可以在出现偶发的流量洪峰和依赖服务出现异常时,有效地进行限流保护、削峰填谷、隔离故障、降级保护。低成本实现微服务敏捷开发 依托于开发环境隔离能力,可以在不增加...

工作原理

该方式主要应用于在服务出现异常后及时的发现问题和定位问题。预测将来产生的时序数据,判断时序数据未来的走势。您可通过时序预测功能实现。该方式主要应用于对服务关键指标的异常走势进行提前预警。时序预测应用场景如下:预测服务关键...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

卡片短信错误码

MissingParameter param fileSize must be not empty 文件大小不能为空 InnerError can not find any vendor 无法找到有效的供应商 InnerError save vendor resource fail 获取媒体资源服务出现异常 创建模板 错误码 错误描述 说明 ...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

指标含义与异常处理建议

指标异常原因 监控期间,当区间慢查询耗时,查询数量增大时,服务异常,常见原因如下:指标异常原因 说明 QPS 查询QPS 或 写入QPS 流量突增或波动较大,集群压力大,相对单条查询耗时久。有agg查询或者有脚本查询 聚合查询场景,需要耗用...

安全告警概述

云安全中心支持实时检测资产中的安全告警事件,覆盖网页防篡改、进程异常、网站后门、异常登录、恶意进程等安全告警类型。通过威胁检测模型,提供全面的安全告警类型检测,帮助您及时发现资产中的安全威胁、实时掌握资产的安全态势。背景...

API调用返回20004 错误码

但除了API 依赖后台服务出现异常,还包括了一种常见的错误,就是入参类型不匹配(cause:argument type mismatch)2.问题现象 response:{"code":20004,"id":"346ff575d1bc465f92925047009da1a9","localizedMsg":"调用后端服务时发生异常",...

数据处理状态查询API

CHUNK_TEXT_SERVER_INVOKE_ERROR(120005,"切分文本服务调用出现异常"),CHUNK_TEXT_READ_LAYOUT_ERROR(120006,"读取文件layout出现异常"),CHUNK_TEXT_PARSE_LAYOUT_ERROR(120007,"解析文件layout出现异常"),CHUNK_TEXT_PARSE_ERROR(120008,...

概览

实例消息堆积量 消息堆积量 Topic消息堆积量 高于上边界 连接数过高、连接数波动较大或连接数持续峰值 系统负载过高、TCP连接池不足、应用程序或服务出现异常、某些应用程序或服务在某些时候进行了大量的TCP连接操作。实例公网TCP连接的...

ECS实例操作系统内部(GuestOS)常见问题与修复方案

如果网卡配置文件存在错误,或者网卡对应的dhclient进程未运行可能引发Linux实例的DHCP服务出现异常,导致实例网络不通。具体操作,请参见 Linux实例中本地网卡的DHCP配置检查与修复。检查网络相关进程是否存在 Linux系统内对应的网络进程...

诊断项与诊断结果说明

检查该实例底层虚拟化层核心服务是否出现异常。出现此类异常可能会导致实例崩溃或出现异常暂停,您可以尝试通过重启实例进行恢复。实例操作系统异常 实例系统出现了内核错误(kernel panic)、OOM(Out of Memory)异常或内部宕机等故障。...

投递CDN实时日志到SLS来分析用户访问数据

预制的日志分析报表 日志分析场景 报表作用描述 CDN基础数据 该数据可以帮助您可以快速了解到CDN整体的服务质量以及终端用户的访问效率(命中率、访问延时、下载速度等),同时也可以在服务质量出现异常情况下及时进行处理。CDN访问错误 该...

诊断项与诊断结果说明

检查该实例底层虚拟化层核心服务是否出现异常。出现此类异常可能会导致实例崩溃或出现异常暂停,您可以尝试通过重启实例进行恢复。实例所在宿主机告警 实例所在的物理设备出现故障告警。检查该实例所在的底层物理机是否有故障。如果底层...

HMaster服务异常提示Cannot seek after EOF

本文介绍HBase出现HMaster服务异常的解决方案。具体报错 HBase 2.3.4版本的HMaster一直重启失败,错误日志如下所示。java.io.EOFException:Cannot seek after EOF at org.apache.hadoop.hdfs.DFSInputStream.seek(DFSInputStream.java:1447...

Pod诊断

容器智能运维平台 提供Pod诊断功能,帮助您诊断异常的Pod信息。本文介绍Pod诊断的检查项以及对应的修复方案。容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI...

节点诊断

ECS实例网卡链路层状态 检查ECS实例网卡链路层是否出现异常。ECS实例未正常启动或网络配置有问题,您可以尝试通过重启实例进行恢复。ECS实例启动状态 检查ECS实例的boot操作是否能正常执行加载。ECS实例无法正常启动,您需要创建一个新的...

Spark服务异常排查及处理

Spark服务日志 当出现Spark服务异常时,您可以查看Spark服务的日志。服务日志目录:EMR-3.40.0之后版本、4.10.1之后版本、5.6.0之后版本:/var/log/emr/spark EMR-3.40.0及之前版本、4.10.1及之前版本、5.6.0及之前版本:/mnt/disk1/log/...

分析请求调用链路

背景信息 在应用运行过程中,当出现服务调用异常或资源访问失败时,开发人员通常会选择断点调试来排查问题。但断点调试在某些场景下并不适用,可能存在如下问题:缺乏整体调用概况:上层服务收到请求后,往往会拆分成多个子请求,最后将...

分析请求调用链路

背景信息 在应用运行过程中,当出现服务调用异常或资源访问失败时,开发人员通常会选择断点调试来排查问题。但断点调试在某些场景下并不适用,可能存在如下问题:缺乏整体调用概况:上层服务收到请求后,往往会拆分成多个子请求,最后将...

分析请求调用链路

背景信息 在应用运行过程中,当出现服务调用异常或资源访问失败时,开发人员通常会选择断点调试来排查问题。但断点调试在某些场景下并不适用,可能存在如下问题:缺乏整体调用概况:上层服务收到请求后,往往会拆分成多个子请求,最后将...

诊断指标与诊断结果条目说明

Instance.VirtException 检查该实例底层虚拟化层核心服务是否出现异常。Instance.ECSService.VirtualizationException 出现此类异常可能会导致实例崩溃或出现异常暂停。您可以尝试通过 重启实例 进行恢复。Instance.RecentUtilHigh 检查...

客户端与服务端连通异常

本文为您介绍客户端与服务端连通异常的原因及...如果与服务端连通出现异常,可能是因为打开了防火墙或路由器策略限制导致。解决方案 Windows和Linux平台下可以使用 netcat 命令测试UDP端口是否连通。检查防火墙或路由器是否限制了UDP端口。

客户端与服务端连通异常

可能原因 阿里云RTC需要使用以下协议及端口:端口 协议 操作 80、443、3478、10768 TCP 允许访问 3478、10000-50000 UDP 允许访问 如果与服务端连通出现异常,可能是因为打开了防火墙或路由器策略限制导致。解决方案 Windows和Linux平台下...

调用HSF服务异常

本文介绍在调用HSF服务时,出现异常 HSFServiceAddressNotFoundException 的原因和处理方法。问题现象 当您通过CSB调用EDAS HSF服务时,出现异常 HSFServiceAddressNotFoundException。可能原因 环境问题,例如地址服务器、网络或命名空间...

ALB健康检查异常排查方法

ALB通过健康检查来判断后端服务器的业务可用性,开启健康检查功能后,当某台后端服务器健康检查出现异常时,ALB会自动将新的请求分发到其他健康检查正常的后端服务器上,避免了局部后端服务器异常对总体服务的影响从而保证业务高可用。...

错误编码:HSF-0029

return 对端业务响应或业务异常*@throws HSFException*如果本侧或对端HSF层出现错误,则抛出HSFException*@throws Throwable*如果服务端业务出现异常,则抛出Exception*/public Object invoke(String methodName,String[]parameterTypes,...

配置服务主动健康检查

如果初次添加服务出现健康检查异常,请您依次做如下确认:确认所购网关VPC是否与服务实例所处VPC一致,或服务所在环境已通过云企业网、专线与网关VPC打通,若VPC不一致且未做VPC连通,网关将无法访问到实例IP。说明 网关不支持通过Nacos、...

使用离群实例摘除保障HSF应用的可用性

在微服务架构中,当服务提供者的应用实例出现异常,而服务消费者无法感知的时候,会影响服务的正常调用,并影响消费者的服务性能甚至可用性。HSF应用的离群实例摘除功能会检测应用和服务实例的可用性并进行动态调整,以保证服务成功调用,...

推送轨迹

功能介绍 您在使用Nacos的过程中,如果遇到与注册中心服务推送相关的问题,例如,客户端未收到服务推送或者服务间调用出现异常等场景,需要去查看注册中心是否正常地把服务推送到客户端,那么可以使用推送轨迹功能辅助排查。操作步骤 登录 ...

摘除离群实例

在微服务架构中,当服务提供者的应用实例出现异常,而服务消费者无法感知时会影响服务的正常调用,并影响消费者的服务性能甚至可用性。离群实例摘除功能会检测应用实例的可用性并进行动态调整,以保证服务成功调用,从而提升业务的稳定性和...

CLB健康检查FAQ

重要 如果关闭健康检查,当后端某个服务器健康检查出现异常时,负载均衡还是会把请求转发到该异常的ECS实例上,造成部分业务不可访问。如果您的业务对负载敏感性高,高频率的健康检查探测可能会对正常业务访问造成影响。您可以结合业务情况...

使用离群实例摘除保障Spring Cloud应用的可用性

在微服务架构中,当服务提供者的应用实例出现异常,而服务消费者无法感知时会影响服务的正常调用,并影响消费者的服务性能甚至可用性。离群实例摘除功能会检测应用实例的可用性并进行动态调整,以保证服务成功调用,从而提升业务的稳定性和...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 物联网无线连接服务 云服务器 ECS 短信服务 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用