如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

添加磁盘

添加完成后,页面上会出现硬盘 配置项。设置新硬盘容量大小。建议采用厚置备模型部署磁盘,即展开 新硬盘 配置项,将 磁盘置备 配置为 厚置备延迟置零 或者 厚置备置零,这样可以获得更好的IO性能。说明 此处以添加一块磁盘为例,请根据...

如何排查无损上下线问题

本文介绍服务无损上下线可能遇到的问题,以及出现问题该如何排查解决。在无损上下线过程中,您可能遇到请求到的实例已下线、请求的实例未就绪、请求一段时间后实例出现异常以及实例未达到预热效果,流量曲线不符合预期等常见问题。...

添加磁盘

添加完成后,页面上会出现硬盘 配置项。设置新硬盘容量大小。建议采用厚置备模型部署磁盘,即展开 新硬盘 配置项,将 磁盘置备 配置为 厚置备延迟置零 或者 厚置备置零,这样可以获得更好的IO性能。说明 此处以添加一块磁盘为例,请根据...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

Java应用监控和诊断方案

以淘宝网(www.taobao.com)践行分布式架构与服务实践的过程为例,遇到的主要挑战有:定位问题难 客服人员接到用户反馈商品购买出现问题后,交由技术人员排查解决。而服务分布式架构中的一个网站请求通常要经过多个服务/节点后返回...

消息收发常见问题

什么会出现一条消息同一时间重试多次?为什么消息会一直重试?消息发送时提示GroupID没有权限。使用RocketMQ数据流入MQTT功能时,为什么子级Topic后会多了一个“/”?消息发送返回“Too many publishes in progress”错误。本地测试先发送...

EMR Kafka磁盘故障运维

业务场景 Kafka将日志数据存储到磁盘中,当磁盘出现故障时,导致磁盘IO能力下降、集群吞吐下降、消息读写延时或日志目录offline等问题。这些情况有可能影响到线上业务平稳运行、数据丢失、Kafka集群容错能力下降,单块盘故障甚至有可能...

MSE注册配置中心高可用最佳实践

多可用区实例将物理服务器部署在不同的可用区,当可用区A出现故障时,流量在短时间内切换到另一个可用区B。整个过程您无需感知,应用代码无需变更。您只需配置多个节点部署,MSE自动部署到多个可用区。图 1.MSE三节点同城双活架构图 图 2...

回切至本地物理机

如果扩充的是包含系统分区的磁盘,那么扩充的这部分空间会被ECS自动填充给系统分区,这样在恢复到本地的物理机时可能会出现分区越界的问题。如果系统分区相对源端机器被扩容,将会收缩相应的空间,确保和源端机器保持一致。反向注册。确认...

连接保持

当Proxy在新旧主节点中进行切换时,需要保留这个状态,否则会出现字符集乱码问题。所以连接保持的核心在于保证连接切换前后的会话状态一致。说明 当Proxy将连接从旧主节点切换到新主节点的过程中,会存在短暂的新老数据库同时不可写不可读...

自动故障剔除

自动故障剔除功能自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

微服务治理概述

服务敏捷开发最佳实践 无 消除变更过程中的风险 功能 使用场景 相关文档 相关视频 无损上线 在某些场景下,服务提供者需要接收大流量请求并成功返回,而刚启动的冷系统直接处理大量请求,可能由于应用内部资源初始化不彻底从而出现请求...

微服务命名空间管理

服务场景下,为了对不同环境下的服务应用、接口作出隔离和区分,MSE服务治理将服务组织分为服务命名空间、应用两层概念,分别实现对环境的隔离、授权。本文介绍如何通过服务命名空间在MSE上组织您的服务,以及如何管理...

自动/手动主备切换

注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请务必确保应用具备重连机制;当只读节点开启了热备功能时,主备切换将在5~10秒内完成。关于如何开启只读节点的热备...

围绕混沌工程的平台实践

本文主要介绍AHAS Chaos是如何围绕混沌工程来打造故障演练服务,您可以了解到混沌工程的基本知识和AHAS Chaos的优势。混沌工程和故障演练 首先您需要了解混沌工程和故障演练的关系。以下是混沌工程官方定义:混沌工程是在分布式系统上进行...

无损上线

方案二:服务小流量预热 在较大流量下,刚启动的系统直接处理大量请求时,可能由于应用内部资源初始化不彻底从而出现请求阻塞、报错等问题。此时通过服务预热功能,在应用刚启动阶段通过小流量帮助应用在处理大量请求前完成初始化,可有效...

基于MSE云原生网关实现全链路灰度

服务场景中,应用间的调用是随机的。当您部署的Spring Cloud应用或Dubbo应用存在升级版本时,可能导致无法将具有一定特征的流量路由到应用的目标版本。通过MSE提供的全链路灰度能力,您无需修改业务代码,就可以实现端到端的全链路...

基于MSE云原生网关实现全链路灰度

服务场景中,应用间的调用是随机的。当您部署的Spring Cloud应用或Dubbo应用存在升级版本时,可能导致无法将具有一定特征的流量路由到应用的目标版本。通过MSE提供的全链路灰度能力,您无需修改业务代码,就可以实现端到端的全链路...

摘除离群实例

Ribbon负载均衡刷新默认间隔是30秒,如果配置的恢复检测单位时间小于30秒,会出现恢复不及时的问题。为了保护应用A的服务性能和可用性,可以为应用A配置离群实例摘除。配置后,即可监控B、C、D应用的实例状态并进行动态调整(摘除或添加)...

异地应用双活切流

选择 故障单元,代表此时,该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回...

步骤五:应用容灾

故障恢复 本机出现故障后在云上拉起本地业务,待本地环境恢复后再将其恢复到本地。具体步骤如下:在 主站点管理 页签,单击+添加。在 添加计算平台 页面,填写计算平台 名称,选择 类型,填写 IP地址、用户名 和 密码。单击 创建。在连续...

路由方式概述

当某个集群出现故障时,设置分发到该集群的流量权重为0,即可达到流量切换目的。例如,以下应用系统中以K8s容器服务作为服务发现的用户服务,部署在两个不同的ACK集群中,集群A和集群B。对于/user 的路由请求流量,希望80%的流量转发至集群...

路由方式概述

当某个集群出现故障时,设置分发到该集群的流量权重为0,即可达到流量切换目的。例如,以下应用系统中以K8s容器服务作为服务发现的用户服务,部署在两个不同的ACK集群中,集群A和集群B。对于/user 的路由请求流量,希望80%的流量转发至集群...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后自动...

设置无损上下线

在实例扩缩容、应用回滚升级、应用启停等场景中,应用可能会出现短时间内服务不可用等异常情况。Serverless 应用引擎 SAE(Serverless App Engine)集成了 服务引擎 MSE(Microservices Engine)的无损上下线功能,通过服务预热、服务...

异地双活切流

选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回 ...

云解析DNS如何实现故障切换

全局流量管理支持IP地址健康检查功能,并根据健康检查的结果,来判断运营商IP地址是否出现故障,如果出现故障,则将域名解析切换到备份的运营商IP上,并最终帮用户实现自动故障转移的功效。请参阅 GTM实现跨网访问加速与故障切换 操作...

MSE快速入门

服务场景中,应用间的调用是随机的,当您部署灰度版本的应用时,可能会出现流量乱窜的情况(如左图)。全链路流量控制功能将应用的相关版本隔离成一个独立的运行环境(即分流泳道如右图),通过设置泳道规则,将满足规则(如name=gray...

Mesh 常见问题

本文汇总了使用服务网格时可能遇到的常见问题及解决方案。服务网格目前支持的服务框架有哪些?服务网格目前支持 Dubbo、SpringCloud 等主流服务框架。XDS 配置不下发 问题原因:Pilot 未启动或 Pilot 与 MOSN 网络不通。解决方案:查看...

ZooKeeper的使用场景和MSE ZooKeeper的优势

节点故障自愈:依托于K8s的Liveness能力,在节点出现故障时,自动恢复故障节点,及时地保障服务的可持续性。数据安全:MSE ZooKeeper专业版提供了快照的备份能力,在集群出现非预期的情况时,能够快速重建恢复集群中的数据,保障数据的...

无损下线

什么需要无损下线 由于服务应用自身调用特点,在高并发下,服务提供端应用实例的直接下线,导致服务消费端应用实例无法实时感知下游实例的实时状态,因而出现继续将请求转发到已下线的实例,从而出现请求报错,流量有损。无损下线...

微服务洞察

MSE服务洞察功能支持动态采集任意方法的信息,从而生成日志并以调用链的形式存储。您只需在控制台配置规则,无需重启应用且实时生效。本文介绍如何在控制台配置服务洞察规则。背景信息 通过分析特定的日志信息可以帮助您排查问题或了解...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细化摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

测试服务

在日常开发中,开发人员...执行结果 在 结果 区域查看测试是否成功,测试结果一般会有以下几种情况:结果成功,并显示调用服务的响应结果。结果失败,并显示调用服务的失败响应信息。请根据响应信息,排查服务的端口、网络及代码本身的问题

查看监控信息

大于 2000 后会触发写入反压,数据合并压力大的表会出现数据写入失败。无 失效节点数 当前集群失效节点的个数。个 缓存命中率 缓存读写操作占所有读写操作的百分比。缓存读写吞吐量 集群各节点硬盘每秒的 读取/写入吞吐速率。Byte/s 远端...

ack-node-repairer

当节点出现故障时,自愈系统自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

跨可用区容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。按如下步骤进行故障切换:在 受保护服务器 页签,在要启动故障...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
微服务引擎 负载均衡 商标服务 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用