服务实例隔离与诊断可以有效地应对线上故障(例如内存泄露),提升微服务系统整体稳定性。当服务提供者的某些实例出现异常时,MSE治理中心将异常实例的流量隔离,并结合阿里云应用实时监控服务 ARMS(Application Real-Time Monitoring Service)所提供的内存快照生成能力,及时生成异常实例的线上环境内存快照,帮助您进行后续问题分析与诊断。
前提条件
使用服务实例隔离与诊断功能,需要满足以下条件:
当前仅支持Java语言相关的Dubbo 2.6.x、2.7.x和Spring Cloud E及以上版本应用。
如果Spring Cloud应用的配置项
spring.cloud.xxxx.discovery.fail-fast
被设置为false
,则不支持对该应用的上线与下线状态进行判断。生成异常实例的内存快照需要将实例接入阿里云应用实时监控服务 ARMS(Application Real-Time Monitoring Service)。具体操作,请参见接入指南。
操作步骤
登录MSE治理中心控制台,并在顶部菜单栏选择地域。
在左侧导航栏,选择治理中心 > 应用治理。
在应用列表页面,单击目标应用的资源卡片。
在左侧导航栏,单击节点详情页签,选择异常实例,单击操作下方的服务下线,并在微服务下线弹框中单击确定,即可将实例从注册中心移除。
实例从注册中心移除后,若该实例已无新请求,可通过阿里云应用监控服务ARMS提供的创建内存快照功能,给异常实例创建内存快照,以便后续进一步的问题排查。
在对应节点的操作列下方单击去创建内存快照,在提示弹框单击确定。
进入应用监控系统后,在应用详情页面单击右上角创建内存快照,然后在弹框页面创建内存快照中单击保存给异常实例创建内存快照。
相关文档
如果您想了解更多关于内存快照创建和查看的信息,请参见内存快照。