文档

健康检查及自动恢复

更新时间:
一键部署

本章将为您介绍托管平台为您带来的系统自动的健康检查及恢复能力

这里通过一个case来描述平台具备的健康检查能力,假设我们有一个停车管理应用,他是由3个节点组成(tomcat节点提供Web服务及业务逻辑,mysql节点用于存储数据,redis节点用于缓存数据)image.png

应用配置的具体操作请参见应用配置将这份应用配置进行部署后,平台将会提供统一调度管控层(简称master),master将会对部署的节点进行非侵入式的健康检查。sep整理-Page-10.png

一旦检测到节点异常(往往是内存超限、进程异常退出等异常场景)将会进入自动恢复过程,master会通过检查每个work节点资源限制情况来动态调度恢复的目标,可能出现2种调度场景:1)在原work节点重启 2) 跨work节点重启。sep整理-Page-10.png注:由于这种健康检查及自动恢复能力的存在,节点直接写入容器内的磁盘会出现数据丢失的情况,您可以通过平台提供的中间件或者持久化存储能力来完成数据存储。