故障演练
故障演练能力是ADP基于阿里云故障演练产品AHAS提供的一项能力,在线上集成环节即可对线下交付中常见的各类故障场景下产品编排的容错性、可靠性和可恢复性进行演练,保障编排稳定可靠。
在进行故障演练之前,需要进行以下步骤:
创建产品;
创建验证环境(当前ADP仅支持针对shanghai地域,底座版本≥1.4.0的阿里云ECS验证环境进行故障演练);
验证环境与产品进行绑定关联;
故障演练操作
进入产品详情-产品部署验证页面,点击已经绑定的目标环境,跳转至环境管理详情页面。
在环境详情页面,点击故障演练一栏,进入故障演练页面,初次使用时需要对当前环境进行探针接入。
探针接入完成后,可开始创建演练场景。ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。
部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、无法正常访问环境且无法提前恢复,需等待演练结束后自动恢复,故障注入后默认的自动恢复时长为15分钟。
故障注入后,您可以通过查看详情链接,跳转至AHAS演练记录详情页面,查看演练详情。