离群实例摘除功能会检测 Spring Cloud 和 Dubbo 应用实例的可用性并进行动态调整,以保证服务成功调用,从而提升业务的稳定性和服务质量。通过创建离群实例摘除策略即可配置并启用离群实例摘除。

创建离群实例摘除策略

  1. 登录 EDAS 控制台
  2. 在左侧导航栏选择微服务管理 > 离群实例摘除
  3. 离群实例摘除页面单击创建离群实例摘除策略
  4. 创建离群实例摘除策略基本信息页面设置参数,然后单击下一步
    离群实例摘除-基本信息
    • 命名空间:在右侧列表中选择地域命名空间
    • 离群实例摘除策略名称:策略名称,最长 64 个字符。
    • 被调用服务所用框架:根据实际情况选择DubboSpring Cloud
  5. 创建离群实例摘除策略选择生效应用页面选择生效应用,单击>,然后单击下一步
    离群实例摘除-选择生效应用

    页面右侧会展示离群实例摘除策略示意图。选择生效应用后,该应用调用的所有应用中的异常应用实例会被摘除。摘除期间,生效应用的调用请求将不再被分发到异常实例进行处理。

  6. 创建离群实例摘除策略配置策略页面设置参数,然后单击下一步
    离群实例摘除-配置策略
    • 异常类型:包含网络异常网络异常 + 业务异常(Dubbo Exception),根据实际业务需求选择。
    • QPS下限:QPS 按照统计窗口进行计算,达到该下限后开始进行错误率统计分析。Dubbo 2.7 版本的应用的统计窗口为 15 秒,其它 Dubbo 版本和 Spring Cloud 应用的统计窗口为 10 秒。
    • 错误率下限:当被调用的应用中某个应用实例的错误率高于设置的下限后,将摘除该实例。默认值为 50%。例如该实例在统计窗口内被调用 10 次,有 6 次调用失败,错误率为 60 %,则从应用中移除该实例。
    • 摘除实例比例上限:摘除的异常实例比例上限,即达到阈值后,不再摘除异常实例。摘除异常实例数向下取整,例如应用实例总数为 6,摘除实例比例设置为 60 %,摘除实例比例数为 6 * 60% = 3.6,则按策略最多摘除的实例数为 3。若计算结果小于 1,则不会摘除实例。
    • 恢复检测单位时间:在异常实例被摘除后,EDAS 会不断按单位时间累加检测异常实例是否恢复正常,单位为 ms。默认为 30000 ms,即 0.5 分钟。
    • 未恢复累计次数上限:EDAS 会持续对异常实例进行检测,检测间隔随检测次数按恢复检测单位时间线性增加,当达到设置的检测次数上限后,会按最长时间间隔持续检测异常实例是否恢复。例如恢复检测单位时间设置 60000 ms,未恢复累计次数上限设置为 20,在第 20 次检测异常实例仍未恢复后,则会按 10 分钟(20 x 30000 ms)为间隔执行后续的检测。如果检测到实例已经恢复,则会将检测间隔重置为初始的时间间隔,即一次恢复检测单位时间
      说明 未恢复累计次数上限不建议配置太大。配置太大会导致最长检测间隔时间较长,如果实例在检测间隔早期恢复,仍需等到检测间隔到时再进行检测,导致期间实例资源被浪费,未能及时处理业务调用请求。
  7. 创建离群实例摘除策略创建完成页面确认策略配置,无误后,单击提交
    离群实例摘除-创建完成

执行结果

返回离群实例摘除页面,查看刚创建的策略是否已显示在策略列表中。离群实例摘除-结果验证

后续步骤

在策略列表的操作列单击编辑删除,可以编辑或删除离群实例摘除策略。