本文列出了应用高可用服务 AHAS 的主要术语。

故障演练相关术语

名词 名词解释
演练 一个完整的、可执行的流程配置。
草稿 未配置完成的演练或修改后未保存的演练。
演练任务 一次演练的执行记录,每执行一次演练就产生一个任务。
演练报告 一个演练任务的结果,一个演练任务对应一份报告。
阶段 活动的集合,一个演练共分4个阶段,每个阶段包含多个活动,演练会按照阶段顺序执行。
活动 演练流程中的一个可运行的节点,一个演练由多个活动组成。
演练参数 一个活动运行时所需要的参数,参数决定了活动执行的结果。
演练对象 实施演练的目标主机或设备。目前以活动为最小颗粒度,不同活动可以对不同的主机或设备执行。
场景 活动的分类,例如磁盘满载和磁盘IO高都属于磁盘这个场景。
标签 用户对演练自定义的含义。一个演练可以有多个标签,便于用户对演练进行分类和管理。

流控降级相关术语

表 1.
名词 名词解释
流控降级 AHAS 流控降级(限流降级)基于 Sentinel,提供专业多样化的流量控制、熔断降级手段,并提供强大的监控信息,以及实时的动态规则推送能力,为您的应用和服务保驾护航。
说明 Sentinel 基于 RateLimiter 等流控算法实现流量塑形。
资源

只要通过 Sentinel API 定义的代码就是资源(Resource),资源能够被 Sentinel 保护起来。资源可以是 Java 应用程序中的任何内容,例如 Web 应用的 HTTP API、Dubbo 微服务应用中的某个服务、应用程序调用的其它应用提供的服务或者任意一段代码。

每个资源都由唯一的资源名称标识。资源名称可以是方法签名、URL 或服务名称。

规则 围绕应用资源的实时状态,设定规则(Rule)控制资源调用。规则类型包括:流控规则、降级规则、系统保护规则。
流量控制 流控,即流量控制(Flow Control),其原理是监控应用流量的 QPS 或并发线程数等指标,当达到指定的阈值时对流量进行控制,以避免被瞬时的流量高峰冲垮,从而保障应用的高可用性。详见 流量控制(限流)
熔断降级

除了流量控制以外,对调用链路中不稳定的资源进行熔断降级也是重要措施之一。

由于调用关系的复杂性,如果调用链路中的某个资源不稳定,最终会导致请求发生堆积。在调用链路中某个资源出现不稳定状态时(例如调用超时或异常比例升高),熔断降级(Circuit Breaking)会对这个资源的调用进行限制,让请求快速失败,避免影响到其它的资源而导致级联错误。

系统保护 系统保护是从整体维度对应用入口流量进行控制,结合应用的 Load、总体平均 RT、入口 QPS 和线程数等维度的监控指标,让系统的入口流量和系统的负载达到一个平衡,让系统尽可能跑在最大吞吐量的同时保证系统整体的稳定性。
说明 Sentinel 基于 TCP BBR 拥塞控制算法实现流量塑形,对入口流量进行系统保护。