服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,可以更直观地了解压测业务的状态。
背景信息
PTS制定了一些行业通用SLA模板,您可以直接在压测中使用。更多信息,请参见通用SLA模板。
除此之外,您也可以自定义符合业务需要的SLA规则,应用到特定的压测场景中。具体操作,请参见配置SLA。
名词解释
在使用该功能时,请先了解PTS对于SLA相关名词的说明。
SLA
服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,您可以更直观地了解压测业务或架构的状态。
SLA指标
SLA指标是指从哪些指标监控压测过程数据,主要包括业务质量相关指标、ECS、RDS和SLB监控类指标。PTS将在后续迭代中逐步增加队列、SQL连接等方面的SLA指标。
SLA规则
SLA规则是在SLA指标的基础上,添加了判断条件,以触发告警或停止压测。
SLA模板
SLA模板是SLA规则的集合,可包含一个或多个SLA规则。SLA模板与行业类型绑定。
SLA指标
SLA指标是指从哪些指标监控压测过程数据,详细指标说明见下表。
SLA指标类型  | SLA指标项  | SLA指标项说明  | 最小监控粒度  | 
业务质量相关指标  | RT (Response Time)  | 压测中API的响应时间。  | 1秒  | 
RPS (Requests per Second)  | 压测中,每秒发出的压测请求数量。  | ||
成功率  | 压测中API的请求成功率。  | ||
ECS基础监控相关指标  | CPU利用率  | 即CPU使用率,指一段时间内CPU被占用的情况。  | 1分钟  | 
内存利用率  | 一段时间内内存被占用的情况。  | ||
load5  | 5分钟内系统的平均负荷。  | ||
RDS基础监控相关指标  | CPU利用率  | 即CPU使用率,指一段时间内CPU被占用的情况。  | 5分钟  | 
连接利用率  | 连接数是指应用程序可以连接到RDS实例的数量。连接利用率即已经使用的连接数百分率。  | ||
SLB基础监控相关指标  | 丢弃连接数  | 端口丢弃的连接数,从IP:Port维度进行统计。  | 1分钟  | 
异常后端Server  | 例如,后端异常ECS实例个数  |