服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,可以更直观地了解压测业务的状态。

背景信息

PTS制定了一些行业通用SLA模板,您可以直接在压测中使用。更多信息,请参见通用SLA模板

除此之外,您也可以自定义符合业务需要的SLA规则,应用到特定的压测场景中。具体操作,请参见配置SLA

名词解释

在使用该功能时,请先了解PTS对于SLA相关名词的说明。

SLA
服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,您可以更直观地了解压测业务或架构的状态。
SLA指标
SLA指标是指从哪些指标监控压测过程数据,主要包括业务质量相关指标、ECS、RDS和SLB监控类指标。PTS将在后续迭代中逐步增加队列、SQL连接等方面的SLA指标。
SLA规则
SLA规则是在SLA指标的基础上,添加了判断条件,以触发告警或停止压测。
SLA模板
SLA模板是SLA规则的集合,可包含一个或多个SLA规则。SLA模板与行业类型绑定。

SLA指标

SLA指标是指从哪些指标监控压测过程数据,详细指标说明见下表。

SLA指标类型 SLA指标项 SLA指标项说明 最小监控粒度
业务质量相关指标 RT (Response Time) 压测中API的响应时间。 1秒
RPS (Requests per Second) 压测中,每秒发出的压测请求数量。
成功率 压测中API的请求成功率。
ECS基础监控相关指标 CPU利用率 即CPU使用率,指一段时间内CPU被占用的情况。 1分钟
内存利用率 一段时间内内存被占用的情况。
load5 5分钟内系统的平均负荷。
RDS基础监控相关指标 CPU利用率 即CPU使用率,指一段时间内CPU被占用的情况。 5分钟
连接利用率 连接数是指应用程序可以连接到RDS实例的数量。连接利用率即已经使用的连接数百分率。
SLB基础监控相关指标 丢弃连接数 端口丢弃的连接数,从IP:Port维度进行统计。 1分钟
异常后端Server 例如,后端异常ECS实例个数