SLA概述

服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,可以更直观地了解压测业务的状态。

背景信息

PTS制定了一些行业通用SLA模板,您可以直接在压测中使用。更多信息,请参见通用SLA模板

除此之外,您也可以自定义符合业务需要的SLA规则,应用到特定的压测场景中。具体操作,请参见配置SLA

名词解释

在使用该功能时,请先了解PTS对于SLA相关名词的说明。

  • SLA

    • 服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,您可以更直观地了解压测业务或架构的状态。

  • SLA指标

    • SLA指标是指从哪些指标监控压测过程数据,主要包括业务质量相关指标、ECS、RDS和SLB监控类指标。PTS将在后续迭代中逐步增加队列、SQL连接等方面的SLA指标。

  • SLA规则

    • SLA规则是在SLA指标的基础上,添加了判断条件,以触发告警或停止压测。

  • SLA模板

    • SLA模板是SLA规则的集合,可包含一个或多个SLA规则。SLA模板与行业类型绑定。

SLA指标

SLA指标是指从哪些指标监控压测过程数据,详细指标说明见下表。

SLA指标类型

SLA指标项

SLA指标项说明

最小监控粒度

业务质量相关指标

RT (Response Time)

压测中API的响应时间。

1秒

RPS (Requests per Second)

压测中,每秒发出的压测请求数量。

成功率

压测中API的请求成功率。

ECS基础监控相关指标

CPU利用率

即CPU使用率,指一段时间内CPU被占用的情况。

1分钟

内存利用率

一段时间内内存被占用的情况。

load5

5分钟内系统的平均负荷。

RDS基础监控相关指标

CPU利用率

即CPU使用率,指一段时间内CPU被占用的情况。

5分钟

连接利用率

连接数是指应用程序可以连接到RDS实例的数量。连接利用率即已经使用的连接数百分率。

SLB基础监控相关指标

丢弃连接数

端口丢弃的连接数,从IP:Port维度进行统计。

1分钟

异常后端Server

例如,后端异常ECS实例个数