服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,可以更直观地了解压测业务的状态。
背景信息
PTS制定了一些行业通用SLA模板,您可以直接在压测中使用。更多信息,请参见通用SLA模板。
除此之外,您也可以自定义符合业务需要的SLA规则,应用到特定的压测场景中。具体操作,请参见配置SLA。
名词解释
在使用该功能时,请先了解PTS对于SLA相关名词的说明。
SLA
服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,您可以更直观地了解压测业务或架构的状态。
SLA指标
SLA指标是指从哪些指标监控压测过程数据,主要包括业务质量相关指标、ECS、RDS和SLB监控类指标。PTS将在后续迭代中逐步增加队列、SQL连接等方面的SLA指标。
SLA规则
SLA规则是在SLA指标的基础上,添加了判断条件,以触发告警或停止压测。
SLA模板
SLA模板是SLA规则的集合,可包含一个或多个SLA规则。SLA模板与行业类型绑定。
SLA指标
SLA指标是指从哪些指标监控压测过程数据,详细指标说明见下表。
SLA指标类型 | SLA指标项 | SLA指标项说明 | 最小监控粒度 |
业务质量相关指标 | RT (Response Time) | 压测中API的响应时间。 | 1秒 |
RPS (Requests per Second) | 压测中,每秒发出的压测请求数量。 | ||
成功率 | 压测中API的请求成功率。 | ||
ECS基础监控相关指标 | CPU利用率 | 即CPU使用率,指一段时间内CPU被占用的情况。 | 1分钟 |
内存利用率 | 一段时间内内存被占用的情况。 | ||
load5 | 5分钟内系统的平均负荷。 | ||
RDS基础监控相关指标 | CPU利用率 | 即CPU使用率,指一段时间内CPU被占用的情况。 | 5分钟 |
连接利用率 | 连接数是指应用程序可以连接到RDS实例的数量。连接利用率即已经使用的连接数百分率。 | ||
SLB基础监控相关指标 | 丢弃连接数 | 端口丢弃的连接数,从IP:Port维度进行统计。 | 1分钟 |
异常后端Server | 例如,后端异常ECS实例个数 |