服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,可以更直观地了解压测业务的状态。本文介绍如何创建SLA。

背景信息

PTS基于多年的业务沉淀,制定了一些行业通用SLA模板,您可以直接在压测中使用,具体可参见通用SLA模板

除此之外,您也可以自定义符合业务需要的SLA规则,应用到特定的压测场景中。本文将介绍如何创建自定义的SLA规则。您可以设置量化指标、设置触发报警或停止压测的条件,便于实现智能化的压测。

名词解释

在使用该功能时,请先了解PTS对于SLA相关名词的说明。

SLA
服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,您可以更直观地了解压测业务或架构的状态。
SLA指标
SLA指标是指从哪些指标监控压测过程数据,主要包括业务质量相关指标、ECS、RDS和SLB监控类指标。PTS将在后续迭代中逐步增加队列、SQL连接等方面的SLA指标。
SLA规则
SLA规则是在SLA指标的基础上,添加了判断条件,以触发告警或停止压测。
SLA模板
SLA模板是SLA规则的集合,可包含一个或多个SLA规则。SLA模板与行业类型绑定。

SLA指标

SLA指标是指从哪些指标监控压测过程数据,详细指标说明见下表。

SLA指标类型 SLA指标项 SLA指标项说明 最小监控粒度
业务质量相关指标 RT (Response Time) 压测中API的响应时间。 1秒
RPS (Requests per Second) 压测中,每秒发出的压测请求数量。
成功率 压测中API的请求成功率。
ECS基础监控相关指标 CPU利用率 即CPU使用率,指一段时间内CPU被占用的情况。 1分钟
内存利用率 一段时间内内存被占用的情况。
load5 5分钟内系统的平均负荷。
RDS基础监控相关指标 CPU利用率 即CPU使用率,指一段时间内CPU被占用的情况。 5分钟
连接利用率 连接数是指应用程序可以连接到RDS实例的数量。连接利用率即已经使用的连接数百分率。
SLB基础监控相关指标 丢弃连接数 端口丢弃的连接数,从IP:Port维度进行统计。 1分钟
异常后端Server 例如,后端异常ECS实例个数

自定义SLA操作步骤

除了通用SLA之外,您也可以自定义符合业务需要的SLA规则,应用到特定的压测场景中。自定义SLA模板步骤如下:

  1. 登录PTS控制台,在左侧导航栏单击SLA管理
  2. SLA管理页面,选择自定义SLA页签,单击右上角创建SLA

    说明 如果您要基于某个通用SLA模板自定义SLA,可在 SLA管理SLA模板页签下,单击目标SLA 操作列的 复制到自定义,克隆目标SLA至自定义SLA页面,再对其进行编辑。
  3. 在创建SLA页面,填写自定义的SLA名称、SLA描述,并选择该SLA适用的业务类型。

  4. 单击+添加SLA规则,在添加SLA规则窗口中,设置具体信息。
    参数 描述
    规则名称 自定义规则的名称。
    指标名称 选择具体指标,如业务指标,RT。
    阈值及报警级别 选中并设定触发报警、停止压测的具体阈值。
    • 警告通知:满足条件时,通知报警接收人。
    • 停止压测:满足条件时,立即停止压测,并通知报警接收人。
    设置每个条件的敏感度。
    • 敏感,连续一次:压测过程中,该指标只要一次符合报警或停止压测的条件,即触发报警或停止压测。
    • 可容忍,连续三次:压测过程中,该指标连续出现3次,符合报警或停止压测的条件,即触发报警或停止压测。
    • 不敏感,连续五次:压测过程中,该指标连续出现5次,符合报警或停止压测的条件,即触发报警或停止压测。
    说明 压测中每隔5秒统计一次RT、RPS和成功率的数据。
  5. 添加SLA规则窗口中,单击确定
  6. 创建SLA面板中,再次单击确定,完成创建。

    自定义SLA页签下的列表中,可以查看创建的SLA。

后续步骤

  • 使用SLA

    创建压测场景时,直接将通用SLA或自定义SLA应用到具体API上。具体操作步骤请参见配置场景SLA

  • 编辑SLA

    自定义SLA页签下的列表中,单击某个自定义SLA 操作列的编辑,可修改名称、描述和规则等信息。

  • 删除SLA

    自定义SLA页签下的列表中,单击某个自定义SLA 操作列的删除,可删除该SLA。

更多信息