服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,可以更直观地了解压测业务的状态。本文介绍如何创建SLA。
背景信息
PTS基于多年的业务沉淀,制定了一些行业通用SLA模板,您可以直接在压测中使用。更多信息,请参见通用SLA模板。
除此之外,您也可以自定义符合业务需要的SLA规则,应用到特定的压测场景中。本文将介绍如何创建自定义的SLA规则。您可以设置量化指标、设置触发报警或停止压测的条件,便于实现智能化的压测。
名词解释
在使用该功能时,请先了解PTS对于SLA相关名词的说明。
- SLA
- 服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,您可以更直观地了解压测业务或架构的状态。
- SLA指标
- SLA指标是指从哪些指标监控压测过程数据,主要包括业务质量相关指标、ECS、RDS和SLB监控类指标。PTS将在后续迭代中逐步增加队列、SQL连接等方面的SLA指标。
- SLA规则
- SLA规则是在SLA指标的基础上,添加了判断条件,以触发告警或停止压测。
- SLA模板
- SLA模板是SLA规则的集合,可包含一个或多个SLA规则。SLA模板与行业类型绑定。
SLA指标
SLA指标是指从哪些指标监控压测过程数据,详细指标说明见下表。
SLA指标类型 | SLA指标项 | SLA指标项说明 | 最小监控粒度 |
---|---|---|---|
业务质量相关指标 | RT (Response Time) | 压测中API的响应时间。 | 1秒 |
RPS (Requests per Second) | 压测中,每秒发出的压测请求数量。 | ||
成功率 | 压测中API的请求成功率。 | ||
ECS基础监控相关指标 | CPU利用率 | 即CPU使用率,指一段时间内CPU被占用的情况。 | 1分钟 |
内存利用率 | 一段时间内内存被占用的情况。 | ||
load5 | 5分钟内系统的平均负荷。 | ||
RDS基础监控相关指标 | CPU利用率 | 即CPU使用率,指一段时间内CPU被占用的情况。 | 5分钟 |
连接利用率 | 连接数是指应用程序可以连接到RDS实例的数量。连接利用率即已经使用的连接数百分率。 | ||
SLB基础监控相关指标 | 丢弃连接数 | 端口丢弃的连接数,从IP:Port维度进行统计。 | 1分钟 |
异常后端Server | 例如,后端异常ECS实例个数 |
自定义SLA操作步骤
除了通用SLA之外,您也可以自定义符合业务需要的SLA规则,应用到特定的压测场景中。自定义SLA模板步骤如下:
- 登录PTS控制台,在左侧导航栏选择 。
-
在SLA管理页面,单击自定义SLA页签,单击创建SLA。
说明 如果您要基于某个通用SLA模板自定义SLA,可在SLA管理页的SLA模板页签下,单击目标SLA操作列的复制到自定义,克隆目标SLA至自定义SLA页面,再对其进行编辑。 -
在创建SLA面板,填写自定义的SLA名称、SLA说明,并选择该SLA适用的业务类型。
- 单击+添加规则,在添加SLA规则对话框中,设置具体信息,然后单击确定。
参数 描述 规则名称 自定义规则的名称。 指标名称 选择具体指标,如业务指标,RT。 阈值及报警级别 选中并设定触发报警、停止压测的具体阈值。 - 警告通知:满足条件时,通知报警接收人。
- 停止压测:满足条件时,立即停止压测,并通知报警接收人。
设置每个条件的敏感度 - 敏感,连续一次:压测过程中,该指标只要一次符合报警或停止压测的条件,即触发报警或停止压测。
- 可容忍,连续三次:压测过程中,该指标连续出现3次,符合报警或停止压测的条件,即触发报警或停止压测。
- 不敏感,连续五次:压测过程中,该指标连续出现5次,符合报警或停止压测的条件,即触发报警或停止压测。
说明 压测中每隔5秒统计一次RT、RPS和成功率的数据。 - 在创建SLA面板中,再次单击确定,完成创建。
在自定义SLA页签下的列表中,可以查看创建的SLA。
相关操作
- 使用SLA
创建压测场景时,直接将通用SLA或自定义SLA应用到具体API上。具体操作,请参见配置场景SLA。
- 编辑SLA
在自定义SLA页签下的列表中,单击某个自定义SLA 操作列的编辑,可修改名称、描述和规则等信息。
- 删除SLA
在自定义SLA页签下的列表中,单击某个自定义SLA 操作列的删除,可删除该SLA。
在文档使用中是否遇到以下问题
更多建议
匿名提交