服务架构监控功能可以全面监控硬件层面的指标、识别异常定位,帮助您发现系统瓶颈。本文介绍如何使用服务架构监控功能。

背景信息

通过分析场景配置中API的域名或IP,能识别和监控该账号下与配置场景相关安全层、网络层、VM层和数据层的组件或服务。在压测过程中,能全面监控硬件层面的指标、识别定位异常,帮助您发现系统瓶颈。服务架构监控功能可识别和监控以下数据:

  • 客户端:PTS提供的客户端。
  • 安全层:WAF WEB应用防火墙(仅支持手动添加)、DDoS。
  • 网络层:SLB、弹性公网IP。
  • VM层:ECS。
  • 数据层:RDS。
说明 PTS的云监控集成不会计入云监控查询监控数据API调用数量计费方式,请放心使用。

使用限制

  • 服务架构监控针对不同资源包用户,提供不同数量的可监控实例数。若您当前资源包对应的上限不满足需求,可以先升级资源包。各产品添加监控实例数的限制信息如下表。
    监控实例类型\资源包中的最大并发数规格 5千和1万 5万 10万 20万 50万及以上
    分组数量 后续开放,敬请期待 3 3 5 5
    ECS实例数 后续开放,敬请期待 8 16 16 32
    SLB(IP:PORT)组 后续开放,敬请期待 2 4 4 8
    RDS/Redis实例数 后续开放,敬请期待 2 4 4 8
    其他产品 后续开放,敬请期待 2 2 4 4
  • PTS集成的ECS监控是操作系统级别,监控项需通过插件采集,采集频率为15秒一次。故需先在云监控控制台上安装插件,并确保插件在运行中的状态。具体操作请参见云监控Java版本插件安装
    说明 主账号可以直接安装,子账号需要被授权AdministratorAccess权限。
    安装插件

添加架构监控

  1. 登录PTS控制台,按需完成场景配置和施压配置等配置。
  2. 进入架构监控页面:
    • 进入PTS压测场景的架构监控页面:单击创建压测 > 创建PTS场景,进入PTS创建压测页面,单击架构监控页签。
    • 进入JMeter压测场景的架构监控页面:单击创建压测 > JMeter压测,进入JMeter压测页面,单击添加监控页签。
  3. 添加待监控的组件或服务。
    • PTS自动识别架构监控
      1. 架构监控页签中左上角单击识别图标。
      2. 识别压测业务架构对话框中查看HOST右侧选择需识别的主机。
        说明 识别压测业务架构对话框中展示了单个主机的识别进度,待进度为100%时方可进行下一步。
        识别压测业务架构
      3. 在识别结果中单击目标产品右侧操作列的修改监控对象,并选择需要监控的实例,然后单击确认添加
        说明 若识别出多个需监控的产品,则按此步骤依次添加。
      4. 若有多个需识别的主机,则需切换选择的主机并识别。具体操作请参见子步骤b子步骤c
      5. 单击确认识别
      说明 使用全局识别方式添加需监控的组件或者服务后,仍可使用手动添加方式进行调整。
    • 手动添加架构监控

      JMeter压测和PTS压测均支持手动添加架构监控。

      1. 添加监控页签右上角单击添加分组
      2. 添加分组弹框中填写分组名并单击确认
      3. 在右上角选择地域(Region)。
        说明 若需要在不同的地域(Region)添加监控,需要单击+添加分组,目前一个分组内只支持在一种地域(Region)内添加监控。已经编辑过的地域(Region)地图数据将保留,仅当前地域(Region)数据会在压测中生效。
        添加分组
      4. 单击需添加监控的组件或服务的图标,并在展开区域单击添加
        说明 每个组件可添加的监控资源数有限,可添加的最大数量显示在图标下方,请以界面数量为准。
        添加实例
      5. 添加实例面板中筛选并勾选需添加的实例,并单击添加

        添加实例面板中的实例信息不正确,可单击手动同步刷新数据。

        添加实例1
      说明
      • SLB后端RealServer的IP信息需要配置完整,否则SLB不能被选中添加。
      • SLB的一组IP:PORT视为一个实例。
      • 确保ECS实例的Agent状态是正在进行中,否则无法进行监控。如Agent处于非运行状态,需要在云监控控制台安装插件,或排查问题。
  4. 架构监控设置完成后,单击页面左下角的保存配置保存去压测

查看监控数据

压测过程中,可以实时查看监控数据,以便时刻观察线上负载情况,进行业务合理性判断及异常分析。

在压测过程中,单击架构监控详情页签,在右侧会有查看报错弹框。再单击待查看的组件或服务,在右侧弹框中单击查看详情,即可查看其具体监控数据。以ECS为例,详细监控数据如下图所示。

查看监控数据
说明
  • 默认展现全部已添加的实例信息,单击筛选右侧的下拉框可调整查看对象。
  • 同时查看的对象仅可以是分组或实例,分组与实例不可同时在趋势图中展现。
  • 各实例的监控指标:
    • DDoS:查询高防IP的攻击峰值、查询高防IP的攻击比例图表、查询高防IP的攻击事件、查询高防IP的攻击事件的源攻击IP列表、查询用户域名的CC攻击事件。
    • SLB: 端口新建或丢弃连接数、端口流入或流出带宽、端口活跃或非活跃连接数,端口并发连接数,端口正常或异常ECS数。数据监控周期为一分钟采集一个点。
    • ECS:CPU使用率、内存利用率、公网网卡流入或流出流量、内网网卡流入或流出流量、磁盘IO读或写、load5(5分钟平均负载)。监控周期为一分钟采集一个点。
    • RDS:连接数使用率、CPU使用率、磁盘使用率。监控周期为五分钟采集一个点。

查看压测报告

PTS在压测报告中整合了压测数据,以便在压测结束后分析对比业务数据与负载数据使用,帮助您快速地定位负载或系统等异常。压测报告详情请参见查看压测报告