服务架构监控功能可以全面监控硬件层面的指标、识别定位异常,帮助您发现系统瓶颈。本文介绍如何使用服务架构监控功能。

背景信息

通过分析场景配置中 API 的域名或 IP,能识别和监控该账号下与配置场景相关安全层、网络层、VM 层和数据层的组件或服务。在压测过程中,能全面监控硬件层面的指标、识别定位异常,帮助您发现系统瓶颈。服务架构监控功能可识别和监控以下数据:

  • 客户端:PTS 提供的客户端。
  • 安全层:WAF WEB应用防火墙(仅支持手动添加)、DDoS。
  • 网络层:SLB、弹性公网 IP。
  • VM 层:ECS。
  • 数据层:RDS。
说明 PTS 的云监控集成不会计入云监控查询监控数据API调用数量计费方式,请放心使用。

使用限制

  • 服务架构监控针对不同资源包用户,提供不同数量的可监控实例数,详见下表。若您当前资源包对应的上限不满足需求,可以先升级资源包
    监控实例类型\资源包大小 278 628 1058 8398 13998 58158 及以上
    ECS 实例数 4 8 8 16 16 32
    RDS 实例数 1 2 2 4 4 8
    SLB (IP:Port)组 1 2 2 4 4 8
  • PTS 集成的 ECS 监控是操作系统级别,监控项需通过插件采集,采集频率为 15 秒一次。故需先在云监控控制台上安装插件,并确保插件在运行中的状态。具体操作请参见云监控Java版本插件安装
    说明 主账号可以直接安装,子账号需要被授权 AdministratorAccess 权限。
    安装插件

添加架构监控

  1. 登录 PTS 控制台,按需完成场景配置和施压配置等配置。
  2. 编辑场景页面单击架构监控页签。
  3. 选择一下任意一种方式添加待监控的组件或服务。
    • 全局识别方式
      说明 公测期间,邀约用户均可使用全局识别方式。正式发布后,则按照资源包等级权限控制。
      1. 架构监控页签中单击识别图标。
      2. 识别压测业务架构对话框中查看 HOST 右侧选择需识别的主机。
        说明 识别压测业务架构对话框中展示了单个主机的识别进度,待进度为 100% 时方可进行下一步。
        识别压测业务架构
      3. 在识别结果中单击目标产品右侧操作列的修改监控对象,并选择需要监控的实例,然后单击确认添加
        说明 若识别出多个需监控的产品,则按此步骤依次添加。
      4. 若有多个需识别的主机,则需切换选择的主机并识别。具体操作请参见子步骤 b子步骤 c
      5. 单击确认识别
      说明 使用全局识别方式添加需监控的组件或者服务后,仍可使用手动添加方式进行调整。
    • 手动添加方式

      本操作以添加 ECS 监控为例。

      1. 架构监控页签右上角单击添加业务分组
      2. 创建分组弹框中填写分组名称并单击确定
      3. 在新建业务组中单击需添加监控的组件或服务的图标,并在展开区域单击添加添加架构监控
      4. 添加实例面板中筛选并勾选需添加的实例,并单击添加

        添加实例面板中的实例信息不正确,可单击手动同步刷新数据。

        添加实例面板
      说明
      • SLB 后端 RealServer 的 IP 信息需要配置完整,否则 SLB 不能被选中添加。
      • SLB 的一组 IP:PORT 视为一个实例。
      • 确保 ECS 实例的 Agent 状态是 正在进行中,否则无法进行监控。如 Agent 处于非运行状态,需要在云监控控制台安装插件,或排查问题。
  4. 编辑场景页面右上角单击保存去压测

查看监控数据

压测过程中,可以实时查看监控数据,以便时刻观察线上负载情况,进行业务合理性判断及异常分析。

在压测过程中页面,单击监控详情页签,再单击待查看的组件或服务,在右下角弹框中单击查看详情,即可查看其具体监控数据。以 ECS 为例,详细监控数据如下图所示。

ex_架构感知数据
说明
  • 默认展现全部已添加的实例信息,单击筛选右侧的下拉框可调整查看对象。
  • 同时查看的对象仅可以是分组或实例,分组与实例不可同时在趋势图中展现。
  • 各实例的监控指标:
    • DDoS:查询高防 IP 的攻击峰值、查询高防 IP 的攻击比例图表、查询高防 IP 的攻击事件、查询高防 IP 的攻击事件的源攻击 IP 列表、查询用户域名的 CC 攻击事件。
    • SLB: 端口新建/丢弃连接数、端口流入/流出带宽、端口活跃/非活跃连接数,端口并发连接数,端口正常/异常ECS数。数据监控周期为一分钟采集一个点。
    • ECS:CPU 使用率、内存利用率、公网网卡流入/流出流量、内网网卡流入/流出流量、磁盘 IO 读/写、load5(5 分钟平均负载)。监控周期为一分钟采集一个点。
    • RDS:连接数使用率、CPU 使用率、磁盘使用率。监控周期为五分钟采集一个点。

查看压测报告

PTS 在压测报告中整合了压测数据,以便在压测结束后分析对比业务数据与负载数据使用,帮助您快速地定位负载或系统等异常。压测报告详情请参见查看压测报告