文档

基础监控

更新时间:

应用部署到Serverless 应用引擎 SAE(Serverless App Engine)后,SAE会对应用所运行设备的请求次数、内存使用率等信息进行数据采集与分析,并以图表的方式展示,方便您实时、直观地了解应用版本所运行设备的状态。本文介绍控制台查看基础监控的方式以及基础监控项的含义。

使用说明

  • 基础监控有1~3分钟的延迟。

  • 无请求,则无监控数据。

前提条件

创建应用

查看基础监控

  1. 登录SAE控制台

  2. 在左侧导航栏,单击应用管理,在顶部菜单栏选择地域,然后在应用列表页面,单击目标应用名称。

  3. 查看基础监控。

    展开查看应用的基础监控。

    在左侧导航栏,单击基础监控,在基础监控页面,筛选时间与资源类型维度,查看对应的监控指标详情。

    该页面默认查询最近15分钟内,所有版本的基础监控指标。如果需要对比不同版本的监控指标,可以单击版本对比,筛选需要对比的版本并查看结果。

    监控指标

    说明

    请求次数(Request Count)

    指定时间内应用版本接收的HTTP请求数量。

    请求响应时间(Request Latency)

    应用版本HTTP请求端到端平均延时(含冷启动)。

    HTTP状态码(HTTP Status)

    返回每个响应状态的HTTP请求的数量,按照类别分组。

    实例数(Active InstancesCount)

    单位时间内活跃实例数和闲置实例数的分布。闲置实例指没有请求的实例,活跃实例指承接流量的实例。

    CPU使用率(CPU Utilization)

    一分钟内应用版本的CPU最小使用率、最大使用率、平均使用率。

    内存使用率(Memory Utilization)

    一分钟内应用版本的内存最小使用率、最大使用率以及平均使用率。

    系统平均负载(1min)

    应用过去1分钟的系统平均负载。

    磁盘使用率(Disk Utilization)

    一分钟内应用版本的磁盘最小使用率、最大使用率以及平均使用率。

    网络收&发数据包(Network Packet)

    单实例单位时间内网络入、出的字节流量。

    实例创建耗时(含健康检查)(Startup Latency)

    启动新容器实例所花费的时间,包含检查HTTP监听端口耗时(应用启动)。

    展开查看应用版本的基础监控。

    在左侧导航栏,单击版本列表,在版本列表页面,单击具体版本名称,然后单击基础监控页签,筛选时间与资源类型维度,查看对应的监控指标详情。

    该页面默认查询最近15分钟内,指定版本的所有实例的监控指标。如果需要切换版本,请回退至版本列表页面查询。

    监控指标

    说明

    请求次数(Request Count)

    指定时间内应用版本接收的HTTP请求数量。

    请求响应时间(Request Latency)

    应用版本HTTP请求端到端平均延时(含冷启动)。

    HTTP状态码(HTTP Status)

    返回每个响应状态的HTTP请求的数量,按照类别分组。

    实例数(Active InstancesCount)

    单位时间内活跃实例数和闲置实例数的分布。闲置实例指没有请求的实例,活跃实例指承接流量的实例。

    CPU使用率(CPU Utilization)

    一分钟内应用版本的CPU最小使用率、最大使用率以及平均使用率。

    内存使用率(Memory Utilization)

    一分钟内应用版本的内存最小使用率、最大使用率以及平均使用率。

    系统平均负载(1min)

    应用过去1分钟的系统平均负载。

    磁盘使用率(Disk Utilization)

    一分钟内应用版本的磁盘最小使用率、最大使用率以及平均使用率。

    网络收&发数据包(Network Packet)

    单实例单位时间内网络入、出的字节流量。

    实例创建耗时(含健康检查)(Startup Latency)

    启动新容器实例所花费的时间,包含检查HTTP监听端口耗时(应用启动)。

基础监控项

基础监控项数据采集频率为每1分钟一次,包含整个实例的监控项。

CPU相关监控项

您可以参考top命令理解下表中监控项的含义。

监控项名称

监控项含义

单位

Statistics

说明

监控级别

CPUUtilizations

当前消耗的总CPU百分比。

%

Maximum、Minimum、Average

当前CPU每60秒的总使用时长百分比。

  • 应用

  • 版本

  • 实例

内存相关监控项

您可以参考free命令理解下表中监控项的含义,数据源:/proc/meminfo

监控项名称

监控项含义

单位

Statistics

说明

监控级别

MemoryUtilizations

内存使用率。

%

Maximum、Minimum、Average

系统已用内存百分比。

/proc/meminfo的(MemTotal-MemAvailable)/MemTotal×100%。

每60秒采样一次。

  • 应用

  • 版本

  • 实例

系统平均负载监控项

您可以参考top命令理解下表中监控项的含义。监控项数值越大,表示系统越繁忙。

监控项名称

监控项含义

单位

Statistics

说明

监控级别

Load1m

过去1分钟的系统平均负载。

Maximum、Minimum、Average

  • 应用

  • 版本

  • 实例

磁盘相关监控项

您可以参考df命令理解下表中监控项的含义。

监控项名称

监控项含义

单位

Statistics

说明

监控级别

DiskUtilizations

磁盘使用率。

%

Maximum、Minimum、Average

所有磁盘已使用的空间。

每60秒采样一次。

  • 应用

  • 版本

  • 实例

网络相关监控项

您可以参考ss命令理解TCP连接数,数据源:/proc/net/sockstat

TCP连接数指ECS主机中所有占用TCP协议的连接。TCP连接数默认采集TCP_TOTAL(总连接数)、ESTABLISHED(正常连接状态)和NOT_ESTABLISHED(非连接的状态连接数,ESTABLISHED以外的所有状态)。

监控项名称

监控项含义

单位

Statistics

说明

监控级别

NetworkRXBytes

过去1分钟的实例收到的流量。

Bytes

Maximum、Minimum、Average

  • 应用

  • 版本

  • 实例

NetworkTXBytes

过去1分钟的实例发送的流量。

Bytes

Maximum、Minimum、Average

  • 应用

  • 版本

  • 实例

NetworkTCPInuse

TCP inuse数。

Count

Maximum、Minimum、Average

/proc/net/sockstat的TCP inuse。

所有不处于TCP_CLOSE状态的TCP连接数,表示正在使用中未开始被关闭的TCP连接。

每60秒采样一次。

  • 应用

  • 版本

  • 实例

NetworkTCPOrphan

TCP orphan数。

Count

Maximum、Minimum、Average

/proc/net/sockstat的TCP orphan。

所有正处于TCP_CLOSE状态的TCP连接数,表示正在关闭TCP但未完成的链接数。

每60秒采样一次。

  • 应用

  • 版本

  • 实例

NetworkTCPTw

TCP tw数。

Count

Maximum、Minimum、Average

/proc/net/sockstat的TCP tw。

所有正处于TIME_WAIT状态的TCP数。

每60秒采样一次。

  • 应用

  • 版本

  • 实例

NetworkTCPAlloc

TCP alloc数。

Count

Maximum、Minimum、Average

/proc/net/sockstat的TCP alloc。

所有已创建的TCP数。

包含IPv4与IPv6。

每60秒采样一次。

  • 应用

  • 版本

  • 实例

NetworkTCPTotalConnections

各种状态下的TCP总连接数。

Count

Maximum、Minimum、Average

/proc/net/sockstat的TCP alloc+tw。

每60秒采样一次。

  • 应用

  • 版本

  • 实例

NetworkTCPActiveConnections

活跃的TCP连接数。

Count

Maximum、Minimum、Average

CurrEstab。

每60秒采样一次。

  • 应用

  • 版本

  • 实例

NetworkTCPInactiveConnections

非活跃的TCP连接数。

Count

Maximum、Minimum、Average

总连接数-活跃连接数。

每60秒采样一次。

  • 应用

  • 版本

  • 实例

请求相关监控项

您可以参考nginx的日志access_log理解下表中监控项的含义。

实例数为是否处理请求的采样统计监控项。

监控项名称

监控项含义

单位

Statistics

说明

监控级别

Requests

过去1分钟的所有请求数量。

Count

Count

  • 应用

  • 版本

  • 实例

Latency

过去1分钟的所有请求的延迟统计。

毫秒

Maximum、Minimum、Average

  • 应用

  • 版本

  • 实例

MaxConcurrentRequests

每个容器实例在1分钟内服务的最大并发请求数的分布。

Count

Count

每60秒采样一次。

  • 应用

  • 版本

HTTPStatus2xx

HTTPStatus3xx

HTTPStatus4xx

HTTPStatus5xx

过去1分钟的所有请求按照HTTP状态的统计。

Count

Count

HTTP状态

  • HTTP 2XX

  • HTTP 3XX

  • HTTP 4XX

  • HTTP 5XX

  • 应用

  • 版本

  • 实例

Instances

总实例数,包含活跃+非活跃。

Sum

每60秒采样一次。

  • 应用

  • 版本

InstancesActive

活跃实例数。

Sum

正在处理请求的实例数。

每60秒采样一次。

  • 应用

  • 版本

InstancesIdle

非活跃实例数。

Sum

正在闲置,未处理请求的实例数。

每60秒采样一次。

  • 应用

  • 版本

StartupLatency

启动新容器实例所花费的时间。

毫秒

Maximum、Minimum、Average

包含检查HTTP监听端口耗时,即应用启动监听耗时。

  • 应用

  • 版本