当SAE专业版应用开启应用监控后,ARMS服务即可对应用进行监控,在应用概览页面可以查看请求数、错误数、平均耗时和实例数指标信息。
大盘说明
为应用开启应用监控后,在应用概览页签会生成监控大盘,大盘将展示请求数、错误数、平均耗时和实例数这四个监控项的实时数据。
面板 | 样式 | 说明 |
请求数 | 翻牌器 | 应用在指定时间段的请求数总和。 日同比:应用在指定时间段的请求数同比前一日在相同时间段的请求数增减的百分比。 |
错误数 | 翻牌器 | 应用在指定时间段的错误数总和。 日同比:应用在指定时间段的错误数同比前一日在相同时间段的错误数增减的百分比。 |
平均耗时 | 翻牌器 | 应用在指定时间段的平均耗时。 日同比:应用在指定时间段的平均耗时同比前一日在相同时间段的平均耗时增减的百分比。 |
实例数 | 翻牌器 | 应用在指定时间段的实例数总和。 日同比:应用在指定时间段的实例数同比前一日在相同时间段的实例数增减的百分比。 |
请求数 | 柱状图 | 应用在指定时间段的请求数趋势,按照调用类型分类做堆叠展示。 |
错误数 | 柱状图/趋势图 | 错误数:应用在指定时间段的错误数趋势,以柱状图展示,左侧坐标为错误数单位。 错误率:应用在指定时间段的错误率趋势,右侧坐标为错误率单位。 |
耗时 | 趋势图 | 应用在指定时间段的耗时趋势,提供平均耗时、P99、P90、P75趋势。 |
CPU使用率峰值 | 蜂窝图 | 应用在指定时间段的主机CPU使用率峰值。 状态区分为:
|
请求数提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口请求总数TOP 5。 提供服务的调用类型包含:
|
错误数提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口错误总数TOP 5。 提供服务的调用类型包含:
|
平均耗时提供服务排行 | TOP 5 | 应用在指定时间段提供服务的接口平均耗时TOP 5。 提供服务的调用类型包含:
|
CPU使用率峰值实例排行 | TOP 5 | 应用在指定时间段CPU使用率最高的主机。 |
面板功能说明
行动点
单击趋势图面板上的图标,可以查看分组对比以及历史时间对比。
分组选项分为基础字段和实例标签:
基础字段:所有指标里公共的Label,目前主要透出serverIp用于分组对比。
实例标签:除了默认实例标签外,您可以添加自定义实例标签扩展更多分组对比能力。具体操作,请参见添加并使用标签。
对比时间:选择对比时间段和当前时间段进行对比。
查询语句
单击面板上的图标,可以查看对应面板的PromQL。您可以在Prometheus或Grafana中直接使用获取到的PromQL,完成自定义配置。
常见问题
P99分位数耗时无数据
分位数指标默认关闭,如需查看分位数数据,请在自定义配置页面打开分位数统计功能,具体操作,请参见Java应用自定义配置。
旧版控制台应用概览页面总请求量与最近五分钟数据加和不一致
ARMS页面展示的数据一般要比用户实际选择的时间区间往前多取一分钟的数据,最近五分钟实际会展示6分钟的数据,最近30分钟实际会展示31分钟的数据。
旧版控制台应用概览页面慢SQL数与通过POP接口查询出的不一致
POP查询慢SQL时,同时查询了数据库及NoSQL数据库、缓存相关的慢请求数据,但是控制台仅查询了数据库相关的慢请求数据,所以会有差异。
如需使pop查询到的数据和控制台页面展示的数据相同,可在查询时添加rpcType相关的过滤条件。
示例:
QueryMetricByPageRequest.Filters filters2 = QueryMetricByPageRequest
.Filters
.builder()
.key("rpcType")
.value("60|62|63|65|66|67|68|69|58|59")
.build();
实例数大于实际运行的数量
如果查询时间过长,则已经销毁的实例也会被计算到实例数中。
新版控制台应用概览页面和旧版控制台应用总览页面的总请求数对不上
新版控制台的应用概览页面以提供服务视角做展示,包含了定时任务,旧版控制台的应用总览页面并不包含定时任务数据。