服务指标

应用监控提供了应用分析能力,服务指标将应用相关的 Error、Service、SAL、CAL、DAL 等服务指标进行聚合透出,从 IDC(机房)/LDC(单元化)/单机 的空间分布和时间分布上进行对比分析,一个入口总览分析应用相关的所有监控数据。

单击控制台左侧边栏 应用监控,选择 我的应用全部应用,单击某个应用后,会进入应用监控详情页面。

从服务维度展示应用监控结果时,您可以分别从 IDC(机房)/LDC(单元化)/单机 三个视角配置和监测以下监控指标:

指标名称

说明

单位

配置要求

cal

缓存访问,用来监控应用访问缓存的相关指标。

SOFA 框架中默认使用 /home/admin/logs/tracelog/zdal-tair-stat.log 日志文件。自定义配置中可以使用自己设定的日志文件,要求日志文件中必须有:数据源、结果、耗时、计数。

样例日志为:2015-04-19 21:56:16.627,Test,Tair,1,0,Y,T 2015-04-19 21:56:16.628,Test,Tair,1,20,N,F

样例日志格式如下:

• 日志打印时间

• 当前应用名

• 逻辑 Tair 名

• 本段时间内的请求数量

• 本段时间内的请求总耗时

• 结果信息(Y/N)

• 全链路压测标志(T/F)

error

应用错误。 用来监控应用中错误日志数量,统计错误变化趋势。 应用监控中可直接单击错误查看相关日志。

SOFA 框架中默认使用 /home/admin/logs/stderr.log/home/admin/logs/{app}/common-error.log 日志文件。自定义配置中可以使用自己设定的日志文件,对文件中的行数按分钟进行计数。

pv

页面访问量。用来监控应用中页面被调用次数。

SOFA 框架中默认使用 /home/admin/logs/tracelog/sofa-mvc-stat.log。自定义配置中可以使用自己设定的日志文件,要求日志文件中必须有 url结果耗时访问计数 几项值。

样例日志为:2014-09-01 00:03:22.559,tbapi,http://tbapi.alipay.com/trade/batch_payment.htm,GET,2,11,Y,F

样例日志格式如下:

• 日志打印时间

• 当前应用名

• 请求 URL

• 请求方法

• 本段时间内请求次数

• 本段时间内的请求总耗时

• 请求结果(1 开头和 2 开头的结果码表示成功,302 表示的重定向算成功,其他代表失败)

• 压测标记

service

应用服务被调用,用来监控应用中服务被调用情况。在一个面向服务架构(SOA)中,系统之间有复杂的服务依赖关系。Service 表示某个系统所暴露的服务被其他系统调用的统计数值。

SOFA 框架中默认使用 /home/admin/logs/tracelog/rpc-server-stat.log。自定义配置中可以使用自己设定的日志文件,要求日志文件中必须有:来源应用、接口、方法、结果、耗时、计数。

样例日志为:2014-06-19 17:14:02.186,client,client,com.alipay.cloudenginetest.services.SofaApiWebReferenceLocalFalseTrService:1.0,service_method,1,7,Y,T,GZ00B 2014-06-19 17:15:02.190,client,client,com.alipay.cloudenginetest.services.SofaApiWebReferenceLocalFalseTrService:1.0,service_method,1,12,Y,F,GZ00B

样例日志格式如下:

• 日志打印时间

• fromApp

• toApp(即 currentApp)

• 服务名

• 方法名

• 本段时间内的被调用次数

• 本段时间内的请求处理总耗时

• 结果(Y/N)

• 全链路压测标志(T/F)

• 调用者 Zone

sal

调用外部的服务( Service Access Layer(SAL)),用来监控应用调用其他服务的指标。在一个面向服务架构(SOA)中,系统之间有复杂的服务依赖关系。SAL 表示某个系统调用其他系统暴露的服务的统计数值。

SOFA 框架中默认使用 /home/admin/logs/tracelog/rpc-client-stat.log。自定义配置中可以使用自己设定的日志文件,要求日志文件中必须有:机房、目标应用、接口、方法、结果、耗时、计数。

样例日志为:2014-06-19 17:14:02.186,client,client,com.alipay.cloudenginetest.services.SofaApiWebReferenceLocalFalseTrService:1.0,service_method,1,79,Y,T,RZ00B 2014-06-19 17:09:02.146,client,,com.alipay.core.service.lazy.LazyPublisherWsService:1.0,service_method,1,26,N,F,RZ00B

样例日志格式如下:

• fromApp(即 currentApp)

• toApp

• 服务名

• 方法名

• 本段时间内调用次数

• 本段时间内的调用总耗时

• 结果(Y/N)

• 全链路压测标志(T/F)

• 目标 Zone

ceThread

容器线程繁忙 running 状态的线程数

应用日志(自定义日志文件) 配置于 CE Thread 容器线程繁忙。样例日志为:2014-07-10 00:01:01,316 [CE-RES-MONITOR] - (0,1,79,80,) 2014-07-10 00:01:31,316 [CE-RES-MONITOR] - (0,0,80,80,)

格式为:blockQueue active idle poolSize

dal

数据库服务(Data Access Layer(DAL)),用来监控应用访问数据库的相关指标。大部分应用系统会涉及数据库访问,DAL 表示某个系统对数据库访问调用的统计数值。

SOFA 框架中默认使用 /home/admin/logs/tracelog/zdal-db-stat.log。每一分钟打印一次统计日志。自定义配置中可以使用自己设定的日志文件,要求日志文件中必须有:数据源、库、表、结果、耗时、计数。

样例日志为:2015-05-11 20:03:30.487,Test,DataSourceName,LogDatabaseName,tableName,mysql,2,27,N,F 2015-05-11 20:03:30.487,Test,DataSourceName,LogDatabaseName,tableName,mysql,1,0,Y,

样例日志格式如下:

• 日志打印时间

• 当前应用名

• 数据源名称

• 逻辑库名称

• 表名

• 数据库类型

• 本段时间内的请求数量

• 本段时间内的请求总耗时

• 结果信息(Y/N)

• 全链路压测标志(T/F)

sql

SQL 耗时监测 ,用来监控应用访问数据库的 SQL 执行情况,包括查找慢 SQL。

SOFA 框架中默认日志:/home/admin/logs/tracelog/zdal-db-digest.log。自定义配置中可以使用自己设定的日志文件,要求日志文件中必须有:数据库、SQL、耗时、事务 ID。

flowlimit

限流

框架配置日志。文件采集路径 /home/admin/logs/{app}/guardian/guardian-limit-stat.log

msgpub

消息推送

框架配置日志。文件采集路径 /home/admin/logs/tracelog/msg-pub-stat.log

样例日志为:2018-12-07 16:21:40.168,,TP-openmq-chengyi-1,MQ-PRODUCER-GROUP,8,307,Y,F

样例日志格式如下:

• 日志打印时间

• currentApp

• topic

• pubGroupId

• 本段时间内的消息发送数量

• 本段时间内的消息发送

• 总耗时

• 结果信息(Y/N)

• 全链路压测标志(T/F)

msgsub

消息订阅

框架配置日志。文件采集路径 /home/admin/logs/tracelog/msg-sub-stat.log

样例日志为:2018-12-07 16:23:54.187,,TP-openmq-chengyi-1,S_openmq_chengyi_0,16,67,N,FF

样例日志格式如下:

• 日志打印时间

• currentApp

• topic

• subGroupId

• 本段时间内的消息接收数量

• 本段时间内的消息接收

• 总耗时

• 结果信息(Y/N)

• 全链路压测标志(T/F)

servicePressure

压测应用服务被调用

框架配置日志,该监控项不支持自定义。文件采集路径 /home/admin/logs/tracelog/shadow/rpc-server-stat.log

salPressure

压测调用外部服务

框架配置日志,该监控项不支持自定义。文件采集路径 /home/admin/logs/tracelog/shadow/rpc-client-stat.log

pvPressure

压测 PV

框架配置日志,该监控项不支持自定义。文件采集路径 /home/admin/logs/tracelog/shadow/sofa-mvc-stat.log

dalPressure

压测调用 DB 服务

框架配置日志,该监控项不支持自定义。文件采集路径 /home/admin/logs/tracelog/shadow/zdal-db-stat.log

calPressure

调用缓存服务

框架配置日志,该监控项不支持自定义。文件采集路径 /home/admin/logs/tracelog/shadow/zdal-tair-stat.log

msgpubPressure

压测消息发布

框架配置日志,该监控项不支持自定义。文件采集路径 /home/admin/logs/tracelog/shadow/msg-pub-stat.log

msgsubPressure

压测消息订阅

框架配置日志,该监控项不支持自定义。文件采集路径 /home/admin/logs/tracelog/shadow/msg-sub-stat.log

mosnservice

MOSN 应用服务被调用

框架配置日志。文件采集路径 /home/admin/logs/tracelog/mosn/rpc-server-stat.log

插件类型为:SPM

日志格式如下:

• 日志打印时间

• fromApp

• toApp(即 currentApp)

• 服务名

• 方法名

• 本段时间内的被调用次数

• 本段时间内的请求处理总耗时

• 结果(Y/N)

• 全链路压测标志(T/F)

• 调用者 Zone

mosnsal

MOSN 调用外部服务

框架配置日志。文件采集路径 /home/admin/logs/tracelog/mosn/rpc-client-stat.log

插件类型为:SPM

日志格式如下:

• 日志打印时间

• fromApp(即 currentApp)

• toApp

• 服务名

• 方法名

• 本段时间内调用次数

• 本段时间内的调用总耗时

• 结果(Y/N)

• 全链路压测标志(T/F)

• 目标 Zone

mosnmsgsub

MOSN 消息订阅

框架配置日志。文件采集路径 /home/admin/logs/tracelog/mosn/msg-sub-stat.log

mosnmsgpub

MOSN 消息发布

框架配置日志。文件采集路径 /home/admin/logs/tracelog/mosn/msg-pub-stat.log

插件类型为:SPM

日志格式如下:

• 日志打印时间

• currentApp

• topic

• eventCode

• pubGroupId

• 本段时间内的消息发送数量

• 本段时间内的消息发送总耗时

• 结果信息(Y/N)

• 全链路压测标志(T/F)

mosnerror

MOSN 的错误数

可选择自定义配置或框架配置日志,框架配置日志的文件采集路径为: /home/admin/logs/mosn/default.log/home/admin/logs/mosn/antvip.error.log/home/admin/logs/mosn/drm.error.log/home/admin/logs/mosn/endpoint.error.log/home/admin/logs/mosn/registry.error.log/home/admin/logs/mosn/zoneclient.error.log/home/admin/logs/mosn/alert.mirror.log

插件类型为:ERROR

mosnErrorCode

MOSN 的错误码

可选择自定义配置或框架配置日志,框架配置日志的文件采集路径为: /home/admin/logs/mosn/alert.default.log

插件类型为:MM

odpstat

ob proxy 指标

框架配置日志,该监控项不支持自定义。文件采集路径 /home/admin/logs/obproxy/log/obproxy_stat.log

插件类型为:MM

日志格式如下:

• 日志打印时间

• 当前应用名

• 数据源(trade_ds)名称,(预留,1.x 固定一个,2.x 为逻辑库的名字)

• 物理库(master00)名称,换成 shema 信息(cluster:tenant:database)

• 数据库类型 (OB/RDS)

• SQL 类型(CRUD)

• 执行结果(success/failed)

• 错误码(succ时为空)

• 总请求数量

• 30 ms ~ 100 ms 请求数量

• 100 ms ~ 500 ms 请求数量

• 大于 500 ms 请求数量

• 执行总耗时(ms,包括内部 sql)

• 预执行时间

• 数据库执行时间

odperror

ODP 异常

框架配置日志,该监控项不支持自定义。文件采集路径 /home/admin/logs/obproxy/log/obproxy_error.log

插件类型为:ERROR

单机视角

单机视角

IDC 视角

IDC 视角

LDC 视角

LDC 视角