应用实时监控服务ARMS包含应用监控、前端监控、Prometheus监控、自定义监控等子产品。为满足不同的需求,各子产品提供多种版本,例如公测版、试用版、专家版和铂金版等。本文对比各子产品各个版本的功能与特性。

应用监控(Java/PHP)

ARMS应用监控是一款面向应用性能管理的监控工具,结合了业界先进的分布式应用监控和链路追踪理论模型与阿里巴巴集团内部实践,为您提供更加全面的面向应用的实时监控服务。

应用监控产品分为以下版本:

  • 基础版:
    • 基础版提供15天免费试用,试用规则请参见ARMS 15天免费试用
    • 开通基础版后,不再提供试用额度,不限量使用,按量付费,可升级为专家版。
  • 专家版:部分功能增强。开通专家版后,不再提供试用额度,不限量使用,可以选择购买资源包和按量付费两种计费方式。
产品功能 基础版 专家版
应用总览

概览分析

展示应用的总请求量、平均响应时间、实时实例数等总体统计数据,以及服务请求量、服务响应时间等时序图,可直观展现应用性能的总体概况。feature_pg_app_overview_tab_overview_analysis
✔️ ✔️

拓扑图

自动发现应用或接口之间的调用关系,并生成实时拓扑图。feature_pg_app_overview_tab_topo
✔️

3D拓扑

立体展示应用、服务和主机的健康状况,以及应用的上下游依赖关系。feature_pg_app_overview_tab_3dtopo
✔️
应用详情

概览

自动发现应用或接口之间的调用关系,并生成实时拓扑图。feature_pg_app_details_tab_topo
✔️

JVM监控

用于监控堆内存指标、非堆内存指标、直接缓冲区指标、内存映射缓冲区指标、GC(垃圾收集)累计详情和JVM线程数等JVM指标。feature_pg_app_details_tab_jvm
✔️ ✔️

主机监控

用于监控CPU、内存、磁盘、负载、网络流量和网络数据包的各项主机指标。feature_pg_app_details_tab_host
✔️ ✔️

SQL调用分析、NoSQL调用分析、异常分析与错误分析

按应用、实例、接口等维度展示和分析SQL、异常与错误。feature_pg_app_details_tab_sql
✔️

接口快照

按应用、实例、接口等维度查看接口快照。feature_pg_app_details_tab_snapshot
✔️ ✔️
接口调用

概览

自动发现应用或接口之间的调用关系,并生成实时拓扑图。 feature_pg_interface_calls_tab_topo
✔️

SQL调用分析、NoSQL调用分析

按应用、实例、接口等维度分析SQL语句,诊断慢调用根因。feature_pg_interface_calls_tab_sql
✔️

异常分析

按应用、实例、接口等维度分析异常下钻信息。feature_pg_interface_calls_tab_exception
✔️

错误分析

展示应用的错误和HTTP状态码统计数据。feature_pg_interface_calls_tab_errors
✔️

链路上游和链路下游

列出了应用上游和应用下游的接口及其调用性能指标,包括请求数、响应时间和错误数。feature_pg_interface_calls_tab_upstream_downstream
✔️

接口快照

按应用、实例、接口等维度查看接口快照。feature_pg_interface_calls_tab_snapshot
✔️ ✔️
事件中心

将云产品生成的事件数据进行统一管理、存储、分析和展示。

✔️ ✔️
数据库调用

概览

自动发现应用与数据库之间的调用关系,并生成实时拓扑图。 feature_pg_db_calls_tab_topo
✔️

SQL调用分析

按应用、实例、接口等维度分析SQL语句,诊断慢调用根因。feature_pg_db_calls_tab_sql
✔️ ✔️

异常分析

按应用、实例、接口等维度分析异常下钻信息。feature_pg_db_calls_tab_exception.
✔️
调用来源

展示调用了数据库的接口。

 Call source
✔️ ✔️

接口快照

按应用、实例、接口等维度查看接口快照。feature_pg_db_calls_tab_snapshot
✔️ ✔️
其他监控

外部调用

外部调用的请求数、响应时间、错误数、HTTP状态码统计等指标。feature_pg_external_calls
✔️ ✔️

MQ 监控

展示消息队列Apache RocketMQ版的Topic发布和订阅消息的情况。feature_pg_mq_monitoring.png
✔️
应用诊断

实时诊断

开启实时诊断后,应用监控会持续监控应用5分钟,并在这5分钟内全量上报调用链数据。feature_pg_realtime_diagnosis.png
✔️

异常分析

聚合展示所有异常的次数、名称、接口和摘要等信息。feature_pg_exception_analysis
✔️ ✔️

线程分析

提供线程粒度的CPU耗时和每类线程数量的统计,并且每5分钟记录一次线程的方法栈并聚合,可真实还原代码执行过程。feature_pg_thread_profiling
✔️
应用设置

Agent的安装与应用的删除

支持多种Agent安装方式。支持一键删除应用。feature_pg_app_settings_agent
✔️ ✔️

修改调用链采样率、Agent开关等配置

配置调用链采样率、Agent开关、阈值、无效接口调用过滤规则等。feature_pg_app_settings_custom_configs
✔️
调用链查询

查询分布式调用链及本地方法栈

按调用类型、耗时、应用名称、IP、接口等维度进行组合查询,查看分布式调用链及本地调用方法栈。
✔️ ✔️

全息排查

关联查看业务ID与调用链。
✔️ ✔️
报警和大盘

创建报警

根据应用监控特定指标配置报警规则。
✔️ ✔️

创建交互式大盘

根据应用监控特定需求配置交互式大盘。
✔️
AGENT插件支持

支持诸多Java类第三方组件和框架

支持Tomcat、Jetty、Spring Boot、Dubbo、HSF、HttpClient、MySQL、Oracle,以及所有阿里巴巴中间件。
✔️ ✔️
API调用

API概览

借助ARMS应用监控API获取应用监控结果。
✔️ ✔️
监控数据保存策略
指标数据保存时长用于统计查询的应用调用时序统计数据(如TPS、响应时间等)的保存时长。 3天 60天
链路数据保存时长用于搜索诊断的应用调用明细数据(如分布式调用堆栈等)的保存时长。 1天 30天
开通链接 立即开通 立即开通

前端监控

ARMS前端监控平台专注于Web端体验数据监控,从页面打开速度(测速)、页面稳定性(JS错误)和外部服务调用成功率(API)这三个方面监测Web页面的健康度。

前端监控产品分为以下版本:

  • 基础版:
    • 基础版提供免费试用,使用规则请参见ARMS 15天免费试用
    • 开通基础版后,不再提供试用额度,不限量使用,按量付费,可升级为专家版。
  • 专家版:部分功能增强。开通专家版后,不再提供试用额度,不限量使用,可以选择购买资源包和按量付费两种计费方式。
产品功能 基础版 专家版
应用

总览

展示满意度、JS错误率、访问速度、API请求成功率等监控指标统计数据。
✔️ ✔️

满意度趋势

按时间和页面等维度聚合展示满意度趋势(APDEX指数)。
✔️

访问速度

按时间和页面等维度聚合展示访问速度。
✔️
说明 基础版不支持慢页面会话追踪(TOP20)
✔️

会话追踪

根据用户名称或用户ID实现全链路追踪,复现用户访问的行为轨迹。
✔️

JS错误诊断

展示JS稳定性监控指标:JS错误率排行、JS错误聚类排行。
✔️
说明 基础版不支持查看会话
✔️

API请求

展示API请求监控指标:API请求成功率、API耗时情况、API返回信息聚类。
✔️ ✔️

API详情

提供指定时间段内应用中所有API请求的成功率、平均成功耗时、平均失败耗时、缓慢次数、错误次数。
✔️
说明 基础版不支持查看会话
✔️

自定义统计

提供求和统计和均值统计两类自定义统计功能。
✔️ ✔️

访问明细

展示手动上报sum/avg日志相关信息:统计情况、分布情况。
✔️
说明 基础版不支持查看会话聚合维度
✔️

多维分析

根据业务需求通过不同条件查看各类型日志。
✔️

维度

页面

按页面维度展示访问量排行。

✔️
说明 基础版不支持查看会话
✔️
地理

按地理位置展示访问量排行。

✔️ ✔️
终端

按操作系统、设备、浏览器和分辨率维度展示访问量排行。

✔️ ✔️
网络

按网络运营商和网络制式维度展示访问量排行。

✔️ ✔️
设置
告警管理

根据当前站点的具体情况,设置对应的告警规则。

✔️ ✔️

应用设置

更改API自动上报、SPA自动解析、首屏FMP采集、页面资源上报等配置项。
✔️ ✔️
定位问题服务支持

通过反向钻取数据排查应用问题

按(中国)省市、(全球)国家、操作系统、设备、浏览器、分辨率、运营商及网络制式等维度提供应用的访问速度、JS稳定性、API请求成功率情况。
✔️ ✔️

访问明细查询

所有探针上报的原始访问日志。
✔️ ✔️
开放数据服务

开放数据集

支持调用原始访问日志数据集。
✔️ ✔️

开放API

支持通过调用API查询所有前端监控数据集的统计结果。
✔️ ✔️
报警和大盘

创建报警

根据前端监控特定指标配置报警规则。
✔️

创建交互式大盘

根据前端监控特定需求配置交互式大盘。
✔️
站点PV规模

支持前端网站的规模上限

每日根据所有站点的PV总数来统计和限制每日使用量。不同版本支持不同的规格。
不限量,按量付费 不限量,按量付费
监控数据保存策略

调用明细数据保存抽样率

网站调用请求的明细数据的保存抽样率。
10% 10%

聚合统计类数据保存时长

用于统计查询的应用调用时序统计数据(如PV、UV等)的保存时长。
3天 60天

明细诊断类数据保存时长

用于搜索诊断的应用调用明细数据(如调用URL、Header等)的保存时长。
3天 30天
开通链接 立即开通 立即开通

Prometheus监控

ARMS Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,且提供全面托管的Prometheus服务。

Prometheus监控仅提供试用版,有效期至开通后第15日的00:00截止。在此期间,每天可免费上报200万条自定义指标。

说明 每条上报的指标大小不能超过2KB。每条指标最多存储15天,超过15天的数据指标将被销毁。
产品版本 试用版
第三方Exporter白屏化安装 ✔️
ServiceMonitor服务发现 ✔️
自定义Prometheus服务配置 ✔️
云端数据存储 30天
开箱即用的Grafana大盘 ✔️
自定义Grafana大盘
PromQL支持
报警 ✔️
开通链接 立即开通

更多信息

关于ARMS中国站和国际站的按量付费收费标准以及资源包价格,请参见ARMS价格详情页