功能特性

可观测链路 OpenTelemetry 版

该产品针对 PHP、C++、Go、Node.js 等多语言应用,提供端到端全链路追踪、应用监控与告警、链路拓扑、日志关联分析能力,并基于 OpenTelemetry 开源标准,兼容 Jaeger、Zipkin、SkyWalking 等开源项目数据上报。快速发现分布式应用架构下的性能瓶颈,缩短错/慢调用根因定位耗时,提高全栈开发与诊断效率。

功能集

功能

功能描述

参考文档

应用接入

接入Java应用

支持通过OpenTelemetry、Skywalking、Jaeger、Zipkin上报Java应用性能数据。

接入PHP应用

支持通过OpenTelemetry上报PHP应用性能数据。

通过OpenTelemetry上报PHP应用

接入Go应用

支持通过OpenTelemetry、Skywalking、Jaeger、Zipkin上报Go应用性能数据。

接入Python应用

支持通过OpenTelemetry、Skywalking、Jaeger上报Python应用性能数据。

接入Node.js应用

支持通过OpenTelemetry、Skywalking上报Node.js应用性能数据。

接入.NET应用

支持通过OpenTelemetry、Skywalking、Jaeger、Zipkin上报.NET应用性能数据。

接入C++应用

支持通过OpenTelemetry、Jaeger上报C++应用性能数据。

接入Ruby应用

支持通过OpenTelemetry上报Ruby应用性能数据。

通过OpenTelemetry上报Ruby应用数据

接入Swift应用

支持通过OpenTelemetry上报Switf应用性能数据。

通过OpenTelemetry上报Swift应用数据

接入Android应用

支持通过OpenTelemetry上报Android应用性能数据。

通过OpenTelemetry上报Android应用数据

接入Rust应用

支持通过Skywalking上报Rust应用性能数据。

通过SkyWalking上报Rust应用数据

接入Nginx

支持通过Skywalking、Jaeger、Zipkin上报Nginx监控数据。

接入Ingress

支持通过Ingress-tracing实现链路追踪。

使用Nginx-Ingress-tracing实现链路追踪

应用管理

应用列表

列出全量接入的应用列表,并展示典型监控指标,如应用的请求数、错误数、耗时等。

应用列表

应用概览

应用概览页面提供了应用的请求数、错误数、耗时、实例数等信息。

应用概览

应用拓扑

应用拓扑页面直观展示了应用内部服务的调用关系。

应用拓扑

提供服务

提供服务页面展示了应用提供的服务详情,包括接口调用、消息队列和定时任务的详细信息。

提供服务

依赖服务

依赖服务页面展示了应用依赖服务的详情,包括外部调用、数据库调用和消息队列的详细信息。

依赖服务

调用链分析

调用链分析功能是基于已存储的全量链路明细数据,自由组合筛选条件与聚合维度进行实时分析,可以满足不同场景的自定义诊断需求。

调用链分析

数据库分析

数据库分析页面支持按照数据库类型、数据库名称、实例名称进行筛选分析,查询分析异常或者慢SQL。

数据库分析

异常分析

异常分析页面支持按照异常名称、接口名称、主机对异常次数、异常列表进行筛选分析,优化产生异常的代码。

异常分析

事件分析

事件分析功能是基于已产生的告警事件明细数据,自由组合筛选条件进行实时分析,可以满足不同场景的自定义分析诊断需求。

事件分析

调用链分析

链路列表

支持通过状态、耗时、应用名称、接口名称和主机地址维度快速筛选链路,同时也支持自定义多维度查询条件。筛选设置完成后,调用链分析页面将会显示筛选过滤后的链路查询信息,包括Span数和HTTP错误数的柱状图,耗时百分位的时序曲线,以及Span列表。

链路列表

散点图

散点图页面以时间为横轴,耗时指标为纵轴,显示调用链的耗时分布情况。将鼠标悬浮于散点上,可以显示散点对应的调用链的基本信息。单击散点可以查看调用链对应的调用详情。

散点图

全链路聚合

调用链分析对查询到的Span可以按照各个维度进行分析,但这些分析是针对单个Span,并未在链路级别深度分析。而全链路聚合功能支持通过指定条件查询分布式调用链路的TraceId(最多5000个),然后基于这些TraceId查询对应的Span,并聚合这些Span得出最终结果,整个过程保证聚合的链路完整性。

全链路聚合

全链路拓扑

全链路拓扑页签显示调用链聚合后的应用间拓扑。展示应用间存在调用关系,同时展示相应的请求数、错误数、响应时间等数据。

全链路拓扑

链路详情

在链路详情面板可以查看链路下的所有接口、链路开始时间、总耗时、接口是否异常、以及每个接口的调用耗时。

链路详情

场景化分析

异常分析

异常分析页面支持全局维度按照应用名称、异常名称、接口名称、主机对异常次数、异常列表进行筛选分析,优化产生异常的代码。

异常分析

慢调用分析

慢调用分析页面支持全局维度选择时间段范围内所有慢调用统计和列表数据。如慢Span、慢SQL等。

-

数据库分析

数据库分析页面支持全局维度按照应用名称、数据库类型、数据库名称、实例名称进行筛选分析,查询分析SQL语句,如异常或者慢SQL。

-

高阶查询

链路查询

基于存储Trace明细数据的LogStore提供自定义查询数据的能力。

-

日志查询

基于存储Trace明细数据的LogStore提供自定义查询日志的能力,可用于链路关联日志查询的场景。

-

告警管理

告警规则

可以制定针对特定应用的告警规则。当告警规则被触发时,系统会以您指定的通知方式向告警联系人或钉群发送告警信息,以提醒您采取必要的解决措施。支持阈值检测和区间检测两种规则模式。

创建告警规则

告警通知

通过告警通知页面,用户可以筛选并查看根据通知策略分派的告警内容,并管理告警。

查看告警发送历史

事件分析

事件分析功能是基于已产生的告警事件明细数据,自由组合筛选条件进行实时分析,可以满足不同场景的自定义分析诊断需求。

事件分析

告警策略

支持针对告警设置不同的策略,包括通知策略、升级策略和静默策略等。

通知策略

通知对象

支持通过电话、短信、邮件、钉钉、企业微信、飞书和Webhook方式向联系人发送告警通知。

告警通知对象

系统配置

集群配置

支持对数据采集启停和数据存储周期进行配置与展示。

集群配置

日志关联

支持配置应用和日志服务LogStore的关联性配置,满足调用链查询分析时进行日志关联分析的需求。

日志关联

用量统计

用量统计页面提供数据类型维度、应用维度的可观测数据量查询展示,可用于费用评估。

账单和用量查询