可观测链路OpenTelemetry版集成指南

更新时间:
复制为 MD 格式

阿里云网络分析与监控集成了可观测链路OpenTelemetry版,为您提供完整的端到端全链路请求数据追踪能力。实现了拨测数据与后端调用链路的无缝连接,能够还原请求经过的节点、调用栈以及响应时间等关键信息,从而为您提供快速定位问题和提升诊断效率的能力。

背景信息

链路追踪为分布式应用的开发者提供了完整的调用链路还原、调用请求量统计、链路拓扑以及应用依赖分析等工具,可以帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈。

  • 网络分析与监控支持链路追踪,通过开启链路追踪功能,能够协助用户将拨测请求一键接入阿里云可观测链路 OpenTelemetry 版。关于可观测链路 OpenTelemetry 版的更多信息,请参见什么是可观测链路 OpenTelemetry 版

  • 链路数据用于记录单次请求范围内的处理信息,其中包括服务调用和处理时长等数据。

  • 一条链路数据对应一条调用链(Trace)。在广义上,一个调用链代表一个事务或者流程在(分布式)系统中的执行过程。调用链是多个Span组成的一个有向无环图(Directed Acyclic Graph,简称DAG),每个Span代表调用链中被命名并计时的连续性执行片段。关于调用链的更多信息,请参见基本概念

计费说明

网络分析与监控不收取链路追踪费用,如果您开启使用了可观测链路OpenTelemetry版,可观测链路OpenTelemetry版将根据您的使用量进行收费。具体收费详情请参见可观测链路OpenTelemetry版价格说明为准。

操作指南

目前网络分析与监控,只有在创建探测点类型为PC端(PC)和移动端(Mobile)的HTTP(S)类型的站点监控(定时拨测)任务时,才可以开启链路追踪。开启链路追踪需要确认链路追踪数据上报的地域和链路追踪协议。目前网络分析与监控已经集成了OpenTelemetry W3CZipkin B3Jaeger协议。打开是否开启链路追踪开关,在链路追踪上报地址下拉框中选择地域(例如华东1(杭州)),在链路追踪协议下拉框中选择协议类型(例如OpenTelemetry W3C)。如需确认服务是否已开通,可单击检查开通可观测链路OpenTelemetry

网络分析与监控链路追踪支持的地域。

区域

地域

中国

华东1(杭州)、华东2(上海)、华北1(青岛)、华北2(北京)、华北3(张家口)、华北5(呼和浩特)、华北6(乌兰察布)、华南1(深圳)、华南2(河源)、华南3(广州)、西南1(成都)、中国香港

亚太

新加坡、马来西亚(吉隆坡)、日本(东京)、印度尼西亚(雅加达)

欧洲与美洲

英国(伦敦)、德国(法兰克福)、美国(弗吉尼亚)、美国(硅谷)

拨测数据与后端打通,需要将拨测上报的地域和协议与后端上报的地域和协议分别匹配,以下是一些不同类别的后端组件支持的链路追踪协议。

接入类别

接入端

接入指南

支持协议

网关

MSE

开启网关链路追踪

w3c、b3、skywalking

ACK Ingress

实现Nginx Ingress Controller组件的链路追踪

w3c、b3、jaeger

ALB

通过ALB链路追踪实现业务全链路分析

b3

ASM

ASM中实现分布式跟踪

w3c、b3

API Gateway

配置Trace链路追踪

b3

后端应用

Java/Go/Python(自研)

应用接入

w3c、b3、jaeger、

skywalking、eagle eye

.NET、Node.js 等

多语言(开源)

接入指南

w3c、b3、jaeger、

skywalking

云服务

百炼大模型平台服务

用量监控与性能分析

w3c

依赖组件

100+ 插件支持,覆盖 RPC、消息队列、数据库、任务调度等各种类型。

查看调用链

  1. 在您创建的目标站点监控任务中的拨测记录的列表页面,选择目标拨测记录的详情。在站点监控的探测历史页面,选择正常筛选标签查看正常的探测记录。表格包含时间、探测点、探测源、节点类型、解析结果IP、探测目标、响应时间、错误信息和操作列。各记录节点类型为IDC,响应时间约1053~1073ms,错误信息为空,操作列提供详情链接可查看单次探测的详细信息。

  2. 选择全链路调用记录页签,可以看到该次拨测请求对应的trace,单击trace可以看到该次拨测请求对应的后端详细调用链路。关于链路数据的更多信息,请参见调用链分析。进入详情分析页面后,单击全链路调用记录页签。页面顶部展示拨测任务ID、拨测目标、探测点IP、节点类型、拨测时间、DNS服务器等基本信息。可通过 serviceNametraceId 进行搜索筛选,左侧快捷筛选区域支持按状态、耗时、应用名称、接口名称过滤。中部展示调用次数、错误数/HTTP错误数、平均耗时三个图表。下方Span列表展示 TraceId、接口名称等调用详情,右侧Trace分析面板对耗时≥500ms的 Trace 给出分析建议。Trace 详情页面展示 TraceID开始时间总耗时 等基本信息,统计行显示 应用数接口数 及是否检测到异常。下方瀑布图列出各 Span 的调用链路,包括接口名称(如 GET /user/async)、来源应用、角色(CLIENT / SERVER)、请求方法、状态码、开发语言及耗时,可据此定位链路中的性能瓶颈或异常。