文档

使用前须知

更新时间:

日志服务提供基于原生OpenTelemetry协议的分布式链路追踪功能,支持各类Trace数据的接入、存储、分析、可视化、告警、人工智能运维等。本文介绍日志服务分布式链路追踪功能(Trace服务)相关的背景信息、方案介绍、资产说明、费用等。

重要

日志服务推出全栈可观测应用,提供一站式IT系统可观测方案,包含全栈监控、全链路Trace、移动运维监控、性能监控等功能。推荐您在全栈可观测应用中,使用Trace功能。更多信息,请参见全栈可观测

产品试用

SLS Playground中的Trace服务Demo,内置了实例、演示数据、可视化图表等资源,提供了完整的演示环境,便于您快速了解及体验功能。

您可以单击Trace服务,进行试用。

重要

SLS Playground中的数据为演示数据,请勿用于生产环境。

背景信息

在现代IT系统中,尤其是云原生、微服务系统,一次外部请求往往需要多个内部服务、多个中间件和多台机器的相互调用才能完成。在这一系列的调用中,任何阶段出现的问题都可能导致外部服务失败或延迟升高,影响用户体验。如果您想要精确定位及分析问题,需要使用分布式链路追踪技术。

分布式链路追踪(Distributed Tracing,简称Trace)可提供整个服务调用链路的调用关系、延迟、结果等信息,非常适用于云原生、分布式、微服务等涉及多个服务交互的系统。

目前,OpenTelemetry是全球公认的分布式链路追踪标准,兼容OpenTracingOpenCensus的各类客户端。OpenTelemetry由一组API、SDK和工具组成,用来观察、生成、采集和导出各类可观测性数据(Traces、Logs、Metrics)。

日志服务Trace服务

OpenTelemetry只提供数据的格式定义、产生、收集、发送,但并不提供分析、可视化、告警等功能。Trace服务基于OpenTelemetry协议实现,支持采集OpenTelemetry以及其他平台(例如Jaeger、Zipkin、SkyWalking等)的Trace数据,并提供Trace数据存储、分析、可视化、告警等功能。

SLS Trace架构图

  • 支持多种接入方式

    • 支持通过OpenTelemetry、Jaeger、Zipkin等协议直接接入Trace数据。

    • 支持接入10多种开发语言的Trace数据。

    • 支持接入多种Trace平台中的Trace数据。

    • 支持通过公网、阿里云内网(经典网络、VPC)、全球加速网络接入Trace数据。

  • 遵循OpenTelemetry Trace 1.0标准规范

    日志服务Trace数据格式遵循OpenTelemetry Trace 1.0格式,符合云原生、微服务背景下的Trace数据格式需求。

  • 高性能

    支持日PB级数据接入,支持提取与分析相关指标,提供预计算能力,具备海量场景下Trace数据100%采样的能力。

  • 弹性

    支持自定义设置日志存储周期,Logstore存储容量可动态伸缩以满足业务增长需求。

  • 具备丰富的Trace功能

    包括Trace详情展示、服务概览、Trace查询统计、依赖分析等,同时提供自定义SQL分析功能,满足特性化需求。

  • 下游生态友好

    日志服务Trace数据、计算后的指标数据等都支持对接各类流计算平台、离线计算引擎,并支持自定义订阅数据进行定制化处理。

  • 提供多种内置的AIOps算法

    自动分析Trace对于性能、错误率的影响,帮助开发者在复杂环境下快速排查问题的根因。

资产详情

通过Trace服务创建的所有资产都保存在目标Project下,Project内的资产如下:

  • Logstore

    重要

    禁止更新、删除下述Logstore中的索引,否则会影响Trace应用的正常使用。

    • {instance}-traces:上报的原始Trace数据。

    • {instance}-traces-metrics:Trace数据经计算生成的聚合指标中间结果。

    • {instance}-traces-deps:Trace数据经计算生成的维度调用关系数据。

    • {instance}-logs:上报的原始日志。

  • Metricstore

    {instance}-metrics :上报的指标信息。

  • 定时SQL

    • {instance}-metric_info:用于聚合计算Trace数据的聚合指标信息。

    • {instance}-service:用于聚合计算service粒度的依赖项信息。

    • {instance}-service_name_host:用于聚合计算service、name、host粒度的依赖项信息。

    • {instance}-service_name_host_resource:用于聚合计算service、name、host、resource粒度的依赖项信息。

  • Dashboard

    • 接入概览:显示Trace数据接入的基本信息,例如Trace数量、Span数量、每个服务的接入情况等。

    • 数据统计:显示Trace数据接入的统计信息,例如延迟、QPS、错误率等。

费用说明

  • 若当前Logstore的计费模式为按写入数据量计费模式,Trace服务将不产生费用。具体内容,可参见按写入数据量计费

  • 若当前Logstore的计费模式为按功能付费模式,Trace服务只收取日志服务的基础费用(例如索引流量费用、存储费用、读写流量费用、外网读取费用等)。关于计费项的更多信息,请参见按使用功能计费模式计费项

  • 本页导读 (1)
文档反馈