服务网格ASM集成了阿里云可观测链路OpenTelemetry版,为分布式应用的开发者提供了完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等能力,可以帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈,提升开发诊断效率。本文介绍如何在ASM中实现分布式跟踪。
前提条件
阿里云账号已开通可观测链路OpenTelemetry版。关于如何计费,请参见计费规则。
ASM实例已启用链路追踪。具体操作,请参见将链路追踪数据采集到阿里云可观测链路OpenTelemetry版。
背景信息
分布式跟踪是一种用于对应用程序进行概要分析和监视的方法,尤其是针对使用微服务架构构建的应用程序。虽然Istio代理能够自动发送Span信息,但是应用程序仍然需要传播适当的HTTP标头,以便在代理发送Span时,可以将Span正确地关联到单个跟踪中。为此,应用程序需要收集以下标头并将其从传入请求传播到任何传出请求:
x-request-id
x-b3-traceid
x-b3-spanid
x-b3-parentspanid
x-b3-sampled
x-b3-flags
x-ot-span-context
部署示例
在按照部署应用到ASM实例进行应用部署之后,查看示例中以Python语言实现的productpage服务,则会发现该应用程序使用了OpenTracing库从HTTP请求中提取了所需的标头。
def getForwardHeaders(request):
headers = {}
# x-b3-*** headers can be populated using the opentracing span
span = get_current_span()
carrier = {}
tracer.inject(
span_context=span.context,
format=Format.HTTP_HEADERS,
carrier=carrier)
headers.update(carrier)
# ...
incoming_headers = ['x-request-id']
# ...
for ihdr in incoming_headers:
val = request.headers.get(ihdr)
if val is not None:
headers[ihdr] = val
return headers
查看以Java语言实现的reviews服务是也可以看到相应的HTTP标头。
@GET
@Path("/reviews/{productId}")
public Response bookReviewsById(@PathParam("productId") int productId,
@HeaderParam("end-user") String user,
@HeaderParam("x-request-id") String xreq,
@HeaderParam("x-b3-traceid") String xtraceid,
@HeaderParam("x-b3-spanid") String xspanid,
@HeaderParam("x-b3-parentspanid") String xparentspanid,
@HeaderParam("x-b3-sampled") String xsampled,
@HeaderParam("x-b3-flags") String xflags,
@HeaderParam("x-ot-span-context") String xotspan) {
if (ratings_enabled) {
JsonObject ratingsResponse = getRatings(Integer.toString(productId), user, xreq, xtraceid, xspanid, xparentspanid, xsampled, xflags, xotspan);
访问示例
在浏览器地址栏输入http://{入口网关服务的IP地址}/productpage,可以看到Bookinfo应用的页面。
查看应用列表
应用列表页面展示了所有被监控应用的健康度得分、本日请求数、本日错误数等关键指标。您还可以为应用设置自定义标签,从而通过标签进行筛选。
在左侧导航栏,单击应用列表,然后在页面上方,选择目标地域。
查看应用详情
应用详情页面可展示应用在所部属的每一台机器上的关键性能指标、调用拓扑图和调用链路。
在左侧导航栏,单击应用列表,然后在页面上方选择目标地域,单击目标应用名称。
在左侧导航栏,单击应用详情,在左侧的机器列表中单击全部或一台以IP地址标识的机器。
您可以在概览页签查看调用拓扑图和关键性能指标;在调用链路页签查看该应用在所选机器上的调用链路列表,按耗时降序排列,最多可列出100个调用链路。
查看调用链瀑布图
调用链路的瀑布图展示了调用链路的日志产生时间、状态、IP址/机器名称、服务名、时间轴等信息。
在应用详情页面,单击调用链路页签,然后单击目标链路的Trace ID。
在新弹出的调用链路页面,查看该调用链路的瀑布图。
FAQ
为什么在ASM中将链路追踪数据采集到可观测链路OpenTelemetry版,却仍然看不到调用链路?
查看链路推送日志。
执行以下命令,查看istio-system命名空间下tracing-on-external-zipkin的链路推送日志。
kubectl logs "$(kubectl get pods -n istio-system -l app=tracing -o jsonpath='{.items[0].metadata.name}')" -n istio-system -c nginx
可以看到链路推送日志的状态码为406。
查看额度请求数量和昨日请求数量。
在左侧导航栏,单击集群配置,查看额度请求数量和昨日请求数量。
根据以上结果,可以看到服务的请求数量大于链路追踪的额度请求数量。
修改额度请求数量。
如果服务的请求数量大于链路追踪的额度请求数量,上报的数据将会被丢弃,您将看不到服务的调用链路。您需要修改额度配置,使得额度请求数量大于服务请求数量。
在可观测链路OpenTelemetry版控制台左侧导航栏,单击集群配置。
在集群配置页签的额度配置区域修改配置额度,使得额度请求数量大于服务请求数量,然后单击保存。
在提示对话框,单击确认。
为什么traceid经过ASM网关或Sidecar后发生了改变?
该问题可能是由于您的发起端应用在发起请求时携带的b3
Header不全,导致Envoy认为追踪信息不完整,从而重新生成b3
Header。若您希望自行生成traceid
,请求中至少需要携带x-b3-trace-id
和x-b3-spanid
两个Header。