阿里云日志服务和负载均衡(SLB)推出日志中心功能,日志中心提供负载均衡7层日志分析、秒级监控指标分析、实时告警等功能,并提供基于AIOps的自动异常巡检功能。您可以通过SLB日志中心了解客户端用户行为、客户端用户的地域分布、请求成功率、响应延迟等。本文介绍负载均衡7层日志中心相关的功能说明、功能优势、资产说明、费用说明、使用限制等信息。

功能说明

SLB日志中心基于实时访问日志进行自动聚合,并提供智能巡检、实时告警等功能,详细功能如下:
  • 实时访问日志的存储、查询、分析。
  • 基于原始访问日志实时提取各类指标信息,包括PV、请求成功率、平均延迟、P50/P99/P9999延迟、出入流量等。并支持多个维度组合,包括slbid、host、method、status。
  • 提供丰富的可视化报表,包括监控中心、异常诊断等,并支持报表邮件、钉钉群订阅。
  • 提供智能巡检功能,支持全局巡检和slbid粒度巡检,并支持在可视化报表中直接标注异常点。
  • 自定义告警配置,告警通知直接对接消息中心、短信、邮件、语音(电话)、钉钉,并支持对接自定义WebHook。
功能说明

功能优势

  • 简单:一站式开通、中心化使用,无需关心日志收集、存储、计算、可视化等问题,将开发、运维人员从日志处理的繁琐耗时中解放出来,将更多的精力集中到业务开发和技术探索上去。
  • 海量:访问日志与负载均衡实例请求PV成正比,数据规模很大,处理访问日志需要考虑性能和成本问题。日志中心可自定配置预聚和功能,实时计算聚合指标,计算后的聚合结果可降低几个数量级,使查询速度大大提升。
  • 实时:DevOps、监控、报警等场景要求日志数据的实时性。负载均衡结合日志服务强大的大数据计算能力,秒级分析处理实时产生的日志。
  • 弹性:您可按负载均衡实例级别开通或关闭访问日志功能,可任意设置日志存储周期。Logstore容量可动态伸缩满足业务增长需求。
  • 智能:基于达摩院智能AIOps算法,提供SLB指标自动巡检功能,有助于更快、更准确的发现并定位问题。

资产说明

所有资产都在您选择的Project下,Project内的资产如下:
  • Logstore
    • 访问日志Logstore用于存储负载均衡7层访问日志,该Logstore为您自定义创建的Logstore。
    • 巡检结果Logstore用于存储巡检结果。开通日志中心功能后,自动生成该专属Logstore,其名称为访问日志Logstore-metrics-result。
    说明
    • 请勿删除负载均衡7层访问日志相关的Logstore,否则将无法正常采集日志到日志服务。
    • 请勿删除访问日志Logstore中的部分字段的索引,否则指标转换会失败。
  • Metricstore
    监控指标Metricstore用于存储聚和后的指标信息。开通日志中心功能后,自动生成该专属Metricstore,其名称为访问日志Logstore-metrics。
    说明 监控指标Metricstore存储的是聚合后的指标,数据量相比原始访问日志大大降低,非常适用于长期存储。
  • 聚合规则
    规则名称 聚合时间粒度 聚合维度 生成指标名
    total 10秒 total
    • pv
    • body_bytes_sent_avg
    • body_bytes_sent_sum
    • request_length_avg
    • request_length_sum
    • upstream_response_time_avg
    • upstream_response_time_p50
    • upstream_response_time_p90
    • upstream_response_time_p99
    • upstream_response_time_p9999
    • request_time_avg
    • request_time_p50
    • request_time_p90
    • request_time_p99
    • request_time_p9999
    slbid 10秒 slbid
    • pv:slb
    • body_bytes_sent_avg:slb
    • body_bytes_sent_sum:slb
    • request_length_avg:slb
    • request_length_sum:slb
    • upstream_response_time_avg:slb
    • upstream_response_time_p50:slb
    • upstream_response_time_p90:slb
    • upstream_response_time_p99:slb
    • upstream_response_time_p9999:slb
    • request_time_avg:slb
    • request_time_p50:slb
    • request_time_p90:slb
    • request_time_p99:slb
    • request_time_p9999:slb
    slbid_host_status 10秒 slbid+host+status
    • pv:slbid:host:status
    • body_bytes_sent_avg:slbid:host:status
    • body_bytes_sent_sum:slbid:host:status
    • request_length_avg:slbid:host:status
    • request_length_sum:slbid:host:status
    • upstream_response_time_avg:slbid:host:status
    • upstream_response_time_p50:slbid:host:status
    • upstream_response_time_p90:slbid:host:status
    • upstream_response_time_p99:slbid:host:status
    • upstream_response_time_p9999:slbid:host:status
    • request_time_avg:slbid:host:status
    • request_time_p50:slbid:host:status
    • request_time_p90:slbid:host:status
    • request_time_p99:slbid:host:status
    • request_time_p9999:slbid:host:status
    slbid+host+status+request_method+upstream_status+url 10秒 slbid+host+status+request_method+upstream_status+url
    • pv:slbid:host:status:method:upstream_status
    • body_bytes_sent_avg:slbid:host:status:method:upstream_status
    • body_bytes_sent_sum:slbid:host:status:method:upstream_status
    • request_length_avg:slbid:host:status:method:upstream_status
    • request_length_sum:slbid:host:status:method:upstream_status
    • upstream_response_time_avg:slbid:host:status:method:upstream_status
    • upstream_response_time_p50:slbid:host:status:method:upstream_status
    • upstream_response_time_p90:slbid:host:status:method:upstream_status
    • upstream_response_time_p99:slbid:host:status:method:upstream_status
    • upstream_response_time_p9999:slbid:host:status:method:upstream_status
    • request_time_avg:slbid:host:status:method:upstream_status
    • request_time_p50:slbid:host:status:method:upstream_status
    • request_time_p90:slbid:host:status:method:upstream_status
    • request_time_p99:slbid:host:status:method:upstream_status
    • request_time_p9999:slbid:host:status:method:upstream_status
  • 巡检规则
    规则名称 开启状态 巡检算法 巡检指标
    slb-patrol-total 默认开启 Time2Graph
    • pv
    • body_bytes_sent_avg
    • body_bytes_sent_sum
    • request_length_avg
    • request_length_sum
    • upstream_response_time_avg
    • upstream_response_time_p50
    • upstream_response_time_p90
    • upstream_response_time_p99
    • upstream_response_time_p9999
    • request_time_avg
    • request_time_p50
    • request_time_p90
    • request_time_p99
    • request_time_p9999
    slb-patrol-slb 默认开启 Time2Graph
    • pv:slb
    • body_bytes_sent_avg:slb
    • body_bytes_sent_sum:slb
    • request_length_avg:slb
    • request_length_sum:slb
    • upstream_response_time_avg:slb
    • upstream_response_time_p50:slb
    • upstream_response_time_p90:slb
    • upstream_response_time_p99:slb
    • upstream_response_time_p9999:slb
    • request_time_avg:slb
    • request_time_p50:slb
    • request_time_p90:slb
    • request_time_p99:slb
    • request_time_p9999:slb
    slb-patrol-slbid_host_status 默认关闭 Time2Graph
    • pv:slbid:host:status
    • body_bytes_sent_avg:slbid:host:status
    • body_bytes_sent_sum:slbid:host:status
    • request_length_avg:slbid:host:status
    • request_length_sum:slbid:host:status
    • upstream_response_time_avg:slbid:host:status
    • upstream_response_time_p50:slbid:host:status
    • upstream_response_time_p90:slbid:host:status
    • upstream_response_time_p99:slbid:host:status
    • upstream_response_time_p9999:slbid:host:status
    • request_time_avg:slbid:host:status
    • request_time_p50:slbid:host:status
    • request_time_p90:slbid:host:status
    • request_time_p99:slbid:host:status
    • request_time_p9999:slbid:host:status
    slb-patrol-slbid_host_status_request_method_upstream_status 默认关闭 Time2Graph
    • pv:slbid:host:status:method:upstream_status
    • body_bytes_sent_avg:slbid:host:status:method:upstream_status
    • body_bytes_sent_sum:slbid:host:status:method:upstream_status
    • request_length_avg:slbid:host:status:method:upstream_status
    • request_length_sum:slbid:host:status:method:upstream_status
    • upstream_response_time_avg:slbid:host:status:method:upstream_status
    • upstream_response_time_p50:slbid:host:status:method:upstream_status
    • upstream_response_time_p90:slbid:host:status:method:upstream_status
    • upstream_response_time_p99:slbid:host:status:method:upstream_status
    • upstream_response_time_p9999:slbid:host:status:method:upstream_status
    • request_time_avg:slbid:host:status:method:upstream_status
    • request_time_p50:slbid:host:status:method:upstream_status
    • request_time_p90:slbid:host:status:method:upstream_status
    • request_time_p99:slbid:host:status:method:upstream_status
    • request_time_p9999:slbid:host:status:method:upstream_status
  • 专属仪表盘
    仪表盘名称 关联的Logstore或Metricstore 说明
    监控概览 访问日志Logstore名称-metrics 展示SLB总体的监控信息,包括PV、失败率、5XX比例、状态码分布、流量等。
    访问概览 访问日志Logstore名称 展示用户请求相关的信息,包括PV、UV、移动端分布、国家/省/市分布等。
    说明 此部分信息基于原始的访问日志全量计算,数据量超大的情况下会有一定延迟。
    详细监控 访问日志Logstore名称-metrics 支持以slbib、host、url、method、status等维度过滤出实例详细的监控信息。
    蓝绿对比 访问日志Logstore名称-metrics 用于对两个Host、URL的详细指标进行对比,通常应用于灰度发布、蓝绿发布等场景。
    全局巡检结果
    • 访问日志Logstore名称-metrics
    • 访问日志Logstore名称-metrics-result
    展示流式巡检算法检测出的全局异常信息,包括异常统计以及具体指标上异常的实时显示。
    实例巡检结果
    • 访问日志Logstore名称-metrics
    • 访问日志Logstore名称-metrics-result
    展示流式巡检算法检测出的slbid粒度异常信息,包括异常统计以及具体指标上异常的实时显示。

费用说明

  • 目前,负载均衡不针对日志管理功能收取额外费用。
  • 负载均衡将日志推送到日志服务后,日志服务根据存储空间、读取流量、请求数量、数据加工、数据投递等进行收费,详情请参见日志服务产品定价

使用限制

  • 只有已配置7层监听的负载均衡实例才支持访问日志功能。
  • 日志服务Project与负载均衡实例需处于同一地域。