阿里云全站加速按小时颗粒度记录了域名全网访问日志,您可根据需求下载30天内指定域名某一天的日志至本地路径保存,进行分析。本文主要介绍日志下载使用说明、日志字段说明和日志下载方法。

注意事项

通过CDN/DCDN控制台(或者OpenAPI)的监控查询、用量查询(实际计费流量)功能查到的加速域名使用的流量数据与通过日志统计的流量数据有差异。通常来说,通过监控查询、用量查询功能查到的加速域名使用的流量数据是通过日志统计的流量数据的1.1倍,详细请参见为什么监控查询流量、用量查询流量与日志统计流量有差异

日志下载使用说明

  • 日志文件延迟时间:通常情况下延迟在24小时之内,也有可能超过24小时。
  • 日志命名规则:加速域名_年_月_日_开始时间_结束时间[扩展字段].gz,扩展字段以下划线(_)开头。例如aliyundoc.com_2018_10_30_000000_010000_xx.gz
    说明 扩展字段可能不存在,例如aliyundoc.com_2018_10_30_000000_010000.gz

用户访问日志的字段格式说明

  • 日志示例
    [9/Jun/2015:01:58:09 +0800] 10.10.10.10 - 1542 "-" "GET http://www.aliyun.com/index.html" 200 191 2830 MISS "Mozilla/5.0 (compatible; AhrefsBot/5.0; +http://example.com/robot/)" "text/html" "quic/https/http"
  • 字段含义
    字段描述
    [9/Jun/2015:01:58:09 +0800]日志开始时间。
    10.10.10.10访问IP。
    -代理IP。
    1542请求响应时间,单位为毫秒。
    "-"HTTP请求头中的Referer。
    GET请求方法。
    http://www.aliyun.com/index.html用户请求的URL链接。
    200HTTP状态码。
    191请求大小,单位为字节。
    2830请求返回大小,单位为字节。
    MISS命中信息。
    • HIT:用户请求命中了全站加速边缘节点上的资源(不需要回源)。
    • MISS:用户请求的内容没有在全站加速边缘节点上缓存,需要向上游获取资源(上游可能是全站加速 L2节点,也可能是源站)。
    说明 阿里云全站加速目前仅提供了全站加速边缘节点的日志信息,不包含全站加速 L2节点的回源相关信息,因此当该字段为MISS时,无法获取回源信息,因此无法直观地从日志里面看到用户请求是否回源。
    Mozilla/5.0(compatible; AhrefsBot/5.0; +http://example.com/robot/)User-Agent请求头信息。
    text/html文件类型。
    quic/https/http请求协议类型。
    说明 其他字段含义:
    • DYNAMIC:动态请求。
    • CHARGE:该请求要计费。
    • NOTLAST:保留字段,无实际含义。

WAF日志的字段格式说明

  • 日志示例
    [16/May/2023:10:36:09 +0800] HEAD "http" api.aliyun.com "/block" "_dyc=89e7639543f17ddbe77361c56b9952b9" "-" api.aliyun.com 3d30530216842045692847280e 403 "-" "curl/7.29.0" "-" 1.XX.XX.1 1.XX.XX.1 false "-" deny "custom_acl" 20000014
  • 字段含义
    字段名称示例值描述
    unixtime[16/May/2023:10:36:09 +0800]请求时间。
    methodHEAD请求方法。
    schemehttp请求协议。
    domainapi.aliyun.com请求的域名。
    uri/block请求资源。
    uri_param_dyc=89e7639543f17ddbe77361c56b9952b9请求参数。
    content_type-被请求的内容类型。
    matched_hostapi.aliyun.com客户端请求匹配到的已接入进行服务的域名。
    request_id3d30530216842045692847280e请求唯一标识。
    return_code403请求响应码。
    referer-HTTP refer字段。
    user_agentcurl/7.29.0用户代理信息。
    x_forwarded_for-访问请求头部中带有的XFF头信息,用于识别通过HTTP代理或负载均衡方式连接到Web服务器的客户端最原始的IP地址。
    client_ip1.XX.XX.1用户真实IP。
    remote_addr1.XX.XX.1请求IP。
    final_testFALSE最终匹配的是观察模式。
    cookie-访问请求头部中带有的访问来源客户端Cookie信息。
    final_actiondeny最终执行的防护动作。
    • block:表示Web基础防护模块拦截。
    • deny:表示除Web基础防护模块外其他模块拦截。
    • captcha表示普通滑块验证。
    • js:表示JS验证。
    • 空字符串:表示未拦截。即未命中任何防护规则,或者命中了白名单规则、观察类规则,或者客户端完成滑块或JS验证后触发放行的情况。
    说明 如果一个请求同时触发了多个防护模块,则仅记录最终执行的防护动作。防护动作的优先级由高到低依次为:拦截(block) > 普通滑块验证(captcha) > > 动态令牌验证(sigchl)>JS验证(js)。
    final_plugincustom_acl最终匹配的防护模块信息。
    • 若final_action有值,则该字段为对客户端请求最终执行的防护动作(final_action)对应的防护模块,即此时final_plugin有且仅有一个模块信息。
    • 若final_action为空,则该字段为客户端请求匹配到的所有防护规则所属的防护模块信息(其中匹配的模块不是Web基础防护模块或者白名单模块的话,如果模块名后含有"-T"后缀则表明请求匹配到了该模块下的观察类规则)。
    匹配的防护模块可能有多个值,多个值之间用半角逗号(,)分隔。对应防护模块信息:
    • whitelist:表示命中白名单模块规则。
    • waf:表示命中Web基础防护模块规则。
    • custom_acl:表示命中自定义规则模块规则。
    • ip_blacklist:表示命中IP黑名单模块规则。
    • region_block:表示命中区域封禁模块规则。
    • bot:表示命中Bot管理模块规则。
    • anti_scan:表示命中扫描防护模块规则。
    final_rule_id20000014最终匹配的防护规则信息。
    • 若final_action有值,则该字段为对客户端请求最终应用的防护规则的ID,即final_action对应的防护规则的ID(只有防护规则ID数字信息,不含模块信息)。
    • 若final_action为空,则该字段为对客户端请求匹配到的所有防护规则ID相关信息,防护规则ID相关信息按如下规则输出:"模块名-防护规则ID(-T)"组成(其中白名单模块及Web基础防护模块对应防护规则信息不含-T标识,其余模块若还有-T标识表明对应防护规则ID为观察类规则)。

    匹配的防护规则ID可能有多个值,多个值之间用半角逗号(,)分隔。

操作步骤

  1. 登录DCDN控制台
  2. 在左侧导航栏,选择数据中心 > 日志管理 > 离线日志
  3. 离线日志下载页签下,选择域名和查询时间,单击查询
  4. 根据查询结果,单击操作列下的下载,即可下载日志。

相关API

获取加速域名的日志信息:查询域名的离线日志下载地址。