全部产品
弹性计算 会员服务 网络 安全 移动云 数加·大数据分析及展现 数加·大数据应用 管理与监控 云通信 阿里云办公 培训与认证 智能硬件
存储与CDN 数据库 域名与网站(万网) 应用服务 数加·人工智能 数加·大数据基础服务 互联网中间件 视频服务 开发者工具 解决方案 物联网 更多
日志服务

Logtail 快速诊断工具

更新时间:2018-05-28 19:42:24

当日志采集发生异常时,您可以通过Logtail自助检测工具查看客户端是否存在异常情况,根据工具提示快速定位并解决问题。

注意:本工具目前仅支持Linux系统的服务器。

准备工作

  1. 下载检测工具脚本

    • wget http://logtail-release.oss-cn-hangzhou.aliyuncs.com/linux64/checkingtool.sh -O checkingtool.sh

    • wget http://logtail-corp.oss-cn-hangzhou-zmf.aliyuncs.com/linux64/checkingtool.sh -O checkingtool.sh

  2. 安装curl工具。检查工具需要使用curl进行网络连通性检查,请确保机器已安装curl工具。

运行诊断工具

  1. 执行以下命令运行诊断工具:

    1. chmod 744 ./checkingtool.sh
    2. ./checkingtool.sh
    3. sh checkingtool.sh

    回显信息:

    1. [Info]: Logtail checking tool version : 0.3.0
    2. [Input]: please choose which item you want to check :
    3. 1. MachineGroup heartbeat fail.
    4. 2. MachineGroup heartbeat is ok, but log files have not been collected.
    5. Item :
  2. 请根据提示输入12,脚本会根据您的选择执行不同检查流程。

    其中:

    • 1表示执行机器组心跳检查,机器组心跳失败时请选择此项。
    • 2表示执行日志采集检查,机器组心跳成功,但日志文件没有被采集时,请选择此项。

    选择检查项目后,诊断工具会自动执行对应检查流程。

诊断流程

52578-1cn

机器组心跳检查

选择机器组心跳检查流程后会进行下述一系列的检查:

1. 基础环境检查

  • 是否安装Logtail。

  • 是否运行Logtail。

  • SSL状态是否正常。

  • 与日志服务之间是否有网络联通。

  1. [Info]: Logtail checking tool version : 0.3.0
  2. [Input]: please choose which item you want to check :
  3. 1. MachineGroup heartbeat fail.
  4. 2. MachineGroup heartbeat is ok, but log files have not been collected.
  5. Item :1
  6. [Info]: Check logtail install files
  7. [Info]: Install file: ilogtail_config.json exists. [ OK ]
  8. [Info]: Install file: /etc/init.d/ilogtaild exists. [ OK ]
  9. [Info]: Install file: ilogtail exists. [ OK ]
  10. [Info]: Bin file: /usr/local/ilogtail/ilogtail_0.14.2 exists. [ OK ]
  11. [Info]: Logtail version : [ OK ]
  12. [Info]: Check logtail running status
  13. [Info]: Logtail is runnings. [ OK ]
  14. [Info]: Check network status
  15. [Info]: Logtail is using ip: 11.XX.XX.187
  16. [Info]: Logtail is using UUID: 0DF18E97-0F2D-486F-B77F-XXXXXXXXXXXX
  17. [Info]: Check SSL status
  18. [Info]: SSL status OK. [ OK ]
  19. [Info]: Check logtail config server
  20. [Info]: config server address: http://config.sls.aliyun-inc.com
  21. [Info]: Logtail config server OK [ OK ]

若其中检查出现Error信息,请参考提示进行处理。

2. 确认是否非本人ECS

基础环境检查通过后,请确认您的服务器是否为非本人ECS

若此服务器不是ECS或者ECS购买账号和日志服务账号不同,输入y,否则输入N

  1. [Input]: Is your server non-Alibaba Cloud ECS or not belong to the same account with the current Project of Log Service ? (y/N)

当输入y后,检查工具会输出本地配置的AliUid信息,请确认其中是否包含了您的AliUid,若未包含请参考文档创建AliUid标识

  1. [Input]: Is your server non-Alibaba Cloud ECS or not belong to the same account with the current Project of Log Service ? (y/N)y
  2. [Info]: Check aliyun user id(s)
  3. [Info]: aliyun user id : 126XXXXXXXXXX79 . [ OK ]
  4. [Info]: aliyun user id : 165XXXXXXXXXX50 . [ OK ]
  5. [Info]: aliyun user id : 189XXXXXXXXXX57 . [ OK ]
  6. [Input]: Is your project owner account ID is the above IDs ? (y/N)

3. 检查Region

请确认您的Project所在区域是否和Logtail安装时所选区域一致,若不一致请重新安装Logtail

  1. [Input]: please make sure your project is in this region : { cn-hangzhou } (y/N) :

4. 检查IP配置

请确认您机器组配置的IP和Logtail工作IP一致,若不一致请参考机器组管理修改。

若您配置的是自定义标识机器组,请确认本地配置的标识与服务端配置一致,若不一致请参考自定义标识机器组修改。

  1. [Input]: please make sure your machine group's ip is same with : { 11.XX.XX.187 } or your machine group's userdefined-id is in : { XX-XXXXX } (y/N) :

日志采集检查

选择日志未采集检查流程后会进行下述一系列的检查:

1. 确认IP配置

请确认您机器组配置的ip和Logtail工作ip一致且心跳正常,若不一致请订正机器组配置

  1. [Input]: please make sure your machine group's ip is same with : { 11.XX.XX.187 } (y/N) :

2. 确认采集配置应用

请确认您的采集配置已经成功应用到该机器组中,如何查看机器组应用配置参见机器组配置管理

  1. [Input]: please make sure you have applied collection config to the machine group (y/N) :Y

3. 检查日志文件

检查时请输入您需要检查的日志文件全路径,若未找到匹配项,请确认配置的路径信息可以匹配给定的日志文件。

若配置错误请重新修改采集配置并保存,1分钟后再次执行此脚本重新检查。

  1. [Input]: please input your log file's full path (eg. /var/log/nginx/access.log) :/disk2/logs/access.log
  2. [Info]: Check specific log file
  3. [Info]: Check if specific log file [ /disk2/logs/access.log ] is included by user config.
  4. [Warning]: Specific log file doesnt exist. [ Warning ]
  5. [Info]: Matched config found: [ OK ]
  6. [Info]: [Project] -> sls-zc-xxxxxx
  7. [Info]: [Logstore] -> release-xxxxxxx
  8. [Info]: [LogPath] -> /disk2/logs
  9. [Info]: [FilePattern] -> *.log

检查通过但采集依然异常

若所有的检查全部通过,但采集依然出现异常,请在脚本最后的选择中输入y并回车确认。

请您将检查脚本输出的信息作为附件,提交工单给我们的售后工程师。

  1. [Input]: please make sure all the check items above have passed. If the problem persists, please copy all the outputs and submit a ticket in the ticket system. : (y/N)y

快速检查

快速检查运行时无需确认,可用于二次封装自定义检查脚本。

注意: 快速检查运行时会输出客户端配置的阿里云ID动态机器组/自定义标识,不存在时并不会给出告警,如果客户端需要阿里云ID或动态机器组/自定义标识的配置,请查看工具的输出和您配置的是否一致,不一致时按照以下方法重新配置:阿里云UserId配置动态机器组配置

操作步骤

请运行脚本./checkingtool.sh --logFile [LogFileFullPath]进行检查。 检测脚本发现异常时,请根据脚本提示进行处理。

注意: 若指定日志文件检查通过且Logtail运行环境正常,建议进入阿里云控制台中查看该日志服务配置项的异常日志,参见日志收集错误查询

52578-2cn

Logtail采集异常的常见问题

运行Logtail快速诊断工具后,可以诊断出Logtail采集异常的原因,您可以根据具体原因查找对应的解决方案。常见Logtail采集问题原因及解决方案如下。

常见问题 解决方法
安装文件丢失 重装Logtail。
Logtail未运行 使用命令/etc/init.d/ilogtaild start开启Logtail。
多个Logtail进程 使用命令/etc/init.d/ilogtaild stop关闭Logtail,然后执行命令/etc/init.d/ilogtaild start开启。
443端口被禁用 防火墙开放443端口。
无法找到配置服务器 确认是否已正确安装Logtail,若安装错误,卸载后重新安装。
不存在用户配置 确认是否已执行以下操作:
  1. 控制台已经创建好Logtail配置。
  2. 机器组中包含该服务器。
  3. 已经将配置应用到机器组。
没有匹配指定日志文件 确认是否正确配置了Logtail。
指定日志文件匹配多次 匹配多次时Logtail会随机选择一个配置,建议去重。

检测工具常用参数

  • --help查看帮助文档。
  • --logFile [LogFileFullPath]检测Logtail是否收集路径为LogFileFullPath的日志,同时检查基本的Logtail运行环境(安装文件完整性、运行状态、阿里云userID、网络连通性等)。
  • --logFileOnly [LogFileFullPath]只检测Logtail是否收集路径为LogFileFullPath的日志。
  • --envOnly 只检测Logtail运行环境。
本文导读目录