通过Logtail同阿里云账号跨地域采集日志_日志服务(SLS)-阿里云帮助中心

本文以Linux系统为例介绍同阿里云账号跨地域采集日志的操作步骤。

前提条件

已创建Project和Logstore。更多信息，请参见创建项目Project和创建Logstore。

背景信息

某电商公司拥有两个电商应用，日志服务部署在地域B（成都）。

应用A部署在阿里云云服务器和日志服务Project属于不同地域（服务器为其他云厂商服务器或自建IDC）。
应用B部署在地域B（成都）下的集群。

现公司计划将两个应用的日志集中采集到地域B（成都）下的日志服务中，即将两个应用的日志分别采集到同一个日志服务Project下的不同Logstore中。因此您需要新增一个Logtail采集配置、机器组和Logstore，用于采集和存储应用A相关的日志。应用B相关的日志采集保持不变（使用原有的Logtail采集配置、机器组和Logstore）。

配置流程

使用限制

支持如下版本的Linux x86-64（64位）服务器。
- Alibaba Cloud Linux 2
- RedHat Enterprise 6、7、8
- CentOS Linux 6、7、8
- Debian GNU/Linux 8、9、10、11
- Ubuntu 14.04、16.04、18.04、20.04
- SUSE Linux Enterprise Server 11、12、15
- OpenSUSE 15.1、15.2、42.3
- 其他基于glibc 2.5及以上版本的Linux操作系统
支持如下版本的Linux ARM（64位）服务器。
- Alibaba Cloud Linux 3.2 ARM版
- Anolis OS 8.2 ARM版及以上版本
- CentOS 8.4 ARM版
- Ubuntu 20.04 ARM版
- Debian 11.2 ARM版

网络传输说明

传输方式	适用场景
公网	阿里云云服务器实例和日志服务Project属于不同地域。服务器为其他云厂商服务器或自建IDC。
传输加速	服务器分布在海外各地的自建机房或者来自海外云厂商，使用公网传输数据可能会出现网络延迟高、传输不稳定等问题，推荐选择传输加速。更多信息，参见管理传输加速。

步骤一：应用A的服务器安装Logtail

根据日志服务Project所在地域，获取对应的${your_region_name}。
各个地域对应的${your_region_name}请参见地域与安装参数对照表，例如华东 1（杭州）对应的${your_region_name}为cn-hangzhou。

登录应用A所在的服务器，替换${your_region_name}后，执行安装命令。

公网

wget http://logtail-release-${your_region_name}.oss-${your_region_name}.aliyuncs.com/linux64/logtail.sh -O logtail.sh; chmod 755 logtail.sh; ./logtail.sh install ${your_region_name}-internet

传输加速

wget http://logtail-release-${your_region_name}.oss-${your_region_name}.aliyuncs.com/linux64/logtail.sh -O logtail.sh; chmod 755 logtail.sh; ./logtail.sh install ${your_region_name}-acceleration

步骤二：创建IP地址机器组

获取服务器IP地址。

登录已安装Logtail的服务器。

打开app_info.json文件。

app_info.json文件路径说明如下表所示。

操作系统	Logtail	app_info.json文件路径
Linux	Logtail（64位程序）	/usr/local/ilogtail/app_info.json
Windows（64位操作系统）	Logtail（64位程序）	C:\Program Files\Alibaba\Logtail\app_info.json
Windows（64位操作系统）	Logtail（32位程序）	C:\Program Files (x86)\Alibaba\Logtail\app_info.json
Windows （32位操作系统）	Logtail（32位程序）	C:\Program Files\Alibaba\Logtail\app_info.json

查看app_info.json文件中的ip字段值。
Logtail自动获取的服务器IP地址记录在app_info.json文件的ip字段中，如下图所示。

登录日志服务控制台。
在Project列表区域，单击目标Project。
在左侧导航栏中，选择资源 > 机器组。
选择机器组右侧的 > 创建机器组。

在创建机器组对话框中，配置如下参数，单击确定。

参数	说明
名称	设置机器组的名称。重要创建后，不支持修改机器组名称，请谨慎填写。
机器组标识	选择IP地址。
机器组Topic	机器组Topic用于区分不同服务器产生的日志数据。更多信息，请参见日志主题。
IP地址	输入步骤1中获取到的服务器IP地址。重要存在多台服务器时，请手动输入对应的IP地址，IP地址之间需使用换行符分隔。请勿将Windows服务器和Linux服务器添加到同一机器组中。

查看机器组状态。
1. 在机器组列表中，单击目标机器组。
2. 在机器组配置页面，查看服务器及其状态。
  心跳为OK表示服务器上的Logtail实例与日志服务连接正常。如果显示FAIL，请参见Logtail机器组无心跳处理。
  重要
  创建机器组大约需要2分钟。创建未生效，将导致心跳为FAIL。请2分钟后单击刷新进行重试。

步骤三：采集日志

登录日志服务控制台。
在接入数据区域中，根据需要选择包含文本日志后缀的入口。本文以采集主机中的多行文本日志为例。
在选择日志空间页面，按照选择目标Project和Logstore，单击下一步。
在机器组配置页面，配置机器组。
1. 根据实际需求，选择使用场景和安装环境。
  重要
  无论是否已有机器组，都必须根据实际需求正确选择使用场景和安装环境，这将影响后续的页面配置。
2. 确认目标机器组已在应用机器组区域，单击下一步。
  已有机器组
  从源机器组列表选择目标机器组。
  没有可用机器组
  单击创建机器组，在创建机器组面板设置相关参数。机器组标识分为IP地址和用户自定义标识，更多信息请参见创建用户自定义标识机器组（推荐）或创建IP地址机器组。
  重要
  创建机器组后立刻应用，可能因为连接未生效，导致心跳为FAIL，您可单击重试。如果还未解决，请参见Logtail机器组无心跳进行排查。

创建Logtail配置，单击下一步，创建Logtail配置。Logtail配置生效时间最长需要3分钟，请耐心等待。

全局配置

配置项	说明
配置名称	Logtail配置名称，在其所属Project内必须唯一。创建Logtail配置成功后，无法修改其名称。
日志主题类型	选择日志主题（Topic）的生成方式。更多信息，请参见日志主题。机器组Topic：设置为机器组的Topic属性，用于明确区分不同机器组产生的日志。文件路径提取：设置为文件路径正则，则需要设置自定义正则，用正则表达式从路径里提取一部分内容作为Topic。用于区分不同源产生的日志。自定义：自定义日志主题。
高级参数	其它可选的与配置全局相关的高级功能参数，请参见创建Logtail流水线配置。

输入配置

配置项	说明
文件路径	根据日志在主机（例如ECS）上的位置，设置日志目录和文件名称。如果目标主机是Linux系统，则日志路径必须以正斜线（/）开头，例如`/apsara/nuwa//app.Log`。如果目标主机是Windows系统，则日志路径必须以盘符开头，例如`C:\Program Files\Intel\\.Log`。目录名和文件名均支持完整模式和通配符模式，文件名规则请参见Wildcard matching。其中，日志路径通配符只支持星号（）和半角问号（?）。日志文件查找模式为多层目录匹配，即符合条件的指定目录（包含所有层级的目录）下所有符合条件的文件都会被查找到。例如： `/apsara/nuwa/*/.log`表示`/apsara/nuwa`目录（包含该目录的递归子目录）中后缀名为.log的文件。 `/var/logs/app_//.log`表示`/var/logs`目录下所有符合`app_`格式的目录（包含该目录的递归子目录）中后缀名为`.log`的文件。 `/var/log/nginx//access`表示`/var/log/nginx`目录（包含该目录的递归子目录）中以`access`开头的文件。
最大目录监控深度	设置日志目录被监控的最大深度，即文件路径中通配符`**`匹配的最大目录深度。0代表只监控本层目录。
文件编码	选择日志文件的编码格式。
首次采集大小	配置首次生效时，匹配文件的起始采集位置距离文件结尾的大小。首次采集大小设定值为1024 KB。首次采集时，如果文件小于1024 KB，则从文件内容起始位置开始采集。首次采集时，如果文件大于1024 KB，则从距离文件末尾1024 KB的位置开始采集。您可以通过此处修改首次采集大小，取值范围为0~10485760，单位为KB。
采集黑名单	打开采集黑名单开关后，可进行黑名单配置，即可在采集时忽略指定的目录或文件。支持完整匹配和通配符匹配目录和文件名。其中，通配符只支持星号（）和半角问号（?）。重要如果您在配置文件路径时使用了通配符，但又需要过滤掉其中部分路径，则需在采集黑名单中填写对应的完整路径来保证黑名单配置生效。例如您配置文件路径为`/home/admin/app/log/.log`，但要过滤`/home/admin/app1`目录下的所有子目录，则需选择目录黑名单，配置目录为`/home/admin/app1/`。如果配置为`/home/admin/app1`，黑名单不会生效。匹配黑名单过程存在计算开销，建议黑名单条目数控制在10条内。目录路径不能以正斜线（/）结尾，例如将设置路径为`/home/admin/dir1/`，目录黑名单不会生效。支持按照文件路径黑名单、文件黑名单、目录黑名单设置，详细说明如下：文件路径黑名单选择文件路径黑名单，配置路径为`/home/admin/private.log`，则表示在采集时忽略`/home/admin/`目录下所有以private开头，以.log结尾的文件。选择文件路径黑名单，配置路径为`/home/admin/private/_inner.log`，则表示在采集时忽略`/home/admin/`目录下以private开头的目录内，以_inner.log结尾的文件。例如`/home/admin/private/app_inner.log`文件被忽略，`/home/admin/private/app.log`文件被采集。文件黑名单选择文件黑名单，配置文件名为`app_inner.log`，则表示采集时忽略所有名为`app_inner.log`的文件。目录黑名单选择目录黑名单，配置目录为`/home/admin/dir1`，则表示在采集时忽略`/home/admin/dir1`目录下的所有文件。选择目录黑名单，配置目录为`/home/admin/dir`，则表示在采集时忽略`/home/admin/`目录下所有以dir开头的子目录下的文件。选择目录黑名单，配置目录为`/home/admin/*/dir`，则表示在采集时忽略`/home/admin/`目录下二级目录名为dir的子目录下的所有文件。例如`/home/admin/a/dir`目录下的文件被忽略，`/home/admin/a/b/dir`目录下的文件被采集。
允许文件多次采集	默认情况下，一个日志文件只能匹配一个Logtail配置。如果文件中的日志需要被采集多份，需要打开允许文件多次采集开关。
高级参数	其它可选的与文件输入插件相关的高级功能参数，请参见创建Logtail流水线配置。

处理配置

配置项	说明
日志样例	待采集日志的样例，请务必使用实际场景的日志。日志样例可协助您配置日志处理相关参数，降低配置难度。支持添加多条样例，总长度不超过1500个字符。 `[2023-10-01T10:30:01,000] [INFO] java.lang.Exception: exception happened at TestPrintStackTrace.f(TestPrintStackTrace.java:3) at TestPrintStackTrace.g(TestPrintStackTrace.java:7) at TestPrintStackTrace.main(TestPrintStackTrace.java:16)`
多行模式	多行日志的类型：多行日志是指每条日志分布在连续的多行中，需要从日志内容中区分出每一条日志。自定义：通过行首正则表达式区分每一条日志。多行JSON：每个JSON对象被展开为多行，例如： `{ "name": "John Doe", "age": 30, "address": { "city": "New York", "country": "USA" } }` 切分失败处理方式： `Exception in thread "main" java.lang.NullPointerException at com.example.MyClass.methodA(MyClass.java:12) at com.example.MyClass.methodB(MyClass.java:34) at com.example.MyClass.main(MyClass.java:½0)` 对于以上日志内容，如果日志服务切分失败：丢弃：直接丢弃这段日志。保留单行：将每行日志文本单独保留为一条日志，保留为一共四条日志。
处理模式	处理插件组合，包括原生插件和拓展插件。有关处理插件的更多信息，请参见处理插件概述。重要处理插件的使用限制，请以控制台页面的提示为准。低于2.0版本的Logtail：不支持同时添加原生插件和扩展插件。原生插件仅可用于采集文本日志。使用原生插件时，须符合如下要求：第一个处理插件必须为正则解析插件、分隔符模式解析插件、JSON解析插件、Nginx模式解析插件、Apache模式解析插件或IIS模式解析插件。第一个处理插件之后仅允许存在1个时间解析处理插件，1个过滤插件和多个脱敏插件。扩展处理插件只能出现在所有的原生处理插件之后，不能出现在任何原生处理插件之前。 2.0版本的Logtail：原生处理插件可任意组合。原生处理插件和扩展处理插件可同时使用，但扩展处理插件只能出现在所有的原生处理插件之后。

创建索引和预览数据，然后单击下一步。日志服务默认开启全文索引。您也可以根据采集到的日志，手动创建字段索引，或者单击自动生成索引，日志服务将自动生成字段索引。更多信息，请参见创建索引。
重要
如果需要查询日志中的所有字段，建议使用全文索引。如果只需查询部分字段、建议使用字段索引，减少索引流量。如果需要对字段进行分析（SELECT语句），必须创建字段索引。
单击查询日志，系统将跳转至Logstore查询分析页面。
您需要等待1分钟左右，待索引生效后，才能在原始日志页签中，查看已采集到的日志。查询和分析日志的详细步骤，请参见查询和分析日志。

前提条件

背景信息

配置流程

使用限制

网络传输说明

步骤一：应用A的服务器安装Logtail

公网

传输加速

步骤二：创建IP地址机器组

步骤三：采集日志

已有机器组

没有可用机器组

文件路径黑名单

文件黑名单

目录黑名单

相关文档