导入MaxCompute数据
您可以将日志文件保存到MaxCompute中,并通过数据导入方式将MaxCompute数据导入到日志服务,实现日志数据的查询分析、数据加工等操作。
前提条件
- 已开通MaxCompute并上传日志文件数据。具体操作,请参见导入数据。
- 已创建Project和Logstore。具体操作,请参见创建Project和创建Logstore。
创建数据导入配置
登录日志服务控制台。
- 在接入数据区域的数据导入页签中,单击MaxCompute-数据导入。
- 选择目标Project和Logstore,单击下一步。
- 设置导入配置。
- 在数据源设置中,配置如下参数。
参数 说明 配置名称 设置配置的名称。 MaxCompute项目 待导入数据所在的MaxCompute项目名称。 Table 待导入数据所在的表名称。 分区描述 MaxCompute的表分区描述。更多信息,请参见分区。 如果存在多级分区,使用半角逗号(,)分隔。
AccessKey ID 用于访问MaxCompute的AccessKey ID。 如何获取,请参见访问密钥。 重要 请确保您的AccessKey具有访问对应MaxCompute项目的权限。AccessKey Secret 用于访问MaxCompute的AccessKey Secret。 Endpoint 用于访问MaxCompute的Endpoint。更多信息,请参见Endpoint。 Tunnel Endpoint 用于访问MaxCompute的Tunnel Endpoint。更多信息,请参见Endpoint。 - 单击预览,查看文件预览结果。
- 确认无误后,单击下个配置。
- 在数据格式配置页签中,配置如下参数。
参数 说明 使用系统时间 - 开启使用系统时间,则解析后的日志时间显示为导入时的系统时间。
- 关闭使用系统时间,则需要手动配置时间字段和时间格式。
说明 推荐开启使用系统时间,日志时间可作为普通字段建立索引,用于日志查询。在导入历史数据时,如果数据时间早于当前时间减去Logstore数据保存时间,例如保存7天,那么时间为7天前的日志无法在控制台上查询。时间字段 如果关闭使用系统时间,则需要指定一个用于提取日志时间的字段。 时间格式 如果关闭使用系统时间,需要指定一个Java SimpleDateFormat语法的时间格式,用于解析时间字段或者使用正则表达式提取到的字符串。时间格式的语法详情请参见Class SimpleDateFormat。常见的时间格式请参见时间格式。 重要 Java SimpleDateFormat不支持Unix时间戳,如果您要使用Unix时间戳,时间格式指定为epoch。时区 如果关闭使用系统时间,需要指定一个时区,用于解析日志时间的时区。如果日志格式中已经有时区信息,则此参数无效。 - 可选:设置数据格式完成后,单击测试。
- 测试成功后,单击下个配置。
- 可选:在调度间隔页签中,配置如下参数。
参数 说明 导入间隔 MaxCompute数据导入日志服务的时间间隔。 立即执行 开启立即执行,则立即执行一次导入操作。 - 配置完成后,单击下一步。
- 在数据源设置中,配置如下参数。
- 预览数据及创建索引,然后单击下一步。日志服务默认开启全文索引。您也可以根据采集到的日志,手动创建字段索引,或者单击自动生成索引,日志服务将自动生成字段索引。更多信息,请参见创建索引。重要 如果您要查询和分析日志,那么全文索引和字段索引必须至少启用一种。同时启用时,以字段索引为准。
- 单击查询日志,进入查询和分析页面,确认是否成功导入MaxCompute数据。等待1分钟左右,如果有目标MaxCompute数据导入,则说明导入成功。
查看导入配置
创建导入配置成功后,您可以在控制台中查看已创建的导入配置及生成的统计报表。
- 单击目标Project。
- 选择目标日志库下的 ,单击配置名称。
- 在导入配置概览页面,查看导入配置的基本信息和统计报表。
相关操作
在导入配置概览页面,您还可以进行如下操作。
- 修改配置
单击修改配置,修改导入配置的相关配置,具体配置请参见设置导入配置。
- 删除配置 单击删除配置,删除该导入配置。警告 删除后不可恢复,请谨慎操作。