本文档将以通过DLA的元信息发现功能查询并分析OSS数据为例,帮助您快速掌握DLA的基本使用流程。
前提条件
说明 如果您还没有创建阿里云账号,系统会在您开通云原生数据湖分析服务时提示您注册账号。
更新时间:2021-02-18 14:44
本文档将以通过DLA的元信息发现功能查询并分析OSS数据为例,帮助您快速掌握DLA的基本使用流程。
参数 | 说明 |
---|---|
数仓模式和自由模式 | 您可以选择数仓模式或数仓模式:
|
OSS目录位置 | 文件在OSS中的存储地址,以/结尾。系统会根据您选择的文件夹路径,自动设置OSS路径。
说明 系统会自动拉取与DLA同地域的OSS Bucket,您可以根据业务需要从下拉列表中选择Bucket。选择Bucket后,系统会自动列出该Bucket下所有的Object和文件;选中目标Object和文件后,系统会自动将其添加到右侧的OSS路径处。
|
格式解析器 | 默认自动解析,即按照顺序调用所有内置解析器,也可指定特定文件类型的格式解析器,比如json、parquet、avro、orc、csv。 |
调度频率 | 您可以根据需要定期计划运行元信息发现任务。 |
Schema名称 | 设置Schema名称,即映射到DLA中的数据库名称(默认每个发现任务会新创建一个独立的Schema)。 |
配置选项 | 高级自定义设置项,如字段分隔符、引用标识、表头模式、允许单个列字段等。 |
select * from `schema1_test`.`supply_ceshi` limit 20;
。
在文档使用中是否遇到以下问题
更多建议
匿名提交