云原生数据湖分析DLA(Data Lake Analytics)是无服务器(Serverless)化的云上交互式查询分析服务,支持通过SQL和Spark引擎分析多种数据源中的数据。快速入门旨在介绍如何开通DLA、构建数据湖、调用SQL和Spark引擎进行数据分析与计算,帮助您掌握DLA的基本使用流程。

如果您是首次使用云原生数据湖分析DLA的用户,我们建议您先阅读以下部分:
  • 产品简介-本内容概述了云原生数据湖分析DLA的产品概念、产品优势及应用场景等内容。
  • 产品定价-本内容介绍了云原生数据湖分析DLA的产品定价、计费方式等信息。
云原生数据湖分析DLA入门指南(本指南)-本指南提供了有关使用云原生数据湖分析DLA的基本流程。操作流程概览如下:操作流程
  1. 开通云原生数据湖分析服务
  2. 可选:创建虚拟集群:CU版适用于查询频率高、查询数据量较大的场景,同时也能够给您使用DLA的费用预算带来一定的确定性。推荐您使用CU版本来进行数据分析与计算。
    说明 如果您使用系统默认的扫描量版本来进行数据分析与计算,则无需创建虚拟集群,可以跳过此步骤。CU版与扫描量版的具体差异,请参见扫描量版本与CU版本的差异
  3. 构建数据湖:您可以通过以下多种方式来构建数据湖。例如:
  4. 数据分析与计算:您可以调用Serverless SQL和Spark引擎来进行数据分析与计算。具体请参见Serverless SQLServerless Spark
  5. 数据应用:您可以通过DataWorks和DMS来调度DLA SQL和DLA Spark任务,也可以将OSS数据的查询分析结果以BI报表形式进行展示。具体请参见ETL调度快速搭建Quick BI可视化报表