云原生数据湖分析(Data Lake Analytics,DLA)是一种架构的云原生数据湖分析服务,对比常规的分析方案具有如下优势:

对比类目 自建Hadoop系统 阿里云 DLA + OSS方案
产品体系 复杂、组件较多 一体化、端到端(入湖=>管理=>ETL =>分析查询),产品体验好;组件精耕细作 Presto、Spark;
持有成本 高(弹性弱,一直持有固定集群) 低(按照扫描量计费 或者CU收费,按照实际使用计费)
学习与运维成本 高(需要较长时间 搭建、配置、运维、学习) 低(即开即用、零运维成本)
弹性 云原生、弹性强、一分钟可弹300节点参与计算
安全、多租户 基于 Kerberos&Ranger,较为复杂 支持数据库模式库、表授权模式,多租户
功能 开源功能,缺乏云连接器的支持,云内部系统对接与优化 针对阿里云OSS & OTS &ADB 等数据源深度优化