DLA Ganos是基于云原生数据湖分析(Data Lake Analytics,DLA)系统设计开发的,面向时空大数据存储与计算的数据引擎产品。基于DLA无服务器化(Serverless)数据湖分析服务与内置的Spark计算引擎,DLA Ganos打通了阿里云各个存储系统,如PolarDB、Lindorm(HBase)、OSS等,通过统一的时空数据模型与计算接口,实现对多源异构数据的一体化管理与计算,并支持进行异构数据源关联分析等复杂运算。此外,DLA无服务(Serverless)架构使DLA Ganos完全按需使用,只需为您运行的查询付费,资源伸缩方便,无感知升级,显著降低了运营成本。DLA详情请参见什么是云原生数据湖分析

使用场景

DLA Ganos的最基本的应用场景就是将存储在不同的数据库系统或文件系统中的时空数据,通过ETL操作,实现数据源之间的数据流转与协同分析。如下图所示,用户通过DLA Ganos可以加载OSS上的GeoTiff文件为RDD模型,然后写入Lindorm(HBase)等存储系统实现数据归档,同时也可以同时加载多个数据源(PolarDB或Lindorm)的时空数据,进行清洗转换,并通过机器学习等工具进行分析计算,最终将分析结果写回到任意数据源中。最后,通过专业的时空数据服务发布系统(如GeoServer)将计算的结果发布为OGC标准服务供用户进行查询浏览。dla-ganos

产品优势

  • 高性价比

    依托于数据湖分析DLA的Serverless无服务器化架构,用户在使用DLA Ganos时无需基础设施和管理成本,不需要单独维护Spark实例,只需要申请虚拟集群后即可随时随用、按需付费。零启动时间,透明升级、QoS弹性服务等。

  • 数据库体验

    DLA Ganos基于Spark SQL设计开发了一系列针对空间数据分析的用户API,内置了大量基本时空UDF算子,用户可以像操作关系型数据库那样通过SQL处理海量时空数据,方便灵活。

  • 时空数据统一建模

    DLA Ganos基于Spark RDD设计开发了统一的时空数据模型,方便对各类时空数据进行建模。用户不再需要关注不同类型时空数据的处理,只需要将重点放在业务逻辑之中,将复杂的数据加载与模型转化任务交给DLA Ganos进行处理。

  • 异构数据源

    DLA Ganos支持多路数据源接入分析,提供了多样化、异构的数据源分析能力。客户不仅能够对阿里云OSS、PolarDB、Lindorm(HBase)中的数据进行分析,还能将这两者之间的数据进行关联性分析,解决了客户需要将不同种类的数据进行联合分析的问题。

开通DLA Ganos

  1. 创建虚拟集群,详情请参见虚拟集群管理
  2. 在创建好的虚拟集群右侧单击详情,进入集群详情页面。
  3. 集群详情页面,集群属性 > 版本处选择spark_dla_ganos即可开通DLA Ganos服务。