全部产品
云市场

概述

更新时间:2019-10-10 14:43:00

数据建仓的常见过程与痛点

一般企业业务增长到一定范围之后,企业会尝试搭建自己的数据仓库,全面梳理业务系统,建立数据标准,生成不同类型的主题库,挖掘企业的数据价值。

大部分阿里云用户将RDS或者ECS自建数据库作为业务系统数据库,随着业务数据的增长,业务系统数据库存储的数据越来越多。由于RDS或者ECS自建数据库计算能力有限,如果直接使用RDS或者ECS自建数据库搭建数据仓库,将会占用线上业务的计算资源从而会影响业务的运行。如果使用自建开源大数据生态体系(例如Hive、Spark等),需要专门的大数据工程师来操作和运维,且操作流程也不像使用MySQL一样简单,使用成本极高。

基本概念

一键建仓是指通过DLA控制台配置数据源(RDS数据源、ECS自建数据库数据)和目标数据仓库(OSS数据仓库、AnalyticDB for MySQL数据仓库),系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库,同时在数据仓库中创建与数据源表相同的表结构,在DLA中创建对应的数据仓库表结构。无需创建任何表,您可以基于目标数据仓库进行数据分析,不影响数据源端的线上业务运行。

一键建仓流程

一键建仓流程

优势及特点

  • 一键同步数据源(RDS数据源、ECS自建数据库数据)中的上千张表数据,无需任何额外的适配工作。

  • 提供Serverless的服务形态,用户无需维护任何实例,零运维成本。

  • 同步过程中,数据源中的数据存储在目标数据仓库(OSS数据仓库、AnalyticDB for MySQL数据仓库)中,搭建数据仓库过程中不会对数据源端的业务系统产生任何压力。

  • 通过DLA控制台配置建仓任务,自定义设置定时数据投递。

    配置好建仓任务之后,后续使用数据仓库的流程和步骤可以参考RDS for MySQL使用方法。

  • 极致的计算能力,充分发挥DLA的计算能力,通过DLA的大内存、并发计算完成复杂的多表JOIN以及数据仓库搭建过程中的其他必要操作。

下一步

开始使用一键建仓