本章节将指引您快速完成一次完整的数仓建设操作。
Dataphin数据构建基本流程如下。
主流程 | 说明 | 操作指导 |
---|---|---|
准备工作 | 如果您是第一次登录Dataphin,需先完成注册阿里云账号、创建RAM账号、进入Dataphin控制台购买Dataphin实例、创建工作空间、创建数据域、创建同步任务时的目标表、添加工作空间的成员和角色等操作,同时您还需准备可以使用的数据源。 | 准备工作 |
数据引入 | 将您需要加工使用的数据源导入到Dataphin控制台。 | 数据引入 |
数据同步 | 通过Dataphin提供的同步任务功能,将数据源中的数据同步到您在Dataphin中创建的工作空间中进行处理加工。 | 数据同步 |
规范定义 | 根据Dataphin提供的数据研发模块,进行分析数据,明确统计指标。包括维度、业务过程、原子指标、业务限定、派生指标。 | 规范定义 |
数据建模 | 基于规范定义部分中数据的圈定,利用Dataphin中的研发模块进行数据的研发。 | 数据建模 |
补数据 | 为验证代码和周期任务是否正常,您可以手动发起补数据任务。 | 补数据 |
验证数据 | 补数据操作完成后,您可以通过即席查询来验证数据,验证通过的数据方可发布到生产环境。 | 验证数据 |
发布数据 | 开发环境的数据发布到生产环境进行运维调度。 | 发布数据 |
结果验证 | 如果您发布到生产环境的数据还没有开始执行调度任务。您可以通过在开发环境中操作以模拟调度任务,查看运维调度的结果是否符合预期效果。 | 结果验证 |
在文档使用中是否遇到以下问题
更多建议
匿名提交