本文将为您概要介绍DataWorks主要子模块的功能及基本使用场景。
使用流程与主要子模块
使用流程
DataWorks为您提供从端到端的一站式数据开发治理平台,数据处理流程主要包括以下几个阶段。
DataWorks子模块说明
功能目录 | 子模块 | 功能说明 |
数据集成 | 数据集成提供全面的数据同步解决方案,支持离线、实时及全增量同步。主要特点包括:
| |
数据建模与开发 | 数据建模产品包含数仓规划、数据标准、维度建模、数据指标四大产品模块。
| |
数据开发兼容多种计算引擎,提供智能编辑器和可视化工具,并通过独立的开发环境及可靠的管理功能,确保高效的任务管理和规范的数据开发流程。
| ||
运维中心支持对数据开发发布的周期任务、手动任务和实时任务进行以下运维操作:
| ||
数据地图以数据搜索为基础,提供表使用说明、数据类目、数据血缘、字段血缘等工具,帮助数据表的使用者和拥有者更好地管理数据、协作开发。 | ||
数据分析 | SQL查询支持在线SQL分析、业务洞察、编辑和分享数据。并支持将查询结果保存为图表卡片,快速搭建可视化数据报告便于日常汇报。 | |
数据洞察支持数据探索与可视化,助您理解数据分布、创建及组合数据卡片为报告,并可将结果生成长图进行分享。 | ||
数据治理 | 数据质量功能支持对常见大数据存储(如MaxCompute、E-MapReduce、Hologres、AnalyticDB PostgreSQL、AnalyticDB MySQL和CDH等)进行全面的质量校验。它从完整性、准确性、有效性、一致性、唯一性和及时性等多个维度配置监控规则,并可将这些规则与调度节点关联,在任务完成后自动触发校验。这有助于第一时间发现并处理问题数据,按需设置规则的严格程度以控制任务是否失败退出,从而防止脏数据的影响扩大,有效降低数据恢复的时间和成本。 | |
数据资产治理功能根据预先配置的治理计划,自动识别平台在数据存储、任务计算、代码开发、数据质量和安全等方面的问题,并通过健康评分进行量化评估。它从全局、工作空间和个人等多个视角,以治理报告和排行榜的形式呈现治理成果,帮助您高效达成治理目标。此外,还提供业务资产管理、资产分析、任务资源消耗明细和费用预估等功能,使您能够全面掌握各类资源的使用情况,优化资源配置。 | ||
数据服务 | 数据服务为企业搭建统一的服务总线,帮助企业统一创建及管理对内、对外的API服务,解决数仓、数据库与数据应用间的“最后一公里”,加速数据的流动和共享。
| |
其他 | 安全中心核心功能如下:
| |
数据保护伞为您提供敏感数据规则配置、识别敏感数据、查看识别结果、处理敏感数据等管控流程,帮助您在敏感数据产生的事件前、中、后各阶段管控梳理项目中的敏感数据,保障数据安全。 | ||
迁移助手支持迁移周期任务、手动任务、资源、函数、数据源、表元数据、临时查询和组件等对象。您可以根据业务需求,选择全量导出、增量导出或自选导出等方式导出DataWorks中的开发成果。 |