本模块将为您介绍DataWorks的设计思路和核心功能,以帮您深入了解阿里云DataWorks。

课程概述

课程时长:2小时,采用在线学习的方式。

课程对象:面向Java工程师、产品运营等Dataworks所有的新老用户。只需熟悉标准SQL,即可快速掌握DataWorks的基本技能,无需对数据仓库和 MaxCompute的原理过多了解。建议您进一步学习Dataworks课程,深入了解Dataworks的基本概念及功能,详情请参见什么是DataWorks

课程目标:以常见的真实的海量日志数据分析任务为课程背景,争取在完成课程后,您对DataWorks的主要功能有所了解,能够按照课程演示内容,独立完成数据采集 、数据开发和任务运维等数据岗位常见的任务。

本课程包括以下内容:
  • 产品简介:学习DataWorks的发展历史、整体架构、相关模块构成与关系。
  • 数据采集:学习如何从不同的数据源同步数据至MaxCompute中、如何快速触发任务运行、如何查看任务日志等。详情请参见数据采集:日志数据上传
  • 数据加工:学习如何运行数据流程图、如何新建数据表、如何新建数据流程任务节点、如何配置任务的周期调度属性。详情请参见数据加工:用户画像
  • 数据质量:学习如何给任务配置数据质量的监控规则,以保证任务运行的质量问题。详情请参见数据质量监控
  • 通过Function Studio开发UDF:学习如何通过Function Studio开发UDF,并将其提交至DataStudio的开发环境。详情请参见通过Function Studio开发UDF

DataWorks简介

DataWorks是数加平台&DataWorks团队倾力9年打造的一款一站式大数据研发平台,以MaxCompute为主要计算引擎,上层有机融合数据集成、数据建模、数据开发、运维监控、数据管理、数据安全和数据质量等产品功能,同时与算法平台PAI打通,完善了从大数据开发到数据挖掘、机器学习的完整链路。

学习答疑

如果您在学习过程中遇到问题,可以加入钉钉群:11718465进行咨询。