文档

ETL工作流快速体验

更新时间:

DataWorks推出ETL工作流模板案例集,旨在帮助您快速了解产品的最佳实践。您可以一键将案例导入至指定工作空间,快速还原案例,体验产品能力。

教程列表

DataWorks当前支持的ETL工作流模板列表如下:

说明

ETL工作流模板载入数据开发模块后,您可通过查看虚拟节点(业务流程第一个节点)查看案例详情。

教程(点击链接快速体验)

涉及产品

涉及模块

DataWorks版本要求

教程描述

网站用户行为分析

  • DataWorks

  • MaxCompute

  • MYSQL(无须开通)

  • OSS(无须开通)

  • 数据集成

  • 数据开发

基础版

0元开通即可体验

揭秘用户行为,驱动业务增长!该案例将通过数据分析技术,解析用户访问日志,结合用户信息,获取用户画像,并自动更新用户画像,实现网站的精细化运营。

案例配套文档:简单用户画像分析(MaxCompute版)

电商漏斗模型分析

  • DataWorks

  • MaxCompute

数据开发

基于漏斗模型,使用DataStudio数据开发模块完成从原始数据获取购买商品的用户路径数据,并计算从用户的浏览、点击、购买环节流量的转化情况。

智慧城市人口财产主题分析

  • DataWorks

  • MaxCompute

数据开发

以人口、房产等相关数据整合与人口特征提取为例,使用DataStudio数据开发模块。通过数据加工处理,并设置调度策略,实现数据处理的自动化,从而向您展示智慧城市项目下数据加工的整个过程。

GitHub十大热门编程语言

  • DataWorks

  • MaxCompute

  • 函数计算

  • OSS

  • 数据集成

  • 数据开发

基于GitHub Archive公开数据集,通过DataWorks数据集成模块获取过去1小时GitHub中提交次数最多的代码语言数据,在DataStudio数据开发模块通过函数计算节点周期调度实现将处理后的数据发送至用户预设的邮箱中。

说明

该教程使用的数据为真实数据,且每小时更新。

案例配套文档(与函数计算配合使用):通过函数计算节点实现GitHub实时数据分析与结果发送

零售电商GMV分析

  • DataWorks

  • MaxCompute

  • 数据集成

  • 数据开发

基于DataWorks提供的智能数据建模产品,使用该产品内置零售电子商务数仓模型,为您介绍DataWorks在数仓搭建过程中的技术栈及流程实现。

案例相关文档:零售电商数据建模

视频个性化推荐(协同过滤)

  • DataWorks

  • MaxCompute

  • PAI

数据开发

以社交平台的”猜你喜欢“和”详情页相关推荐“为例,通过在DataStudio数据开发模块中调用阿里云PAI中的协同过滤算法etrec,实现视频个性化推荐。

案例配套文档(与人工智能平台PAI配合使用):视频个性化推荐(协同过滤)

说明

您可修改案例数据生成自己的物品推荐列表。

拉链表实现

  • DataWorks

  • MaxCompute

  • 数据开发

  • 运维中心

基于DataWorks on MaxCompute实现拉链存储场景,使用DataStudio数据开发运维中心模块,实现拉链数据加载功能,记录电商订单从开始到当前状态(创建/支付/完成)所有变化信息。

案例配套文档:基于MaxCompute实现拉链表

归并节点应用

  • DataWorks

  • MaxCompute

数据开发

归并节点是DataStudio数据开发提供的逻辑控制节点,可对上游节点的运行状态进行归并,用于解决分支节点下游节点的依赖挂载和运行触发问题。本案例以上游任务运行失败不阻塞下游任务执行为例,为您介绍归并节点的使用。

案例配套文档:归并节点

调度参数常用列表

  • DataWorks

  • MaxCompute

数据开发

调度参数会根据任务调度的业务时间及调度参数的取值格式自动替换为具体的值,实现在任务调度时间内参数动态替换。通常,您可选择基于业务日期或定时时间获取相应的时间数据。

案例配套文档:配置并使用调度参数

赋值节点应用

  • DataWorks

  • MaxCompute

数据开发

标准版及以上版本

DataStudio数据开发模块的赋值节点支持ODPS SQL、Shell和Python三种赋值语言,通过赋值节点实现将上游节点任务的查询或输出结果提供给下游节点使用。

案例配套文档:赋值节点

注意事项

  • 案例导入可能会产生少量费用,具体收费请以案例说明为准。

  • 案例提供的数据仅用于阿里云大数据开发治理平台DataWorks数据应用体验。

  • 空间管理员角色可导入ETL模板至目标工作空间。如需给账号授予空间管理员角色,请参见空间级模块权限管控

导入ETL工作流模板

您可以将DataWorks ETL工作流模板直接导入至目标工作空间进行体验,具体操作如下:

  1. 登录DataWorks控制台

    说明

    若您是首次登录DataWorks控制台,可以0元开通DataWorks产品,进行后续模板导入操作。

  2. 查看案例列表。

    点击左侧导航栏的大数据体验 > ETL工作流模板,进入ETL工作流模板页面。

  1. 查看案例详情。

    ETL工作流模板页面点击任意案例的查看详情按钮,进入案例详情页面查看详情,支持的案例请参见教程列表

  2. 导入案例至指定空间。

    在案例详情页面,点击载入模板。填写载入模板对话框,单击确认

    说明

    不同的案例教程使用的产品以及导入前校验要求不同,请根据载入模板对话框的内容指引配置并导入即可。

清理与释放

体验完成后,您可参考以下文档删除当前案例所生成的资源。

相关文档

  • 本页导读 (1)
文档反馈