本文将为您介绍DataWorks V2.0版本的发布历史及新增特性。
DataWorks V2.0发布
发布版本:DataWorks V2.0
发布时间:2018年7月25日
发布范围:华东2区域
发布内容:DataWorks V2.0在DataWorks V1.0的基础上,新增业务流程、组件的概念,并完善数据开发体系。DataWorks V2.0支持双工作空间开发,隔离开发和生产环境,保证数据研发规范,减少错误代码的出现。
已升级DataWorks V2.0区域
目前所有区域均升级至DataWorks V2.0版本。
DataWorks V2.0版本操作差异
您可参见DataWorks V2.0系列详解视频,对DataWorks V2.0各功能模块的特性进行深入学习:
DataWorks V2.0版本更新一览表
DataWorks V2.0提升了整体视觉交互和数据开发模块的使用体验。新增智能监控、数据保护伞、数据质量和数据服务四大模块。
模块名称 | 子模块 | 对比项 | DataWorksV1.0 | DataWorksV2.0 | 改进效果 |
MaxCompute项目 | 项目管理模式 | 管理方式 | 一个 DataWorks项目对应一个MaxCompute项目。 | 引入标准模式的概念。一个 DataWorks工作空间对应两个MaxCompute项目,分别是开发环境和生产环境,详情请参见简单模式和标准模式的区别。 | 隔离风险,进一步保障生产环境代码的稳定性。 |
数据开发 | 任务开发 | 整体功能 | 进行单任务、工作流的代码编写、周期调度配置,完成后可提交运维中心自动调度。 |
|
|
SQL研发 | 以单个任务或工作流的形式,在页面上编写SQL代码并进行试运行。 | 提供更加智能的SQL编辑器以满足您的需求,可以实现:代码高亮、格式化、智能补齐、错误提示和表结构显示等人性化功能。 同时,您可以在编辑器右侧结构标签内,以图形化的形式直观地对SQL内部结构进行梳理。 | |||
节点配置 | 通过单个节点、工作流模式组合业务代码。 | 引入业务流程的概念替代工作流。您可以在业务流程中自由组合任务,并根据需求,将不同的资源归入业务流程中进行管理(所有任务、表、资源、函数都必须从属于一个业务流程)。您也可以通过解决方案,对业务流程进行整合,统一管理业务关联性较强的流程。 | |||
周期配置 | 工作流整体周期配置会影响单个任务的周期配置。 | 无法对组合后的节点进行整体周期配置,但可以对所有节点单独进行配置,且调度周期类型不受上下游节点影响。 | |||
依赖属性 | 工作流之间的依赖局限于整体。 | 不同业务流程中的任务节点可以相互依赖,不需要依赖业务流程整体。 | |||
脚本开发 | 整体功能 | 作为周期任务的补充,通常用于非周期的临时数据处理,如临时表的增删改等,因此不包含周期属性和依赖关系。 | 功能相同,更名为临时查询。 | ||
手动任务 | 整体功能 | 创建的所有节点都需要手动触发,无法通过调度执行。 | 功能相同,更名为手动业务流程。 | ||
资源管理 | 整体功能 | 作为一个单独标签管理该MaxCompute项目中的所有资源,包括 jar/file/archive。 | 作为业务流程中的一个子标签,您可以按需加入该业务流程中涉及到的资源,同时可以建立多层文件夹进行管理。 | ||
函数管理 | 整体功能 | 作为一个单独标签,管理该MaxCompute SQL编辑时需要的系统函数和自定义函数。 | 既可以作为一个单独标签存在并管理所有函数,也可以作为业务流程中的一个子标签,仅管理该业务流程中所需使用的函数。 | ||
表查询 | 整体功能 | 展示该MaxCompute项目下的所有表,同时能够预览内容、引用表名。 | 相同。 | ||
表管理(新增) | 整体功能 | 无 | 供开发者管理自己的表。可以进行生命周期设置、表管理(包括修改表的类目、描述、字段、分区等)、表隐藏/取消隐藏和表删除等操作。 | ||
临时查询 | 整体功能 | 无 | 用于在本地测试代码的实际情况与期望值是否相符,无提交、发布、设置调度参数功能。 | ||
组件管理(新增) | 整体功能 | 无 | 将大量相似并可复用的SQL代码抽象为SQL代码块或节点任务,可供您自由地配置输入输出参数,并将其运用到各个不同的实际业务中。 | ||
运行历史(新增) | 整体功能 | 无 | 展示最近三天内,在本地运行过的所有任务记录。同时可查看任务运行结果,并提供简单的过滤功能。 | ||
结果筛选(新增) | 整体功能 | 无 | 页面SQL运行的结果集成了Excel组件,让您在页面输出结果后,通过简单的过滤、筛选、排序得到所需结果。 | ||
回收站(新增) | 整体功能 | 无 | 用于防止您误删任务所带来的业务损失。您可以在回收站中查看当前工作空间下所有删除的节点,并提供恢复功能。 | ||
代码全局搜索 | 整体功能 | 无 | 您可以输入不完整字符串来查找包含该字符串的MaxCompute SQL、Shell、数据同步任务,快速定位自己所需查看或操作的任务。 | ||
发布功能 | 整体功能 | DataWorksV1.0标准模式项目下保留发布功能。 | 更名为项目克隆。仅简单模式的工作空间具备主动将任务克隆至其他工作空间的功能。 | ||
运维中心 | 任务列表 | 功能 | 根据节点类型、名称和责任人搜索任务。 | 增加通过业务流程、解决方案、基线名称来搜索任务的功能。 | 从业务视角来对任务进行运维,匹配了任务开发界面的新功能。 |
任务运维 | 功能 | 根据节点类型、名称、责任人、业务日期和运行日期搜索任务。 | 增加通过业务流程、解决方案、基线名称搜索任务的功能。 | ||
报警 | 功能 | 通过出错、完成和未完成等事件,作为监控报警的依据。 | 集成基线监控、事件报警、自定义报警三大功能,构建更加智能、完备的报警体系。 | ||
智能监控(新增) | 智能监控(Alarm)是DataWorks任务运行的监控及分析系统。根据监控规则和任务运行情况,智能监控决策是否报警、何时报警、如何报警以及给谁报警。智能监控会自动选择最合理的报警时间、报警方式和报警对象。 | 赋予用户在云上一站式完成数据开发、数据(安全)治理、数据分享的闭环体验。 | |||
数据质量DQC(新增) | 数据质量,是支持多种异构数据源的质量校验、通知、管理服务的一站式平台。 数据质量以数据集(DataSet)为监控对象,目前支持MaxCompute数据表和DataHub实时数据流的监控。当离线MaxCompute数据发生变化时,数据质量会对数据进行校验并阻塞生产链路,避免问题数据污染扩散。同时,数据质量提供了历史校验结果的管理,以便您对数据质量分析和定级。 | ||||
数据服务(新增) | 数据服务提供了快速将数据表生成数据API的能力,支持您将现有的API快速注册到数据服务平台以统一管理和发布。同时,数据服务已与API网关(API Gateway)打通,支持将API服务一键发布至API网关。数据服务与API网关一道为您提供了安全稳定、低成本、易上手的数据开放共享服务。 | ||||
数据保护伞(新增) | 数据保护伞为MaxCompute提供数据资产识别、敏感数据发现、数据分级分类、脱敏、访问监控、风险发现预警与审计的能力。 |