UpdateFile

该参数与 DataWorks控制 数据开发任务的“调度配置>时间属性>出错自动重跑”的”重跑间隔“配置对应。控制台中“重跑间隔”的时间单位为分钟,请在调用时注意转换时间。RerunMode String 否 ALL_ALLOWED 重跑属性。取值如下:ALL_...

CreateFile

调用CreateFile,在数据开发中创建一个文件。目前不支持调用该接口创建数据集成节点任务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 ...

必读:简单模式和标准模式的区别

附录:不同工作空间模式下,DataWorks模块对应操作的数据源 您可以在 数据开发>数据源 界面下查看数据开发中已绑定的数据源信息。绑定后不同工作空间模式下,DataWorks模块对应操作的数据源如下表所示:DataWorks模块 标准模式 简单模式 ...

应用示例:数据开发过程触发事件检查

支持的扩展点事件 DataWorks数据开发中,目前支持对以下的扩展点事件进行消息通知,通过扩展程序实现校验并响应。DataStudio-运行文件 DataStudio-提交文件 DataStudio-发布文件 DataStudio-删除文件 DataStudio-提交表 DataStudio-发布表 ...

数据地图概述

说明 如果需要在 数据开发 表管理 进行可视化建表操作,请先在数据地图进行元数据采集,可视化建表操作仅支持绑定为引擎类型的数据源。详情请参见 表管理。网络连通 如果您需要将数据源中的元数据导入数据地图进行统一的元数据管理,...

基本概念

其中,在数据开发中绑定MaxCompute、Hologres、AnalyticDB for PostgreSQL、AnalyticDB for MySQL 3.0、ClickHouse、E-MapReduce和CDH/DCP数据源后,即可在工作空间开发和调度引擎任务。业务流程 针对业务实体,抽象出 业务流程 的概念,...

开发ODPS Spark任务

说明 由于数据开发中的ODPS Spark节点没有运行入口,因此您需要在开发环境的运维中心执行Spark任务。查看返回结果。待补数据实例运行成功后,进入其运行日志的 tracking URL 中查看运行结果,如下:False True True True True 编辑代码:...

概述

数据开发 的核心功能如下:文件夹 用于存放并管理数据数据开发节点。详情请参见 文件夹。Hologres开发 用于周期性调度作业。详情请参见 Hologres开发:周期性调度。一键MaxCompute表结构同步 支持使用可视化方式批量创建外部表,加速...

操作指南

您可以在Dataphin工作进行数据开发数据治理等操作。功能 文档 Dataphin全托管 数仓规划概述 数据引入概述 数据开发概述 发布中心概述 运维中心概述 分析平台概述 标签工厂概述 资产全景及目录概述 数据标准概述 资产质量概述 资源治理...

技术架构选型

数据模型设计之前,您需要首先完成技术架构的选型。本教程使用阿里云大数据产品MaxCompute配合...MaxCompute作为整个大数据开发过程的离线计算引擎。DataWorks则包括数据开发数据质量、数据安全、数据管理等在内的一系列功能。

流程管控

DataWorks提供了全链路的数据开发治理能力,为您提供了统一的数据开发治理流程,同时也支持您在DataWorks的默认流程上基于自己的业务需求在关键的流程节点进行流程管控。本文为您介绍DataWorks在数据开发过程支持的流程管控能力。背景...

资产安全概述

应用场景 基于Dataphin实现数据安全保护的一些典型的场景:场景1:业务数据中敏感数据保护 您可以使用资产安全的敏感数据识别和保护功能,脱敏明文敏感数据,保证业务数据安全。例如,姓名张三脱敏后*三。场景2:开发环境数仓建设 敏感数据...

资产安全概述

应用场景 基于Dataphin实现数据安全保护的一些典型的场景:场景1:业务数据中敏感数据保护 您可以使用资产安全的敏感数据识别和保护功能,脱敏明文敏感数据,保证业务数据安全。例如,姓名张三脱敏后*三。场景2:开发环境数仓建设 敏感数据...

数据开发与运维中心:数据加工

DataWorks的 数据开发(DataStudio)是数据加工的开发平台,运维中心 是智能运维平台,基于这两个功能模块,您可以在DataWorks上规范、高效地构建和运维数据开发工作流。功能概述 DataWorks的数据开发的亮点功能如下。DataStudio支持...

附录:预设角色权限列表(空间级)

不同预设角色对DataWorks各空间级功能的操作权限详情请参见下文的:数据管理 发布管理 按钮控制 代码开发 函数开发 节点类型控制 资源管理 工作流开发 数据集成 数据建模 数据分析 此外,空间级预设角色对MaxCompute引擎数据也具有一定的...

SaaS应用场景

如下图所示:该产品支持在消费者进入咨询后,先通过新零售智能客服(机器人)智能应答,解决不了转接人工,人工客服可登录新零售在线客服工作快速应答,工作会提供相应的辅助功能,提升客服回复效率。新零售智能客服 能力包括但不仅...

项目分配与安全

在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程,建议参考下图建立您的MaxCompute项目,图的每一个方块代表一个项目。...

概述

如果您在2022年2月21日21点前使用过数据开发功能,需要继续在EMR上使用数据开发功能,建议您尽快迁移到EMR Workflow,详情请参见 EMR旧版数据开发迁移公告。您也可以迁移到大数据开发治理平台DataWorks,详情请参见 EMR数据开发停止更新...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

手动添加数据

您可以通过 数据库备份DBS 的手动添加数据源功能,将不同环境的数据库添加至 数据库备份DBS ,便于后续对数据源进行管理与备份。费用说明 添加数据源操作不会产生费用,只有在添加数据源后开启备份才会产生费用。如何开启备份,请参见 ...

DataWorks新版数据源公告

若想使用创建的数据源进行数据开发,则数据源创建完成后还需进入数据开发(DataStudio)进行模块绑定。已绑定的计算引擎:已绑定的计算引擎迁移至 数据开发>数据源 管理。编辑计算引擎:不再支持直接编辑计算引擎,如需编辑可直接通过编辑...

集成与开发概览

DMS的数据集成与开发功能模块,针对数据全生命周期的集成、开发、服务三个阶段提供界面化的功能支持。功能简介 数据集成与开发功能模块支持多种计算、存储引擎,支持结构化、半结构化、非结构化数据的实时集成、离线集成、开发、服务,能够...

DataWorks节点合集

DataWorks的数据开发(DataStudio)模块为您提供多种类型的节点,包括用于数据同步的数据集成节点,用于数据清洗的引擎计算节点(例如,ODPS SQL、Hologres SQL、EMR Hive),以及可对引擎计算节点进行复杂逻辑处理的通用节点(例如,可...

基于模型生成ETL代码

维度表、明细表、汇总表等模型表发布后,DataWorks智能数据建模的模型开发功能支持快速生成代码框架,帮助您提高后续数据开发效率。本文为您介绍如何通过模型开发功能生成代码框架。前提条件 模型表已发布,操作详情请参见 发布模型至引擎...

场景:MaxCompute引擎在不同模式工作空间访问资源与...

标准模式下,支持开发环境和生产环境隔离,开发环境和生产环境的数据库表命名有所区别,如果需要在开发环境访问生产环境的数据库表,请根据以下命名规范严格区分数据库表名,避免误操作生产环境。环境类型 标准模式 示例 开发环境 项目名_...

数据仓库研发规范概述

在大数据时代,规范地进行数据资产管理已成为推动互联网、大数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范,可以切实提高研发效率,保障数据研发工作有条不紊地运作。而不完善的研发流程,会...

数据集成

数据源支持情况 数据集成目前支持40种以上的数据源类型(包括关系型数据库、非结构化存储、大数据存储、消息队列等),通过定义来源与去向数据源,并使用数据集成提供的数据抽取插件(Reader)、数据写入插件(Writer),实现任意结构化、...

ScanSensitiveData

调用ScanSensitiveData识别输入数据中是否存在敏感数据。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action ...

概述

DataWorks为您提供了多个实验教程,帮助您从前期的环境准备、数据采集,到后期的数据开发、结果展示,端到端了解DataWorks使用的全流程,更加熟悉产品的核心功能。DataWorks目前提供的产品教程如下:简单开发应用教程 简单用户画像分析...

导入数据至维表

如果导入的数据中存在非STRING类型,会被自动转义为STRING类型。电子表格 参数 描述 电子表格 从 电子表格 下拉列表中,选中需要导入的电子表格名称。Sheet 从 Sheet 下拉列表中,选中该电子表格中需要导入的Sheet页。数据预览 预览需要...

功能简介

面向数据资产管理者提供服务的统计分析、服务用量统计分析、热门数据统计分析能力,实现数据中台建设后半场“数据应用”的有效落地,支撑数据智能应用的高效开发。通用资源 提供了自定义函数和函数资源的能力,帮助用户在数据开发等过程中...

相关的云服务

DataWorks作为阿里云一站式大数据开发与治理平台,通常会与计算引擎产品联合使用,此外使用DataWorks进行数据集成时通常联合进行数据传输的数据源产品一起使用。本文为您介绍典型场景下,使用DataWorks时通常会使用到的其他云产品。计算...

数仓规划概述

数据域 数据域是一个较高层次的数据归类标准,是对企业业务过程进行抽象、提炼、组合的集合,是企业业务人员在使用数据时第一个分组入口,可以帮助企业业务人员快速的从海量的数据中快速圈定到自己的业务数据。详情请参见 数据域。业务过程...

数据建模

前提条件 开始本文的操作前,请首先完成 加工数据 的操作。新建实验 新建空白工作流并进入工作流,具体操作,请参见 新建自定义工作流。载入数据集 在左侧组件列表,将 源/目标 下的 读数据表 组件拖入画布中,并重命名为data4ml。在画布...

调度周期:周调度

配置示例 配置路径 您需要进入数据开发节点的编辑页面,单击右侧导航栏的 调度配置,在 调度配置>时间属性 区域配置节点的调度周期。场景示例 配置详情 目标任务配置在每周一、周五两天定时运行,则在周一、周五生成的实例会正常调度执行,...

调度周期:月调度

配置示例 配置路径 您需要进入数据开发节点的编辑页面,单击右侧导航栏的 调度配置,在 调度配置>时间属性 区域配置节点的调度周期。场景示例 配置详情 目标任务配置在每月最后一天运行,则每月最后一天生成的实例会正常调度执行,而其它...

数据标准概述

DataWorks数据建模支持在建模前规划制定数据标准,或在建模使用过程根据业务情况沉淀企业业务的数据标准。通过规范约束标准代码、度量单位、字段标准、命名词典,来保障后续建模与应用过程中数据处理的一致性,从源头上保障数据的标准化...

敏感数据溯源

DataWorks的数据溯源功能,支持通过提取数据泄露文件中数据的水印信息,帮助您定位到可能会泄露目标数据的责任人。本文为您介绍如何创建溯源任务,并通过该任务查找可能会泄露数据的责任人。前提条件 已创建 数据识别规则,详情请参见 配置...

常见问题

本文为您介绍数据集成任务常见问题。资源组操作及网络连通 在做离线同步时,我们需要先了解哪些DataWorks及其网络能力?同步ECS自建的数据库的数据时,如何保障数据库与DataWorks的网络连通?数据库和DataWorks不在同一个地域(Region)下...

数据集成:全领域数据汇聚

DataWorks的数据集成功能模块是稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。功能概述 DataWorks数据集成支持离线同步、实时同步,以及离线和实时一体化的全增量同步...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用