通过RAM角色授权模式配置数据

场景示例:如上文待扮演角色的场景示例所述,当云账号管理者为大数据团队定义了 BigDataOssRole 角色后,需要指定仅相关人员才能使用该角色。您可以自定义Policy为 BigDataOssRoleAllowUse,并授权给相关人员。创建名称为 ...

数据资产等级定义

分析数据链路 定义数据资产等级后,您可以从数据流转链路开始进行数据资产等级打标,完成数据资产等级的确认,给不同的数据定义不同的重要程度。MaxCompute进行数据加工基本流程为从业务系统上产生数据,通过同步工具(DataWorks的数据集成...

功能特性

EMR on ECS 功能集 功能 功能描述 参考文档 集群管理 创建集群 您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行规模数据处理和分析等操作。创建集群 释放集群 在完成EMR集群任务后及时释放集群,可以释放资源...

SELECT FUNCTION

列的数据类型必须与SQL语言定义函数定义数据类型保持一致。table_name:待查询目标表的名称。使用示例-创建目标表src。create table src(c bigint,d string);insert into table src values(1,100.1),(2,100.2),(3,100.3);调用my_add函数...

内存型

云原生内存数据库Tair 内存型(简称内存型)适合并发量、读写热点多、高性能场景,内存型重点增强了多线程性能并集成多个自研扩展数据结构。购买方式 创建实例 主要优势 类别 说明 兼容性 100%兼容原生Redis,无需修改业务代码,提供 ...

无感集成(Zero-ETL)

方案概述 在大数据时代,企业面临着大量分散在不同的系统和平台上的业务数据,为了有效地管理和利用这些数据,企业往往需要依赖于ETL工具对数据进行集中式管理。ETL是将上层业务系统的数据经过提取(Extract)、转换清洗(Transform)、...

数据服务入门

步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据源网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

管理数据定义资源

本文介绍在选择数据定义资源后,对应窗口的功能。前提条件 已登录DataV-TwinFabric控制台。已进入精修模式下的场景编辑器页面。上传数据定义 在 资源管理 窗口右上角,单击 导入>数据定义。在资源管理窗口,查看已导入的资源。搜索数据定义...

二进制数据类型

本文介绍了二进制数据类型的定义及相关语法。名称 存储大小 说明 BINARY 二进制字符串的长度。定长二进制字符串,取值范围:1~8300。BLOB 实际二进制字符串加1字节(如果二进制字符串小于127字节)或4字节(如果二进制字符串大于等于127...

定义维度与构建总线矩阵

明确每个数据域下有哪些业务过程后,您需要开始定义维度,并基于维度构建总线矩阵。定义维度 在划分数据域、构建总线矩阵时,需要结合对业务过程的分析定义维度。以本教程中A电商公司的营销业务板块为例,在交易数据域中,我们重点考察确认...

词云(v1.x版本)

最大字号 组件中文本的最大字号,定义数据中 value 值最大的文本大小。最小字号 组件中文本的最小字号,定义数据中 value 值最小的文本大小。绘制形状 单击 图标开启后,词条会均匀地展示在图片显示的形状上。形状图片:将鼠标移动到图片...

离线同步常见问题

数据定义:单条数据写入目标数据源过程中发生了异常,则此条数据为脏数据。因此只要是写入失败的数据均被归类于脏数据。脏数据影响:脏数据将不会成功写入目的端。您可以控制是否允许脏数据产生,并且支持控制脏数据条数,数据集成默认...

定义维度与构建总线矩阵

明确每个数据域下有哪些业务过程后,您需要开始定义维度,并基于维度构建总线矩阵。定义维度 在划分数据域、构建总线矩阵时,需要结合对业务过程的分析定义维度。以本教程中A电商公司的营销业务板块为例,在交易数据域中,我们重点考察确认...

管理工作流定义

在左侧导航栏,选择 数据开发>工作流定义。在 工作流定义 页面,单击 创建工作流。在 创建工作流 页面,拖拽节点块到画布中,在弹出的对话框中,配置相关的参数,单击 确定。本示例以SHELL类型为例,其他任务类型详情请参见 任务类型。如需...

公共维度汇总层(DIM)

定义维度 在划分数据域、构建总线矩阵时,需要结合对业务过程的分析定义维度。本教程以A电商公司的营销业务板块为例,在交易数据域中,我们重点考察确认收货(交易成功)的业务过程。在确认收货的业务过程中,主要有商品和收货地点(本教程...

公共维度汇总层(DIM)

定义维度 在划分数据域、构建总线矩阵时,需要结合对业务过程的分析定义维度。本教程以A电商公司的营销业务板块为例,在交易数据域中,我们重点考察确认收货(交易成功)的业务过程。在确认收货的业务过程中,主要有商品和收货地点(本教程...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

SQL概述

数据定义语言DDL(Data Definition Language):对数据库中资源进行定义、修改和删除,如新建表和删除表等。数据操作语言DML(Data Manipulation Language):用以改变数据库中存储的数据内容,即增加、修改和删除数据。数据查询语言DQL...

数据质量:全流程的质量监控

DataWorks的全流程数据质量监控功能为您提供35种预设表级别、...数据质量为您解决以下问题:数据库频繁变更问题 业务频繁变化问题 数据定义问题 业务系统的脏数据问题 系统交互导致质量问题 数据订正引发的问题 数据仓库自身导致的质量问题

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

调度参数支持的格式

通常,使用括号${.},结合 yyyy、yy、mm 及 dd 自定义组合生成时间参数,获取业务日期前后多少年、月、天。说明 业务日期为 定时时间所在日期-1。即${yyyymmdd} 的取值与$[yyyymmdd-1]取值一致。可通过${yyyymmdd}、${yyyy-mm-dd} 等${.}...

数据服务概述

设计理念 数据服务作为DMS的模块,其基于DMS上受控的数据定义API,与SQL Console中执行SQL时的权限控制、数据脱敏等功能检查保持一致。数据服务基于Serverless架构,您无需关注服务器、网络等运行环境相关的基础设施,只需专注于API的定义...

DataWorks on EMR数据安全方案

大数据领域,阿里云为企业用户提供了一整套数据安全方案,包含用户认证、数据权限、大数据作业管理体系等。本文以联合使用DataWorks与EMR为例,为您介绍DataWorks on EMR场景下的数据安全方案。背景信息 DataWorks on EMR目前支持LDAP...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

数据分析整体趋势

大数据数据库一体化:早期大数据技术以牺牲一定程度一致性为基础提供分布式能力,解决了传统单机数据库的扩展性不足问题,在MapReduce基础上提供了标准SQL接口,架构上也逐步采用了部分MPP数据库技术;另一方面,分布式数据库也快速发展...

账单数据订阅及查询分析

DataWorks及MaxCompute:DataWorks基于MaxCompute等大数据引擎,支持您在线进行SQL分析、业务洞察、编辑和分享数据,以及将查询结果保存为可视化图表卡片,快速搭建可视化数据报告。订阅账单数据后,用户中心会将相关账单数据同步至指定...

新建账号

数据定义语言 DDL 语句用于定义、更改和删除 Schema 对象。更多信息请参见 SQL 语句。授权数据库 选填内容,仅 MySQL 租户在创建普通账号时才会显示该参数。支持对未授权账号进行授权,权限包括:只读、读写、仅 DDL 和仅 DML。MySQL 模式...

数据查询

您可以查看云计算资源中物理表基本情况的概览能力,帮助您直观了解物理表基础信息、字段内容分布等情况,建立对数据表的宏观理解,为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。前提条件 已根据快速入门教程完成...

散点层

数据分级:根据数据中的value字段值大小划分(自然分割)成2~7个数据大小级别,解决value值相差太导致的渲染问题。散点贴图:散点层贴图样式,可黏贴贴图URL链接获取。散点大小(从小到):单击右侧的 或 图标,添加或删除一个散点大小...

东软案例

如下图所示,阿里Lindorm数据库在赋能政企数字运维团队更强大的运维大数据分析能力的同时,幅度提升了政府、企业数字系统性能和在线服务的客户数字体验,降低了低价值密度监控数据存储管理成本。图 1.阿里云Lindorm数据库驱动的IT运维...

云产品集成

常见云产品如下:大数据开发治理平台 DataWorks 实时计算 Flink 版 数据库管理 DMS DataV 数据可视化 Quick BI 数据分析与展现 前提条件 已获取 OceanBase 数据库的基本连接信息,详细步骤请参见 获取连接参数。大数据开发治理平台 ...

DataWorks模块使用说明

使用流程概览:参考文档:DataWorks数据建模 子模块:数据开发(DataStudio)功能说明:数据开发(DataStudio)是一站式大数据开发平台,支持在线开发MaxCompute、EMR、Hologres、CDP、ADB等多种大数据引擎的数据处理任务。它集成了强大的...

概述

解决方案 T+1全量同步一键建仓是指通过DLA控制台配置数据源(RDS、PolarDB for MySQL、MongoDB数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,...

典型场景

基于湖构建数据平台,支持BI、挖掘等业务 对象存储OSS可以作为湖存储,DLA基于OSS构建一站式的大数据平台。具体包括构建数据湖、数据ETL、交互式查询、机器学习等功能。构建数据湖 实时数据湖:支持DB的CDC与消息数据(如Kafka)入湖,构建...

功能简介

数据字典管理:支持创建并维护逻辑表中使用的数据字典,方便用户在定义数据元或维度属性时进行数据字典引用,支持数据字典物理化、数据字典导入、导出,方便数据字典使用与跨项目复制。质量校验函数:支持质量检测函数自定义,方便用户在...

功能简介

数据字典管理:支持创建并维护逻辑表中使用的数据字典,方便用户在定义数据元或维度属性时进行数据字典引用,支持数据字典物理化、数据字典导入、导出,方便数据字典使用与跨项目复制。质量校验函数:支持质量检测函数自定义,方便用户在...

功能简介

数据查询为用户提供对云计算资源中物理表基本情况的概览能力,帮助用户直观了解物理表基础信息、字段内容分布等情况,建立对数据表的宏观理解,为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。数据导入 支持512 MB...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用