数据集成概述

背景信息 面对各行各业对数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

数据集成概述

背景信息 面对各行各业对数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将MaxCompute的数据迁移至其它业务平台。背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大...

管理数据目录

数据目录是数据湖构建(Data Lake Formation)的元数据最上层实体,可以包含若干个数据库。在EMR Serverless Spark中,您可以通过该功能来查看绑定的数据目录中的数据库和表,还可以添加已有的数据目录。该功能适用于需要实现元数据隔离的...

敏感数据保护

数据分类分级 Dataphin支持对数据的分类分级进行管理,内置了常用的个人信息数据分类,同时支持客户自定义企业的数据分类分级标准。Dataphin的数据分类,支持多级的数据分类层级管理,同时支持内置识别特征和识别方式,便于后续自动进行...

敏感数据保护

数据分类分级 Dataphin支持对数据的分类分级进行管理,内置了常用的个人信息数据分类,同时支持客户自定义企业的数据分类分级标准。Dataphin的数据分类,支持多级的数据分类层级管理,同时支持内置识别特征和识别方式,便于后续自动进行...

功能简介

数据查询为用户提供对云计算资源中物理表基本情况的概览能力,帮助用户直观了解物理表基础信息、字段内容分布等情况,建立对数据表的宏观理解,为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。数据导入 支持512 MB...

功能简介

数据查询为用户提供对云计算资源中物理表基本情况的概览能力,帮助用户直观了解物理表基础信息、字段内容分布等情况,建立对数据表的宏观理解,为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。如果数据表格存储的是...

数据查询

数据查询为用户提供对云计算资源中物理表基本情况的概览能力,帮助用户直观了解物理表基础信息、字段内容分布等情况,建立对数据表的宏观理解,为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。如果数据表格存储的是...

资源组操作及网络连通

如果您需要使用独享数据集成资源组通过内网同步ECS自建的数据库,您需要为独享数据集成资源组做相关的网络配置,详情可参见 新增和使用独享数据集成资源组,连通方案核心点为:独享数据集成资源组绑定ECS所在VPC,会自动添加一个路由指向...

概述

您可以将数据库中的表或单条SQL查询结果作为数据集,在仪表盘或大屏中对数据集中的数据以表格、交叉表、折线图、柱条形图、饼图、双轴图等图形或组件展现出来,并对这些图形或组件进行自由组合、布局,以某种分析思路对业务进行直观呈现。...

管理迭代

数据管理DMS的DevOps迭代提供了逐阶段推进研发流程的功能,每个迭代的阶段内都可以直接新建相应类型的工单,使得开发协同性更好,开发更高效。新建迭代 登录 数据管理DMS 5.0。在顶部菜单栏中,选择 数据库开发>研发空间>DevOps。单击 迭代...

CDH Hive数据抽样采集器

您可以通过DataWorks的数据抽样采集器功能,从CDH Hive表中随机抽取表的部分数据用于数据保护伞的敏感数据识别。如果您在数据保护伞中配置了脱敏规则,那么在数据地图表详情页面进行数据预览时,命中的敏感字段将会被脱敏。本文为您介绍...

访问外部数据

背景信息 Databricks数据洞察为了满足您在计算任务里访问您在阿里云上已有的数据,支持通过添加外部数据源的方式,打通集群到您自己VPC的网络环境。绑定数据源 绑定数据源的本质是打通不同VPC之间的网络,即将数据源集群所在VPC与目标...

数据地图概述

数据地图是在元数据基础上提供的企业数据目录管理模块,涵盖全局数据检索、元数据详情查看、数据预览、数据血缘和数据类目管理等功能。数据地图可以帮助您更好地查找、理解和使用数据。元数据采集与接入 MaxCompute数据 如果您使用了...

配置跨库Spark SQL节点

在数据仓库中对数据进行加工分析后,往往需要将数据同步回在线库中,以便在线应用提供相关的数据分析和统计服务。示例:某消费服务平台使用的是MySQL数据库,需要在数据仓库 AnalyticDB PostgreSQL版 中对消费数据进行消费金额、消费笔数等...

某网约车公司车辆轨迹数据

解决方案 在原有的架构上引入了阿里云数据库,并将全量数据写到 云原生多模数据库 Lindorm 中,同时增量数据通过Kafka、Spark等实时同步到 云原生多模数据库 Lindorm,这样解决了客户线下数据数据的问题。客户需要存储最近3年的数据...

基于Delta lake的一站式数据湖构建与分析实战

数据湖作为一个集中化的数据存储仓库,支持的数据类型具有多样性,包括结构化、半结构化以及非结构化的数据数据来源上包含数据库数据、binglog 增量数据、日志数据以及已有数仓上的存量数据等。数据湖能够将这些不同来源、不同格式的数据...

数据源管理

本文介绍如何管理数据源。前提条件 已登录DataV-Atlas管理控制台。已进入项目编辑器页面。添加数据 单击页面左下角的 添加数据,打开数据库选择窗口。在 已有数据集 页签中,选择需要添加的数据的空间表后,单击 添加到项目。说明 您也...

质量评估

质量评估通过完整性、准确性、一致性、唯一性、时效性、规范性等六个维度构建数据质量指标体系,来实现对数据质量的量化评估。完整性:数据完整性是指一个数据集的特定字段或属性都被赋予了数值。准确性:数据准确性是指数据准确的反映其所...

新建数据

通过新建数据域,实现对数据域的定义与管理,便于从数据域维度对数据模型进行分类管理,方便逻辑表设计时使用。本文介绍如何新建数据域。操作步骤 登录 数据资源平台控制台。在页面左上角,单击 图标,选择 协同。在顶部菜单栏,单击 图标...

新建数据

通过新建数据域,实现对数据域的定义与管理,便于从数据域维度对数据模型进行分类管理,方便逻辑表设计时使用。本文介绍如何新建数据域。操作步骤 登录企业数据智能平台。在页面左上角,单击 图标,选择 协同。在顶部菜单栏,单击 图标,...

功能简介

在完成数据同步配置后,数据同步模块可对数据同步任务的执行和运行情况进行全面的监控运维。可对任务总数、线上任务、正运行任务等核心指标进行统计,并可以实现异常任务执行状态的监控,当前实例状态监控。对任务的开始时间、结束时间、...

集成与开发概览

数据同步功能帮助您实现数据源之间的数据实时同步,适用于数据异地多活、数据异地灾备、本地数据灾备、跨境数据同步、云BI及实时数据仓库等多种业务场景。离线集成。更多信息,请参见 离线集成概述。离线集成是一种低代码的数据开发工具,...

数据同步

数据源管理 支持对数据同步的数据源端和目标端进行统一的注册和管理,支持对关系型数据库、文件、消息队列等多种类型数据源的配置,并可对所填写数据源的连通性进行有效性验证。支持对已配置连通的数据源进行元数据同步及数据对象查看,...

功能简介

数据源管理 支持对数据同步的数据源端和目标端进行统一的注册和管理,支持对关系型数据库、文件、消息队列等多种类型数据源的配置,并可对所填写数据源的连通性进行有效性验证。支持对已配置连通的数据源进行元数据同步及数据对象查看,...

应用场景

访问频度极高业务 如社交网络、电子商务、游戏、广告等。...实现对大数据的分布式分析处理,适用于商业分析、挖掘大数据处理场景。通过数据集成服务可自助实现数据在云数据库 Memcache 版与 MaxCompute 间的同步,简化数据操作流程。

数据标准

字段标准设计 数据元管理:提供对数据元的标准定义和统一管理,通过分析业务流程,抽象关键业务对象、业务对象属性,配置数据元的类型、长度、质量校验函数和引用数据字典,为逻辑表标准化设计及数据治理过程中的质量监控提供规则依据;...

功能简介

字段标准设计 数据元管理:提供对数据元的标准定义和统一管理,通过分析业务流程,抽象关键业务对象、业务对象属性,配置数据元的类型、长度、质量校验函数和引用数据字典,为逻辑表标准化设计及数据治理过程中的质量监控提供规则依据;...

实时数据订阅概述

每次对Lindorm表格的数据执行增删改操作时,数据订阅都会生成一个Stream Record键值对,键值对的键是这一行数据的主键,值是此次操作的详细信息(操作前的值,操作后的值,时间戳,操作类型)。开通模式 开通 云原生多模数据库 Lindorm ...

功能简介

字段标准设计 数据元管理:提供对数据元的标准定义和统一管理,通过分析业务流程,抽象关键业务对象、业务对象属性,配置数据元的类型、长度、质量校验函数和引用数据字典,为逻辑表标准化设计及数据治理过程中的质量监控提供规则依据;...

存储空间分析

您可以在 AnalyticDB for MySQL 空间总览页面查看集群和表的总数据量、冷数据量、热数据量、索引数据量、分区数量、节点的磁盘使用率等指标。查看集群级别的数据量 通过 空间总览 可以查看当前集群的 总数据量、热数据量、冷数据量、以及 ...

使用场景

数据治理与数据管控 DMS任务编排提供了数据源的配置和管理功能,支持对数据源进行统一管理和控制,保证数据的安全性和可控性。数据归档与清理 将业务数据周期性地归档至低价存储并进行分析。任务调度 对定时、定期或事件触发的任务进行调度...

备份恢复

逻辑备份:通过mongodump工具将对数据库的操作记录存储到逻辑备份文件中。恢复时通过回放命令的形式还原数据。恢复功能 数据可恢复性是判断数据库运维可靠性的关键指标。MongoDB提供如下恢复功能:按备份点将备份数据恢复至新建实例:从...

概览信息

对数据资产的全局及增量数据进行统计和展示。本文介绍如何查看及搜索数据资产。前提条件 已在运营模块中公开数据表、API和指标等数据资产。背景信息 在运营公开一条数据,资产首页刷新数量实时+1。在运营隐藏一条数据,资产首页刷新数量...

概览信息

对数据资产的全局及增量数据进行统计和展示。本文介绍如何查看及搜索数据资产。前提条件 已在运营模块中公开数据表、API和指标等数据资产。背景信息 在运营公开一条数据,资产首页刷新数量实时+1。在运营隐藏一条数据,资产首页刷新数量...

数据治理

任务开发上线之后,数据正在稳定生产中,您需要对对应的业务表通过可视化查看、自动的数据质量监控、敏感数据管理等多种不同方式进行治理,而以下这些模块就可以很好的帮助您对数据进行治理。可视化元数据管理 数据地图可以可视化的查看表...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用