新零售:特步

解决方案 通过 PolarDB-X+RDS的分布式数据库解决方案支撑O2O全渠道业务中台系统上线,通过垂直拆分剥离各业务中心,使不同类型的业务数据可以存储在不同的RDS上,确保资源和访问隔离,从物理上使整个数据库架构具备了扩展性。通过这套架构...

应用场景

实时通道 通过数据总线,业务数据能够实时汇入数据系统,缩短数据分析周期。2.实时数据清洗和分析 2.1 接入多种异构数据,实时清洗并归一化 通过数据总线和实时计算,您可以把多种数据源的异构数据实时清洗成统一的结构化数据,为进一步...

客户案例

基于飞天大数据平台产品DataWorks+MaxCompute大大提高了数据业务的开发效率,构建大润发的数据中台体系。新金融行业:某互联网金融公司湖仓一体案例 客户架构如下。客户简介 公司的第一代数据湖是基于Hadoop+OSS搭建的,同时引入的数据中台...

什么是DataWorks

世界500强亿滋中国:通过DataWorks智能数据建模进行链路的数据模型治理,极提升数据中台的自服务能⼒,让企业数据决策实现下放,释放新零售的数字化力量。上市公司创梦天地:基于开源的EMR引擎,用DataWorks替换自研调度系统,企业内部...

概述

业务挑战 部分阿里云用户会将阿里云关系型数据库RDS、PolarDB for MySQL、MongoDB或者云服务器ECS自建数据库作为业务系统数据库,随着业务数据的增长,业务数据库存储的数据也越来越多。但RDS、PolarDB for MySQL、MongoDB或者ECS自建...

高压缩引擎(X-Engine)介绍

挑战和诉求:历史数据归档 历史数据归档的挑战 部分业务数据的读写特征,都是最新产生的数据会被更频繁地读取或更新,而更久之前的数据(如1年前的聊天记录或订单信息)很少被访问。随着业务发展,数据库系统中会积累大量访问频率很低...

功能特性

BI工具对接 数据传输迁移 MaxCompute提供多种渠道,以便从业务系统或外部数据源写入数据到MaxCompute,或者从MaxCompute写出数据到外部系统或外部数据源。功能集 功能 功能描述 参考文档 上传数据 Tunnel(离线)MaxCompute的客户端...

PolarDB PostgreSQL版(兼容Oracle)间的迁移

警告 选择为 忽略报错并继续执行,可能导致数据不一致,给业务带来风险,例如:结构一致的情况下,如在目标库遇到与源库主键或唯一键的值相同的记录:量期间,DTS会保留目标集群的该条记录,即源库的该条记录不会同步至目标数据...

2023年

事务管理 2023-06-26 新增TimeTravel 新说明 基于Transactional Table 2.0,计算引擎可高效支持 TimeTravel查询 的典型业务场景,即查询历史版本的数据,可用于回溯历史状态的业务数据,或数据出错时,用来恢复历史状态数据进行数据纠正,...

文档更新动态(2023年)

更新说明 创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成配置优化 新增Apache Doris数据源的离线集成。...

功能更新动态(2023年)

系统自动检测SQL的错误语法,提示错误说明,并提供快捷修复选项。自动识别语句,提供快捷运行,并提供大量快捷操作和快捷键。离线物理表支持设置主题域、查看历史版本和版本对比。编辑器代码提效 新建离线物理表 数据源 针对 MySQL、...

公告

显著提升数据治理水平,Dataphin将进一步加强资产治理方向的投入,正式更名为“智能数据建设与治理Dataphin”,希望能够更好的助力企业构建质量可靠、消费便捷、生产安全经济的企业级数据中台。更名公告,请参见 Dataphin更名通知。2020年...

数据

背景信息 数据域是一个较高层次的数据归类标准,是对企业业务过程进行抽象、提炼、组合的集合,是企业业务人员在使用数据时第一个分组入口,可以帮助企业业务人员快速的从海量的数据中快速圈定到自己的业务数据。由上图所示,数据域规划...

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...

受众与核心能力

同时,DataWorks持续打造符合企业级数仓、数据中台构建要求的功能模块,为企业业务的数字化转型提供支持。产品受众 从事数据开发、算法开发等岗位的技术人员 从事销售运营、商业智能分析等岗位的业务人员 从事数据安全与合规工作的管理人员...

功能简介

依托企业数据智能平台,您可以设计高质量的标准化数据模型,减少重复开发工作,全面了解数据质量、数据使用情况和系统运行情况,并从业务视角更直观地使用并探索数据,更高效地从数据中获取业务价值。目前企业数据智能平台提供以下功能:...

什么是数据资源平台

平台通过将业务数据沉淀为智能数据或智能算子,以可视化拖拉拽和简单图形化条件设定进行模型编排,支持离线、在线、实时场景,采用简化建模过程、提高模型运行效能、融合智能化算法等方式帮助用户将数据与业务结合起来,不断积累和沉淀...

大数据安全治理的难点

通常,大数据系统中的工作流涉及多部门、多责任人且跨系统数据,如何才能协调好这些业务系统准时、保质保量地产出数据,避免出现因业务系统宕机/脏数据导致数据延时产出、产出脏数据,关乎到企业数据业务的连续性问题甚至高层的信任问题...

应用场景

大型促销类业务 大型促销秒杀系统系统整体访问压力非常。一般的数据库根本无法承载这样的读取压力,可选用云数据库 Memcache 版存储。带有计数器的库存系统数据库 RDS 与云数据库 Memcache 版搭配使用。RDS 存储具体数据信息,数据...

Transaction Table2.0概述

现状分析 当前典型的数据处理业务场景,对于时效性要求低的规模数据全量批处理的单一场景,直接使用MaxCompute足以很好的满足业务需求,对于时效性要求很高的秒级实时数据处理或者流处理,则需要使用实时系统或流系统来满足需求。...

通用数据开发

数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的数据,存储在业务系统所对应的数据,包括MySQL、Oracle和RDS等类型。数据收集与存储:您需要同步不同业务系统数据至MaxCompute,方可通过MaxCompute的海量数据...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

通过上传本地数据新建数据

上传本地文件的方式导入业务所需的数据集,以便在模型画布编辑业务模型时使用导入的数据集。本文介绍如何通过上传本地数据新建数据集。前提条件 已创建云计算资源作为存储数据源,具体操作,请参见 新建计算资源。已准备好待上传的数据表...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

功能特性

通过DLA控制配置数据源(RDS数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据数据同步到目标数据仓库OSS,同时在数据仓库和DLA创建与数据源表相同的表结构,基于目标数据...

查看与减少数据备份

查看备份大小 备份大小=数据备份的大小+增量数据备份的大小 登录 DBS控制。单击左侧导航栏的 备份计划,然后在上方选择目标地域。单击目标备份计划名称,进入 备份任务配置 页面。在 付费信息 区域,查看量备份数据量和增量备份...

规格及选型

8C32G 自动调度 8~32ACU 实例配置选型案例 案例一:互联网用户和制造业用户 用户为互联网客户和制造业客户,目前自建业务数据库和Greenplum数仓,希望能够完成云化部署。建议:使用 AnalyticDB PostgreSQL版 存储弹性模式进行部署。优势:...

DataWorks模块使用说明

使用流程概览:参考文档:数据集成概述 数据建模与开发 子模块:数据建模 功能说明:数据建模是链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务数据进行...

数据集成概述

说明 以业务数据库数据同步到MaxCompute数据仓库为例,当有大量的数据存储在数据库系统里,需要将数据库量及增量数据同步到MaxCompute进行数仓分析时,数据集成传统方式是通过量同步或者依赖数据库表的 modify_time 等字段进行...

DMS数据管理预案助力业务大促

开启数据水印功能 您可以在DMS开启 防泄露数字水印 功能,系统将在整个控制台中同时提供水印,保障您的数据信息安全,防止截图等数据泄露事件。具体操作,请参见 防泄露数字水印。敏感数据管控 有效识别敏感数据的分布,进行细粒度权限...

识别任务说明

请您在进行敏感数据扫描前了解以下规则:结构化数据(RDS MySQL、RDS PostgreSQL、PolarDB等)、数据(TableStore、MaxCompute等):采样取表中的前200行数据,仅扫描采样数据中每个字段每行的前10 KB数据。非结构化数据(OSS):不扫描...

主备方案介绍

数据库HBase存储海量大数据,在业务场景往往承载着重要数据,为保障数据的高可用性和安全性,云数据库HBase提供了主备双活和主备容灾特性。本文介绍云数据库HBase的主备双活和主备容灾特性功能。使用场景 主备双活:大数据量随机读响应...

创建快照

数据库文件系统快照基于云盘快照,它是一种便捷高效的数据容灾手段,用于对文件系统数据进行备份。前提条件 进行快照创建时,数据库文件系统必须处于 已挂载 或 待挂载 状态。说明 如果文件系统处于 待挂载 的状态,则需要保证文件系统有...

应用场景

ISV备份方案集成 从事ISV服务的企业用户可能面临多种的问题,例如难以统一管理多数据库环境和多种备份脚本,长时间保留某些业务数据导致后期核算成本太高,不同云厂商和云产品之间备份保留周期不一致,数据恢复的安全性难以保证等等。...

数据质量管理流程

数据质量的管理流程包括业务数据资产定级、加工卡点、风险点监控和及时性监控,您可以构建属于自己的数据质量保障体系。数据质量管理的流程图如下。数据质量管理的流程说明如下:分析业务场景,对数据流转链路上的整个依赖关系,进行资产...

数据质量管理流程

数据质量的管理流程包括业务数据资产定级、加工卡点、风险点监控和及时性监控,您可以构建属于自己的数据质量保障体系。数据质量管理的流程图如下。数据质量管理的流程说明如下:分析业务场景,对数据流转链路上的整个依赖关系,进行资产...

EMR+DLF数据湖解决方案

从RDS/MySQL/Kafka 等业务系统接入数据,此时可以考虑通过实时计算Flink实现数据入湖到DLF。可参考如何在Flink 管理DLF Catalog。步骤四:通过Spark/Presto引擎查询DLF表 通过ssh登录到EMR集群的emr-header-1节点。1.通过spark-sql查询表...

数据集成侧同步任务能力说明

说明 以业务数据库数据同步到MaxCompute数据仓库为例,当有大量的数据存储在数据库系统里,需要将数据库量及增量数据同步到MaxCompute进行数仓分析时,数据集成传统方式是通过量同步或者依赖数据库表的 modify_time 等字段进行...

恢复数据库

数据库备份DBS 提供数据恢复能力,通过创建恢复任务将已完成备份的数据恢复到云数据库、本地数据库或DBS沙箱,可用于误操作后恢复以及分析历史数据等场景。前提条件 DBS备份计划的运行状态为 运行。已完成数据库备份。相关操作,请参见...

冷热分层

背景信息 在海量大数据场景下,随着业务数据量的不断增长,性能和成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACID和CRUD操作...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用