冷热分离介绍

背景信息 在海量大数据场景下,一张表中往往存储着大量的历史数据,如订单数据或者监控数据。随着时间的推移,这些数据被访问的频率会逐渐降低,最终被搁置。减少这部分数据的存储成本,成为一个新的问题。为解决这一问题同时降低存储成本...

数据方案概览

DMS的数据方案提供数据变更、数据导出、数据追踪、环境构建的功能,通过本文您可以了解数据方案的各项功能详情。一级功能 二级功能 功能描述 结构变更 结构设计 可以对目标库、表进行符合研发规范的表结构设计,保障多套环境(例如开发环境...

RDS MySQL实例变配时长受哪些因素影响

RDS MySQL实例变更配置(包括系列、规格和存储空间)时,可以根据本页面列举的影响因素预估实例变配的时长。重要 RDS MySQL实例变更配置的时长受多种因素影响,因此,建议在业务写入量较少时进行,或在变配前停止写入数据。RDS MySQL本地盘...

RDS MySQL实例变配时长受哪些因素影响

RDS MySQL实例变更配置(包括系列、规格和存储空间)时,可以根据本页面列举的影响因素预估实例变配的时长。重要 RDS MySQL实例变更配置的时长受多种因素影响,因此,建议在业务写入量较少时进行,或在变配前停止写入数据。RDS MySQL本地盘...

数据分析整体趋势

随着Google等互联网企业崛起,以Hadoop为代表的基于传统x86服务器集群的大数据技术迅速发展,同时开源分布式数据库如Greenplum等也成为相应替代方案,为广大中小企业,尤其是互联网行业大大降低了数据分析的技术和成本门槛,还有分布式技术...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

互联网、电商行业离线大数据分析

通过阿里云MaxCompute、云数据库RDS MySQL、DataWorks等产品,可以实现互联网、电商网站的离线数据分析,且支持通过DataV大屏展示分析后的业务指标数据。概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标...

应用场景

可以将访问频度非常高的数据存储在云数据库 Memcache 版中,底层数据存储在 RDS 中。大型促销类业务 大型促销秒杀系统,系统整体访问压力非常。一般的数据库根本无法承载这样的读取压力,可选用云数据库 Memcache 版存储。带有计数器的...

基于MaxCompute进行大数据BI分析

本实践以电商行业为例,通过MaxCompute、DataWorks对业务数据和日志数据进行ETL处理,并同步至分析型数据库MySQL(AnalyticDB MySQL)进行实时分析,再通过Quick BI进行可视化展示。背景信息 MaxCompute:用于进行规模数据计算,详情请...

查看数据开发操作记录

MaxCompute表数据恢复 DataWorks提供数据备份与恢复功能,系统会自动备份数据的历史版本(例如被删除或修改前的数据)并保留一定时间,详情请参见 备份与恢复。MaxCompute表权限审计 您可以进入 安全中心,在数据访问控制的 权限审计 处,...

操作审计

使用详情可参考文档:回收站 MaxCompute表数据恢复:提供数据备份与恢复功能,系统会自动备份数据的历史版本(例如被删除或修改前的数据)并保留一定时间,相关资源可参考:备份与恢复 如何进行节点版本对比与版本回滚?您可以在数据开发...

数据集成概述

背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量数据表的同步任务、能够集成多种异构数据源、能够实现对数据源的数据进行轻度预处理、能够实现数据同步任务的调优(例如容错,限速,并发)等。...

常见问题

MaxCompute提供数据备份与恢复功能,MaxCompute会自动备份数据的历史版本(被删除或修改前的数据)并保留一定时间,您可以对保留周期内的数据进行快速恢复,避免因误操作丢失数据。更多备份恢复信息,请参见 备份与恢复。不同项目的表是否...

MySQL分库分表同步至Hologres(方案2.0)

限流:考虑到速度过高可能对数据库造成过的压力从而影响生产,数据集成同时提供了限速选项,您可以通过限流控制同步速率,从而保护读取端数据库,避免抽取速度过,给数据库造成太的压力。限速最小配置为1MB/S,最高上限为30MB/s。离...

典型场景

基于湖构建数据平台,支持BI、挖掘等业务 对象存储OSS可以作为湖存储,DLA基于OSS构建一站式的大数据平台。具体包括构建数据湖、数据ETL、交互式查询、机器学习等功能。构建数据湖 实时数据湖:支持DB的CDC与消息数据(如Kafka)入湖,构建...

受众与核心能力

产品定位 DataWorks致力于为数据开发者、数据分析师、数据资产管理者,打造一个具备开放自主开发与全栈数据研发能力的一站式、标准化、可视化、透明化的智能大数据全生命周期云研发平台。DataWorks赋予用户仅通过单一平台,即可实现数据...

迁移或同步指定时间段内的数据

如果您想要将源HBase集群或源Lindorm实例中某个时间段的历史数据迁移至新的Lindorm实例,或想要同步实时数据到新Lindorm实例,可以在创建任务时添加相关时间参数,修改任务配置。本文介绍通过LTS控制台创建任务时配置迁移或同步时间范围的...

数仓分层

在阿里巴巴的数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图所...

应用场景

数据审计 智能解析数据库及大数据的通信流量,细粒度审计数据访问行为,通过对数据源全量行为的审计溯源、危险攻击的实时告警、风险语句的智能预警,为您最敏感的数据库资产做好最安全的监控保障。个人信息合规 可精准区分和保护个人数据,...

数仓分层

在阿里巴巴的数据体系中,我们建议将数据仓库分为三层,自下而上为:数据引入层(ODS,Operation Data Store)、数据公共层(CDM,Common Data Model)和数据应用层(ADS,Application Data Service)。数据仓库的分层和各层级用途如下图所...

核心能力

数据资源平台提供了一站式数据资产定义、生产、管理与服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...

大数据AI公共数据集分析

本教程通过DataWorks,联合云原生大数据计算服务MaxCompute,使用大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等公共数据),指导您如何快速进行大数据分析,快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

RDS增量数据同步至MaxCompute

本文以同步业务RDS数据库的数据至MaxCompute为例,为您介绍如何对不同场景的数据进行增量同步。背景信息 根据需要同步的数据在写入后是否发生变化,分为恒定的存量数据(通常是日志数据)和持续更新的数据(例如人员表中,人员的状态会发生...

RDS增量数据同步至MaxCompute

本文以同步业务RDS数据库的数据至MaxCompute为例,为您介绍如何对不同场景的数据进行增量同步。背景信息 根据需要同步的数据在写入后是否发生变化,分为恒定的存量数据(通常是日志数据)和持续更新的数据(例如人员表中,人员的状态会发生...

JindoFS介绍和使用

JindoFS是基于阿里云对象存储OSS,为开源大数据生态构建的Hadoop兼容文件系统(Hadoop Compatible File System,HCFS)。JindoFS提供兼容对象存储的纯客户端模式(SDK)和缓存模式(Cache),以支持与优化Hadoop和Spark生态大数据计算对OSS...

数据仓库研发规范概述

大数据时代,规范地进行数据资产管理已成为推动互联网、大数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范,可以切实提高研发效率,保障数据研发工作有条不紊地运作。而不完善的研发流程,会...

数据集成概述

数据集成是基于Dataphin构建的简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力。背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量...

外部表概述

MaxCompute支持使用外部表功能查询和分析存储于OSS等外部存储系统的数据。该机制使得用户可以无需将数据导入到MaxCompute内部存储,直接对外部数据进行操作,从而提供了数据处理的灵活性和方便性。背景信息 MaxCompute SQL作为分布式数据...

限制说明

项目 限制说明 数据类型 云数据库 Memcache 版仅支持 Key-Value 格式的数据,不支持 array、map、list 等复杂类型的数据数据可靠性 云数据库 Memcache 版的数据存储在内存中,服务并不保证缓存数据不会丢失,有强一致性要求的数据不适合...

数据质量保障原则

不同行业有不同的评估数据质量的标准。对于MaxCompute,数据质量可以从完整性、准确性、一致性和及时性共四个角度进行评估。完整性 完整性是指数据的记录和信息是否完整,是否存在数据缺失情况。数据缺失主要包括记录的缺失和具体某个字段...

使用AWR

自动负载信息库AWR(Automatic Workload ...PolarDB除了提供 查看视图 中的实时视图和函数外,还提供对这些实时视图采集后保存的历史数据,通过这些数据可以生成类似Oracle的AWR报告,关于历史数据及AWR报告的详细说明请参见 AWR使用说明。

数据分析概述

DataWorks提供的数据分析平台,可以流畅地进行数据处理、分析、加工及可视化操作。在数据分析板块中,您不仅可以在线洞察数据,还可以编辑和共享数据。本文为您介绍数据分析平台的优势、功能、权限等概要信息。产品优势 与本地数据分析相比...

配置OpenGauss输出组件

同步其他数据源的数据至OpenGauss数据源的场景中,完成源数据源的信息配置后,需要配置OpenGauss输出组件写入数据的目标数据源。本文为您介绍如何配置OpenGauss输出组件。前提条件 已创建OpenGauss数据源,如何创建,请参见 创建OpenGauss...

配置OpenGauss输出组件

同步其他数据源的数据至OpenGauss数据源的场景中,完成源数据源的信息配置后,需要配置OpenGauss输出组件写入数据的目标数据源。本文为您介绍如何配置OpenGauss输出组件。前提条件 已创建OpenGauss数据源,如何创建,请参见 创建OpenGauss...

配置TiDB输出组件

同步其他数据源的数据至TiDB数据源的场景中,完成源数据源的信息配置后,需要配置TiDB输出组件写入数据的目标数据源。本文为您介绍如何配置TiDB输出组件。前提条件 已创建TiDB数据源,如何创建,请参见 创建TiDB数据源。进行TiDB输出组件...

配置TiDB输出组件

同步其他数据源的数据至TiDB数据源的场景中,完成源数据源的信息配置后,需要配置TiDB输出组件写入数据的目标数据源。本文为您介绍如何配置TiDB输出组件。前提条件 已创建TiDB数据源,如何创建,请参见 创建TiDB数据源。进行TiDB输出组件...

配置PolarDB-X输出组件

加载策略 包括:覆盖数据 即以当前来源表为准,覆盖目标表中的历史数据。追加数据 即在目标表的已有的数据基础上追加数据,且不修改历史数据。解析方案 非必选项,选择输出数据前后的一些操作。解析方案 包括 填写准备语句 和 填写完成语句...

设置增量同步位点

您不再需要源端数据的历史数据,仅需同步某个时间节点之后的增量数据至目标端。操作步骤 将数据迁移或数据同步项目配置至 选择迁移类型 或 选择同步类型 步骤。详情请参见相应类型的 数据迁移 或 数据同步 项目文档。在 选择迁移类型 或 ...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将MaxCompute的数据迁移至其它业务平台。背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大...

恢复数据

您可以将主机上实例的历史数据恢复到另一个新实例上,由于直接恢复数据到原实例有风险,因此需要先恢复到新实例。前提条件 您的实例已有数据备份。背景信息 关于 专属集群MyBase 的更多介绍,请参见 什么是云数据库专属集群MyBase。恢复...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 数据传输服务 数据库备份 DBS 云数据库 RDS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用