文档修订记录

DataWorks数据安全治理路线 2023年12月更新记录 时间 特性 类别 描述 产品文档 2023.12.29 新增功能 数据开发 若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发...

跨阿里云账号备份恢复数据

数据库备份DBS 支持对阿里云云数据库(例如RDS、Redis、MongoDB、PolarDB等)及通过专线/VPN网关/智能网关接入的自建数据库进行跨账号的逻辑备份恢复。本文以RDS MySQL为例,介绍如何使用DBS进行跨阿里云账号的数据备份恢复。前提条件 ...

基于MaxCompute进行大数据BI分析

本实践以电商行业为例,通过MaxCompute、DataWorks对业务数据和日志数据进行ETL处理,并同步至分析型数据库MySQL(AnalyticDB MySQL)进行实时分析,再通过Quick BI进行可视化展示。背景信息 MaxCompute:用于进行规模数据计算,详情请...

恢复数据库

数据库备份DBS 提供数据恢复能力,通过创建恢复任务将已完成备份的数据恢复到云数据库、本地数据库或DBS沙箱中,可用于误操作后恢复以及分析历史数据等场景。前提条件 DBS备份计划的运行状态为 运行中。已完成数据库备份。相关操作,请参见...

MapReduce

自然语言处理:基于大数据的训练预测。基于语料库构建单词同现矩阵,频繁项集数据挖掘、重复文档检测等。广告推荐:用户单击(CTR)购买行为(CVR)预测。MapReduce流程说明 MapReduce处理数据过程主要分成MapReduce两个阶段。首先...

表设计最佳实践

表设计指南 建议将数据信息划分为基本属性表天气日志表,分别用于存储变化小变化大的数据。因为天气信息的数据量巨大,在对天气日志表按照地域进行分区后,可以按照时间(例如,天)进行二级分区。此种分区方式可避免发生因某一个地点...

新零售:杭州数云信息技术有限公司

PolarDB 采用存储计算分离的架构,提供分钟级的配置升降级、秒级的故障恢复、全局数据一致性免费的数据备份容灾服务,既融合了商业数据库稳定可靠、高性能、可扩展的特征,又具有开源云数据库简单开放、自我迭代的优势。本文介绍杭州...

数据标准

数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有多种不同的定义方法,给后期进行数据汇集整合带来障碍。因此,数据处理的前奏就是数据标准化,数据标准作为一个统一的数据共识,在标准...

PolarDB HTAP实时数据分析技术解密

在按列进行海量数据分析时,按行从磁盘读取数据存在非常大的IO带宽浪费,其次,行式存储格式在处理大量数据时会大量拷贝不必要的列数据,对内存读写效率也存在冲击。PolarDB 并行查询突破CPU瓶颈 PolarDB团队开发的并行查询框架(Parallel ...

混合存储型(已停售)

使用混合存储型,将所有课程信息存储到磁盘,访问量大的课程题库数据存储到内存并常驻内存,保证高频访问数据的读写性能,实现高性能与高性价比的有机结合。典型业务场景的示例如下:场景1:使用开源Redis集群存储了100 GB的数据,但高峰...

升级数据库版本

本文介绍云数据库MongoDB支持升级的数据版本以及如何升级数据版本。注意事项 升级分片集群实例的数据版本时,实例的协议类型需为 MongoDB协议。升级采用轮转升级的方式进行,升级过程中会自动对实例进行2~3次重启,请在业务低...

RDS SQL Server空间不足问题

数据空间的回收通常有如下几种方式:归档数据 删除数据库中不常用的数据(例如早期的历史数据),或者根据需要迁移到其他数据库实例中,或者以其他形式归档保存,通过直接减少数据量来降低已使用数据空间大小。这种方式是控制数据空间增长...

查看数据同步项目的详情

运行中:表示数据同步项目在运行中,您可以查看数据同步的运行计划和当前进度,并在操作列进行相应操作。修改中:表示数据同步项目正在被修改同步对象。合并中:表示被修改同步对象的数据同步项目与修改同步对象任务进行合并的过程。已暂停...

离线同步能力说明

数据集成的离线同步功能为您提供数据读取(Reader)写入插件(Writer),方便您通过定义来源与去向数据源,并结合DataWorks调度参数使用,将源端数据库中全量或增量数据的同步至目标数据库中。本文为您介绍离线同步的相关能力。使用限制 ...

查看数据迁移项目的详情

进入详情页面 您可以在数据迁移项目的详情页面,查看计划的迁移环节、各个环节的进度状态,帮助您了解数据库迁移的整体进度,以及每张表、每个对象的迁移状态。登录 OceanBase 管理控制台。在左侧导航栏,单击 数据传输>数据迁移。在 ...

DataStudio侧实时同步任务配置

完成数据源、网络、资源的准备配置后,您可创建实时同步节点,将多种输入及输出数据源搭配组成同步链路,进行单表或整库数据的实时增量同步。本文为您介绍如何创建单表或整库增量数据实时同步任务,并在创建完成后查看任务运行情况。前提...

点热力层(v3.x版本)

图表样式 点热力层是3D平面地图(v3.x版本)的子组件,支持独立的样式、数据和交互配置,包括热力颜色、热力半径热力模糊度等。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项图标,可在搜索配置面板中输入您需要搜索的配置项名称...

应用场景:低成本历史库

背景信息 在移动互联网高度发达的今天,每天都会有大量的业务数据产生,随着时间的积累业务的发展数据量急剧增长,同时历史数据的访问频率随着时间的推移却越来越低。这些数据全部存储在关系型数据库中会带来了一系列的问题。挑战 存储...

低成本RDS历史库

背景信息 在移动互联网高度发达的今天,每天都会有大量的业务数据产生,随着时间的积累业务的发展数据量呈大幅增长,同时历史数据的访问频率随着时间的推移却越来越低。这些数据全部存储在关系型数据库中会带来了一系列的问题。挑战:...

低成本历史库

在移动互联网高度发达的今天,每天都会有大量的业务数据产生,随着时间的积累业务的发展数据量急剧增长,同时历史数据的访问频率随着时间的推移却越来越低。这些数据全部存储在关系型数据库中会带来了一系列的问题。重要 2023年3月10日后...

应用场景

可以将访问频度非常高的数据存储在云数据库 Memcache 版中,底层数据存储在 RDS 中。大型促销类业务 大型促销秒杀系统,系统整体访问压力非常。一般的数据库根本无法承载这样的读取压力,可选用云数据库 Memcache 版存储。带有计数器的...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言...

概述

解决方案 T+1全量同步一键建仓是指通过DLA控制台配置数据源(RDS、PolarDB for MySQL、MongoDB数据源、ECS自建数据数据目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,...

如何对JSON类型进行高效分析

PolarDB 列存索引(In Memory Column Index,IMCI)功能推出了完备的虚拟列与列式JSON功能等,可以快速处理大数据和多种数据类型(包括结构化数据与半结构化数据等),并提供高效的数据分析、查询与流计算能力,适用于数据分析、数据仓库与...

DataWorks V3.0

E-MapReduce:E-MapReduce(Elastic MapReduce,简称EMR)构建在阿里云云服务器ECS上,基于开源的Apache HadoopApache Spark,让您可以方便地使用HadoopSpark生态系统中的其它周边系统(例如Hive),来分析处理自己的数据大数据...

典型场景

基于湖构建数据平台,支持BI、挖掘等业务 对象存储OSS可以作为湖存储,DLA基于OSS构建一站式的大数据平台。具体包括构建数据湖、数据ETL、交互式查询、机器学习等功能。构建数据湖 实时数据湖:支持DB的CDC与消息数据(如Kafka)入湖,构建...

冷热分层

背景信息 在海量大数据场景下,随着业务和数据量的不断增长,性能成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACIDCRUD操作...

JindoFS介绍使用

HDFS有Java onheap限制,而Block模式没有Java onheap内存限制,可以支持更大的数据规模。Block模式轻运维,不用担心坏盘或坏节点,数据1备份放置在OSS上,支持上下线节点。支持对冷数据做透明压缩归档,使用多种手段进行成本优化,对接...

数据分析整体趋势

这些云原生数据仓库技术分别起源于数据和大数据,提供标准SQL接口和ACID保证,底层存储通过Share Everything或Share Nothing实现资源池化和横向扩展能力。资源隔离,数据共享是目前业务应用对云原生数据仓库的普遍需求。综上所述,数据...

产品功能

时序数据计算能力 TSDB 提供专业全面的时序数据计算函数,支持降采样、数据插值空间聚合计算,能满足各种复杂的业务数据查询场景。监控运维 TSDB 提供实例运维系统,让您可以实时的掌握实例的运行情况、性能指标存储空间使用情况,并...

什么是数据库自治服务DAS

数据库是所有企业业务的基座,企业内的研发、测试、运营运维人员每天都需要对数据库进行操作或者查询,但是使用数据库的人员对数据库的了解程度参差不齐,所以数据库的稳定性不断受到如下问题的挑战。视频简介 数据库运维管理的挑战 ...

PolarDB Serverless实现了哪些突破

存储完成了池化按量付费,这对云数据库的发展有了非常大的促进作用。但此架构下,CPU内存依然强绑定,导致计算要实现真正按需供应非常困难。也就是说,CPU资源内存资源是一个整体,只能作为一个最小的单位升降级。例如,在亚马逊...

引擎功能

时序数据高效读写 Lindorm时序引擎提供高效的并发读写,支持每秒百万数据点的数据读取及千万数据点的写入能力。数据写入 支持以下方式进行数据写入:使用SQL的INSERT语句(推荐使用JDBC)。兼容InfluxDB的写入Line Protocol。兼容OpenTSDB...

SelectDB数据

通过私网连接:私网连接具有较大的带宽较稳定的连接,因此推荐使用私网连接。在使用私网连接之前,需要按照 连接设置 文档,创建一个终端节点。在终端节点创建完成且状态从 创建中 变为 可用,连接状态从 连接中 变为 已连接 后,您还...

亿海蓝-航运大数据的可视化案例

——亿海蓝CTO 客户简介 亿海蓝是中国的航运大数据公司,做为中国最大的AIS数据服务运营商,发展目标是通过大数据技术推动全球航运物流与互联网的融合,加速航运产业转型升级。亿海蓝目前已为全球上百万行业用户提供数据服务,客户涵盖港口...

常见报错

本文介绍DBS配置备份计划、备份恢复预检查以及恢复任务运行时系统返回的报错信息(如异常信息或错误码)以及解决方法。说明 若在本文中未找到您遇到的异常或报错,或按照文中修复建议仍未解决您的问题,请到 DBS客户咨询群(钉钉群号:...

发展历程

深度参与推动全球大数据领域标准化建设 MaxCompute代表阿里巴巴计算平台,成为国际TPC(Transaction Processing Performance Council)委员会大数据评测标准BigBench的委员会委员,是中国担任此国际性能标准化测试组织委员的唯一企业。...

恢复MySQL物理备份

本文介绍如何通过数据库备份DBS恢复物理备份的MySQL数据库。前提条件 已完成数据库备份,具体操作,请参见 MySQL物理备份。准备一台服务器用于接收物理备份文件,并在服务器上安装备份网关,更多信息,请参见 添加备份网关。操作步骤 登录 ...

恢复MongoDB数据库

本文介绍如何通过 数据库备份DBS 恢复已完成备份的MongoDB数据库,可用于误操作后恢复以及分析历史数据等场景。前提条件 已完成数据库备份。相关操作,请参见 MongoDB逻辑备份、从备库备份MongoDB数据库。操作步骤 登录 DBS控制台。单击...

客户案例

迁移到大数据MaxCompute、实时计算、DataWorks后,部分任务有10倍以上的性能提升,存储从自建Hadoop 3PB降到900T,利用Flink实时数据处理能力,将宝宝树现有的场景实时化(“基于用户ID维度内容类型的实时行为”、“获取用户的实时群聊ID...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 数据传输服务 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用