数据存储冷热分离

详情请参见 更改表的冷热数据存储策略。冷热混合存储原理 冷热混合存储需要首先指定热分区数。您可以通过 hot_partition_count 参数来指定热分区数。如何通过 hot_partition_count 设置热分区数,请参见 CREATE TABLE。假设热分区数为N,...

冷热分层存储

jindo fs-checkStoragePolicy-path该命令用于查询指定路径下数据存储策略的转换状态。转换状态分为以下三种:Pending:任务等待提交。Submitted:任务已提交。Finalized:任务已完成。常见问题 如果误删除OSS-HDFS服务冷热分层对应的生命...

开启智能存储分层

重要 存储保存时间配置存在相应限制,具体信息,请参见 数据存储生命周期管理。开启智能存储分层 登录 日志服务控制台。在Project列表区域,单击目标Project。在 日志存储>日志库 页签中,单击目标Logstore对应的 图标,然后单击 修改。在 ...

数据存储生命周期管理

本文介绍存储保存时间迁移策略。生命周期管理策略 热存储数据至少需保存7天才能转换为低频存储,当数据的存储时间超过配置的 热存储层数据保存 时间后,数据自动由热存储转为低频存储。热存储数据至少需保存30天才能直接转换为归档存储,当...

成本

存储分层能力 很多分析场景的数据具有一定的时效性,时间越近的数据访问频率越高、越远的数据访问频率越低。AnalyticDB PostgreSQL版 能够根据需求,自动地将部分时效性较低的数据进行归档、使用OSS等成本更低、访问速度较慢的存储介质替换...

基于Hadoop集群支持Delta Lake或Hudi存储机制

涉及模块 对应阿里云产品 说明 开源Hadoop 本地机房搭建Hadoop集群 云上虚拟机搭建Hadoop集群 阿里云E-MapReduce 原始数据存储Hadoop集群中。基于Hadoop集群支持Delta Lake或Hudi湖仓一体架构 前提条件 已创建MaxCompute项目(非External...

存储说明

本文介绍E-MapReduce集群中数据存储相关的信息,包括磁盘角色、云盘与本地盘,以及OSS。背景信息 关于存储的类型、性能和相关的限制信息,请参见 什么是块存储。存储价格估算如下:本地盘实例存储为0.04 元/GB/月 OSS标准型存储为0.12 元/...

Spark SQL创建C-Store表

为了降低数据存储成本,同时还要保证查询性能,您可以选择将查询频度高的数据(称为热数据存储在SSD介质;将查询频度低的数据(称为冷数据存储在OSS上。根据业务需求,您还可以按表粒度、表的二级分区粒度独立选择冷、热存储介质。例如...

数据迁移

MaxCompute为您提供了完善的数据迁移方案以及多种经典的分布式计算模型,能够快速地解决海量数据存储和计算问题,有效降低企业成本。DataWorks 为MaxCompute提供一站式的数据集成、数据开发、数据管理和数据运维等功能。其中:数据集成 为...

什么是备份数据

与备份数据量不同,存储数据量取决于备份数据量、备份数据存储格式、压缩算法等因素。空间大小 在单次全量备份情况下,数据库磁盘空间(RDS/ECS)>数据文件空间(实际使用)>备份数据量(DBS)>存储数据量(OSS)。综上所述,您可通过调整...

冷热数据分层存储

冷热数据分层存储提供了两种存储策略,具体如下:存储策略 详情 默认存储策略 将新写入的数据存储在热数据盘中,提供高效查询。当热数据存储量达到业务使用阈值时,自动将当前热数据盘中占用空间最大的part数据文件移动到冷数据盘存储,...

创建逻辑模型:明细表

可以指定明细表后续在数据建模分析使用时,明细表的数据存储于数仓中的哪个数据分层,一般情况下明细表可存储于数据明细层(DWD层)。明细表创建后,您可以为明细表添加字段,且可以对明细表进行关联和分区的设置,并且可使用统一的数据...

数据服务系统配置

当您修改时长小于之前设置的时长(例如:之前设置的是30天,现在修改变成20天),保存时需再次确认是否删除统计数据存储周期变小的时间段,如下图对话框中所示的时间区间。单次查询跨度小于等于:默认是31天,维度仅支持天,支持最大数值不...

从自建HDFS迁移数据

背景介绍 在某些场景下面,我们需要从自建的Hadoop存储数据迁移到Lindorm的文件引擎当中。适用范围 阿里云ECS自建Hadoop集群中的数据迁移到文件引擎。准备工作 开通文件引擎,详情请参见 开通指南。修改Hadoop 配置信息,详情请参见 ...

最佳实践概览

通过DataWorks将MaxCompute数据同步至Elasticsearch 通过阿里云Logstash将MaxCompute数据同步至Elasticsearch 通过实时计算处理数据并同步到Elasticsearch 通过DataWorks将Hadoop数据同步至Elasticsearch 存储产品迁移 从Solr集群迁移文档...

物联网存储介绍

基于物联网场景中多源异构数据存储、高并发吞吐、海量数据高性价比存储、多维度数据处理与分析等需求,表格存储推出了一站式物联网存储IoTstore解决方案,为物联网设备元数据、消息数据、时序轨迹等海量数据提供存储、查询、检索、分析、...

应用场景

表格存储 有互联网应用架构(包括数据库分层架构和分布式结构化数据存储架构)、数据湖架构和物联网架构三种典型应用架构。本文结合 表格存储 的典型应用架构介绍了不同应用架构下的应用场景。互联网应用 目前互联网已在日常生活中广泛应用...

数据存储

时序数据存储 时序数据库对时序数据的写入、聚合以及检索都做了特定优化,AnalyticDB采集到的时序数据主要存在时序数据库中。目前每个AnalyticDB实例有一个独立的时序数据库进行服务,只保存当前AnalyticDB实例的时序数据。日志数据存储 ...

使用前须知

为确保使用OSS-HDFS服务的用户可正常访问OSS-HDFS的数据存储目录.dlsdata/及目录下的任意Object,请勿禁用、修改或者删除该角色以及该角色关联的权限策略。开通并授权访问OSS-HDFS服务 Bucket清单 数据污染 为避免影响OSS-HDFS服务的正常...

设置数据保留策略

InfluxDB的数据保留策略可以定义数据在InfluxDB中保存时间,本文介绍如何设置数据保留策略。前提条件 已创建数据库。具体操作,请参见 创建数据库。数据保留策略介绍 InfluxDB可以通过定义数据保留策略,用来控制存储数据量的方式。新创建...

方案背景

因此车联网场景下车辆轨迹数据存储与分析的需求如下:数据存储:车辆轨迹数据会随着时间动态变化,要长期保存车辆轨迹信息,需要单表规模极大以及高性价比存储。数据写入:面向众多车辆,需要支持百万级节点实时写入。数据检索:根据多个...

冷热分离介绍

冷热分离功能支持将冷热数据存储在不同的介质上,冷存储的存储类型为容量型存储,热存储的存储类型为标准型云存储、性能型云存储、本地SSD盘或本地HDD盘。冷存储的价格仅为标准型存储的20%,大大降低了存储成本。原理简介 在功能实现上,...

配置SAP HANA输出组件

覆盖数据策略下,当主键、约束冲突时,系统会先删除原数据,再插入整行新数据。解析方案 非必选项,选择输出数据前后的一些操作。解析方案 包括 填写准备语句 和 填写完成语句。输入字段 根据上游的输入,为您展示输入字段。输出字段 单击 ...

JindoData概述

JindoData是阿里云开源大数据团队自研的数据存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括JindoFS存储系统(原JindoFS Block模式)、...

时序模型

时序表操作 使用 表格存储 时序模型时,您需要使用 CreateTimeseriesTable 接口创建时序表用于时序数据存储。具体操作,请参见 创建时序表。创建时序表后,您可以管理时序表。具体操作说明请参见下表。功能 描述 列出时序表名称 当需要查看...

时序模型

时序表操作 使用 表格存储 时序模型时,您需要使用 CreateTimeseriesTable 接口创建时序表用于时序数据存储。具体操作,请参见 创建时序表。创建时序表后,您可以管理时序表。具体操作说明请参见下表。功能 描述 列出时序表名称 当需要查看...

迁移Hadoop文件系统数据至JindoFS

迁移数据 Hadoop FsShell 对于文件较少或者数据量较小的场景,可以直接使用Hadoop的FsShell进行同步:hadoop dfs-cp hdfs:/emr-cluster/README.md jfs:/emr-jfs/hadoop dfs-cp oss:/oss_bucket/README.md jfs:/emr-jfs/DistCp 对于文件较多...

DAS企业版介绍

开通DAS企业版后,默认的 数据存储时长 为1个月,您可以根据自己的需要进行修改,具体请参见 管理DAS企业版。说明 SQL洞察 功能中分析和统计数据(不包括SQL明细数据)的存储时长最长为90天:如果对应实例DAS专业版设置的存储时长小于等于...

MMA概述

MMA迁移作业方案 本文为您介绍Hadoop数据迁移至MaxCompute的两种迁移方案,您可以根据实际情况选择。迁移链路一 专线场景下,支持通过MMA迁移Hive数据至MaxCompute。迁移方案如下图所示。迁移链路二 无专线场景下,支持通过闪电立方迁移...

高压缩引擎(X-Engine)介绍

随着业务发展,数据库系统中会积累大量访问频率很低甚至为0的数据,这些数据的积累容易导致如下问题:历史数据和最新数据存储在同一数据库系统中,导致磁盘空间不足。大量数据共享数据库系统的内存、缓存空间、磁盘IOPS等,导致性能问题。...

存储类型概述

对象存储OSS提供标准、低频访问、归档、冷归档、深度冷归档多种存储类型,全面覆盖从热到冷的各种数据存储场景。说明 各存储类型的定价,请参见 OSS产品定价。各存储类型的计费方式,请参见 存储费用。标准存储(Standard)提供高可靠、高...

高级管理

PolarDB-X 1.0 SQL审计与分析支持高级管理,您可以通过高级管理跳转到日志服务控制台,修改SQL日志的存储时间、对SQL日志进行实时订阅与消费、数据投递和对接其他可视化等高级操作。开启SQL日志审计 后,在当前页面右上角单击 高级管理 ...

混合存储型(已停售)

使用混合存储型,将所有课程信息存储到磁盘,访问量大的课程和题库数据存储到内存并常驻内存,保证高频访问数据的读写性能,实现高性能与高性价比的有机结合。典型业务场景的示例如下:场景1:使用开源Redis集群存储了100GB的数据,但高峰...

使用Simple存储策略

因此Ganos扩展了一种简单的存储策略,即Simple存储策略,它允许用户将数据采用自定义的压缩算法压缩后存储,并尽可能将压缩后的数据存储在基础表内,从而达到节约存储成本的同时又尽可能减小对查询性能的影响。使用方法 设置GUC参数,该...

使用Simple存储策略

因此Ganos扩展了一种简单的存储策略,即Simple存储策略,它允许用户将数据采用自定义的压缩算法压缩后存储,并尽可能将压缩后的数据存储在基础表内,从而达到节约存储成本的同时又尽可能减小对查询性能的影响。使用方法 设置GUC参数,该...

通过DataWorks将Hadoop数据同步到阿里云ES

新增Hadoop数据源。在 数据源列表 页面,单击 新增数据源。在 新增数据源 页面,搜索并选择 HDFS。在 新增HDFS数据源 页面,配置数据源参数。配置详情,请参见 配置HDFS数据源。单击 测试连通性,连通状态显示为 可连通 时,表示连通成功。...

ActionTrail日志清洗

说明 根据业务需求,判断是否需要新建文件夹,将ActionTrail投递过来的数据存储在新建文件夹中。在DLA中完成以下操作:开通DLA服务,请参见 开通云原生数据湖分析服务。初始化DLA数据库主账号密码,请参见 重置数据库账号密码。步骤一:...

配置ArgoDB输出组件

配置ArgoDB输出组件,可以将外部数据库中读取的数据写入到ArgoDB,或从大数据平台对接的存储系统中将数据复制推送至ArgoDB,进行数据整合和再加工。本文为您介绍如何配置ArgoDB输出组件。使用限制 ArgoDB输出组件支持写入文件格式为orc、...

基于Delta lake的一站式数据湖构建与分析实战

数据湖作为一个集中化的数据存储仓库,支持的数据类型具有多样性,包括结构化、半结构化以及非结构化的数据,数据来源上包含数据库数据、binglog 增量数据、日志数据以及已有数仓上的存量数据等。数据湖能够将这些不同来源、不同格式的数据...

自建Hadoop数据迁移到阿里云E-MapReduce

客户在IDC或者公有云环境自建Hadoop集群,数据集中保存在HDFS文件系统用于数据分析任务。...架构图 方案详情 请参见 阿里云自建Hadoop数据迁移到阿里云E-MapReduce。icmsDocProps={'productMethod':'created','language':'zh-CN',};
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 对象存储 数据库备份 DBS 开源大数据平台 E-MapReduce 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用