面临的业务挑战

数据散乱不一致 传统企业数据具有多样性,包括结构化、半结构化以及非结构化的数据数据来源上包含数据数据、日志数据、对象数据以及已有数仓上的存量数据等。这些不同来源、不同格式的数据,各自又有不同的访问和分析方式,而大量...

概述

OceanBase MySQL 模式兼容 MySQL 的大部分数据类型,详见 OceanBase MySQL 数据类型概述。由于 OB MySQL 的 DDL 语法与 MySQL DDL 语法存在一定的差异性,即 OB MySQL 有部分特有的拓展语法,这部分 DDL 语法可能无法解析。说明 不支持 OB ...

Iceberg概述

删除或更新数据 大部分数仓都难以实现较为高效的行级数据删除或更新,通常需要启动离线作业把整个表原始数据读取出来,然后变更数据后,写入到一个原始表。而Iceberg成功把变更的范围从表级别缩小到了文件级别,从而可以通过局部变更来完成...

X-Engine简介

因为目标是面向大规模的海量数据存储,提供高并发事务处理能力和降低存储成本,在大部分数据量场景下,数据被访问的机会是不均等的,访问频繁的热数据实际上占比很少,X-Engine根据数据访问频度的不同将数据划分为多个层次,针对每个层次...

选型配置说明

E-MapReduce配置选型不仅要考虑企业大数据使用场景、估算数据量、服务可靠性要求,还应该考虑企业预算。大数据使用场景 E-MapReduce各集群的场景和核心组件如下表。说明 具体各集群类型支持的组件以控制台实际展示为准。集群类型 场景介绍 ...

DataWorks On EMR使用说明

类别 描述 相关文档 OpenAPI DataWorks开放平台的OpenAPI功能,为您提供开放API能力,通过开放API实现本地服务和DataWorks服务的交互,提升企业大数据处理效率,减少人工操作和运维工作,降低数据风险和企业成本。开放API(OpenAPI)开放...

概述

大部分阿里云用户以CSV格式将数据存储在OSS上,若要提高数据扫描性能,需要借助第三方工具对文件进行格式转换,然后将转换后的数据上传至OSS,整个过程比较繁琐。为减轻用户工作量,您可以直接使用DLA来转换文件格式。假设将1.2GB的数据以...

构建数据仓库

方案优势:阿里巴巴大数据最佳实践,高性能、低成本、Serverless服务,免运维、全托管模式,让企业大数据研发人员更聚焦在业务数据的开发、生产、治理。产品组合:MaxCompute+Flink+DataWorks。场景说明 用户数据来源丰富,包括来自云端...

什么是云数据库HBase

使用场景 云数据库HBase全面提供海量半结构/非结构化数据下的实时存储、高并发吞吐、轻SQL分析(参见 云原生多模数据库Lindorm)、全文检索(参见Lindorm产品)等能力,结合完备的工具服务,丰富的生态融合,一站式高效满足企业大数据量...

宜搭创建大屏实操

本文主要介绍如何使用企业经营管理系统中客户库表及签约表表单数据,来创建并配置企业经营管理大屏。宜搭创建大屏实操视频,请参见:宜搭创建大屏实操视频。创建企业经营管理系统 操作步骤如下:登录宜搭系统,通过空白应用创建名称为 企业...

数据可视化概览

仪表盘和大屏是图表的组合布局,支持快速分析和自由可视化这两类主流场景,以满足大部分数据可视化需求。场景支持 安全自助式数据分析 基于DMS安全管控底座,确保可视化所用的数据均经过授权访问。一次配置即可实现可视组件高级过滤、...

持久内存型

兼容原生Redis绝大部分数据结构和接口。适用场景 海量数据下对性能与成本要求高的场景 计算中间数据对性能的要求很高,采用Redis社区版成本较高,如果采用HBase之类的数据库存储数据则可能无法满足性能需求。采用持久存储型实例保障数据...

持久内存型

兼容原生Redis绝大部分数据结构和接口。适用场景 海量数据下对性能与成本要求高的场景 计算中间数据对性能的要求很高,采用Redis社区版成本较高,如果采用HBase之类的数据库存储数据则可能无法满足性能需求。采用持久存储型实例保障数据...

PolarDB PostgreSQL版(兼容Oracle)间的迁移

背景信息 PolarDB PostgreSQL版(兼容Oracle)作为一款企业级关系型数据库管理系统,具有广泛的应用和强大的社区支持。每个新版本的发布都带来了许多改进和新特性,以提高性能、可用性和安全性。目前,升级到 PolarDB PostgreSQL版(兼容...

确认表血缘

确认表血缘 同空间下确认上游表血缘 节点周期写入某张表某个分区的数据大部分场景都是采用调度参数来动态实现,您可参考 调度参数,了解调度参数的替换原理。若您需要依赖同工作空间某节点,则可检查其调度参数的配置情况。开发环境确认...

混合存储型(已停售)

适用场景 适用场景 说明 视频直播 视频直播类业务往往存在大量热点数据大部分的请求都来自于热门的直播间。使用混合存储型,内存中保留热门直播间的数据,不活跃的直播间数据被自动存储到磁盘上,可以达到对有限内存的最佳利用效果。电子...

项目分配与安全

在为企业大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程中,建议参考下图建立您的MaxCompute项目,图中的每一个方块代表一个项目。...

项目分配与安全

在为企业大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据,按照应用的粒度建立项目。项目分配 在本教程中,建议参考下图建立您的MaxCompute项目,图中的每一个方块代表一个项目。...

离线集成概述

解决企业复杂大数据批处理难题,支持企业精细化运营、数据营销、智能推荐等大数据业务场景。离线集成功能底层基于Spark开发,支持提升Hadoop平台运行速度的应用场景。说明 如果您在使用该功能的过程中有任何疑问或问题,请使用钉钉搜索钉钉...

2023年

ListJobInfos-查看作业列表 2023-12-04 新增SKEWJOIN HINT 新说明 当两张表Join存在热点,导致出现长尾问题时,您可以通过取出热点key,将数据分为热点数据和非热点数据部分处理,最后合并的方式,提高Join效率。SkewJoin Hint可以通过...

云数据库ClickHouse企业版兼容性指导

企业版架构 云数据库ClickHouse企业版极地简化了运营开销,并降低了规模运行ClickHouse的成本。您不需要提前部署集群规格、设置高可用性的副本以及手动数据分片,当工作负载增加时扩展服务器或者工作负载降低时缩减服务器,这些都是由...

数据服务入门

DataWorks数据服务的主要目标是为个人、团队和企业构建统一的数据服务总线,帮助用户统一管理面向内外部的API服务。例如,您可以将查询数据表功能快速的生成对应的API,或将已有的API注册至数据服务平台进行统一发布和管理。本文以MySQL...

冷热分离

说明 冷热分离表中的冷区只是用来归档数据,查询请求应该非常的少,用户查询冷热分离表的绝大部分请求应该带上HOT_ONLY的标记(或者设置的TimeRange只在热区)。如果用户有大量请求需要去查冷区数据,则可能得考虑COLD_BOUNDARY冷热分界线...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

什么是EMR on ECS

产品优势 EMR为您提供了相对方便可控的企业级开源大数据服务。您可以快速搭建开源大数据服务,例如Hadoop、Spark、Flink、Kafka和HBase服务。100%采用社区开源组件,适配并优化开源组件,性能远高于开源版本。基于时间的弹性伸缩能力,抢占...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

规格及选型

16C128G ESSD云盘 PL2 适合企业级平台建设,适用于高并发场景,规模企业核心数据平台推荐选择。高性能(基础版)2C8G ESSD云盘 PL0 POC测试。个人学习使用,体验测试产品能力。4C16G ESSD云盘 PL0 ESSD云盘 PL1 适合计算存储均衡场景,...

实现开发生产等多套环境隔离

背景信息 很多企业用户在大数据的研发流程中有创建并隔离多套环境的需求,如创建并完全隔离开发、测试、生产环境,即各环境的数据物理存储地址、任务运行集群、大数据作业脚本均隔离,并对操作人员有严格的权限管控,如仅运维团队可使用...

PolarDB Serverless实现了哪些突破

第一代云原生数据库的困境 早期的云上数据库,大部分是以ECS中的自建数据库和云厂商托管的数据库RDS的形态存在的,到目前为止还是有非常大的用户量。这些云上数据库架构使用的是传统数据库的架构,只是运行在云的基础设施上,数据库本身并...

什么是MaxCompute

MaxCompute是适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效...

DBMS_LOB

ERASE(lob_loc IN OUT,amount IN OUT[,offset])存储过程 N/A 删除一个对象的部分数据。GET_STORAGE_LIMIT(lob_loc)函数 INTEGER 对象允许使用的最大存储空间。GETLENGTH(lob_loc)函数 INTEGER 获取对象的长度。INSTR(lob_loc,pattern...

新零售:杭州数云信息技术有限公司

所属行业:新零售 网站地址:数云信息技术有限公司 公司介绍 杭州数云信息技术有限公司成立于2011年,伴随着电子商务、大数据应用和零售企业互联网化的趋势快速发展,目前已成为国内领先的数据化营销软件产品和服务提供商。数云致力于为...

功能发布记录(2023年)

提高了企业数据分析的效率。2023.08.15 华东2(上海 华东1(杭州)华北2(北京)华南1(深圳)华北3(张家口)西南1(成都)华北6(乌兰察布)地域 所有DataWorks用户 增强分析(卡片和报告)2023-06 功能名称 功能描述 发布时间 发布...

升级数据库代理规格

数据库代理企业版默认的规格可以满足用户绝大部分的应用场景。当客户进行压力测试或者业务吞吐量很高时,当前新版本的数据库代理规格会自动随着代理的负载实时升级,避免数据库代理成为瓶颈。对于老版本的数据库代理,您也可以手动升级其...

PolarDB PostgreSQL版间的迁移

全量初始化会并发执行INSERT操作,导致目标数据库的表产生碎片,因此全量数据初始化完成后目标集群的表空间比源集群的表空间。在DTS同步期间,不允许有除DTS外的数据写入目标库,否则会导致源库与目标库数据不一致。若DTS正向和反向同步...

使用流程

个人或小型企业备份 操作简单 使用快捷 方式二:通过数据源创建单个或多个备份计划 仅需首次将数据库添加至DBS数据源,即可从数据源中管理和创建备份计划,方便二次使用。同时支持接入不同引擎的云数据库、自建数据库等,均可以在DBS控制台...

什么是数据库代理

升级数据库代理规格 数据库代理企业版默认的规格可以满足用户绝大部分的应用场景。当客户进行压力测试或者业务吞吐量很高时,当前新版本的数据库代理规格会自动随着代理的负载实时升级,避免数据库代理成为瓶颈。对于老版本的数据库代理,...

Tair(Redis企业版)简介

高兼容性:兼容大部分原生Redis的数据结构和命令。购买指引 Redis企业版产品类型 购买链接 操作说明 内存型 立即购买(推荐)创建Tair实例 立即购买 创建Tair经典版实例 持久内存型 立即购买 创建Tair实例 云盘(ESSD)型 阿里云Tair的诞生...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

数据建模:智能数据建模

如何打破部门或业务领域之间的信息孤岛是企业数据管理的一难题。数据标准整合,统一灵活对接 同一数据不同描述,企业数据管理难、内容重复、结果不准确。如何制定统一的数据标准又不打破原有的系统架构,实现灵活对接上下游业务,是标准...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 数据库备份 云数据库 RDS 域名 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用