Serverless Spark概述

解决方案 Serverless Spark是云原生数据湖团队基于Apache Spark打造的服务化的大数据分析与计算服务。方案架构图如下所示:Serverless Spark将Spark、Serverless、云原生技术,深度整合到一起,相对于传统开源Spark集群版方案,具体以下...

通用数据开发

数据分析与处理:完成数据的同步后,可以对MaxCompute中的数据进行加工(MaxCompute SQL、MaxCompute MR)、分析与挖掘(数据分析数据挖掘)等处理,从而发现其价值。数据提取:分析与处理后的结果数据,需要同步导出至业务系统,以供...

Quick BI如何接入TSDB

Quick BI是一个基于云计算致力于大数据高效分析与展现的轻量级自助BI工具服务平台。通过对数据源的连接和数据集的创建,对数据进行即时的分析与查询;通过电子表格或仪表板功能,以拖拽的方式进行数据的可视化呈现。连入成功后,您可以在...

如何对JSON类型进行高效分析

PolarDB 列存索引(In Memory Column Index,IMCI)功能推出了完备的虚拟列列式JSON功能等,可以快速处理数据和多种数据类型(包括结构化数据半结构化数据等),并提供高效的数据分析、查询流计算能力,适用于数据分析数据仓库...

Github实时数据同步与分析

最终效果如下:(可选)历史离线数据分析 实时数仓Hologres与大数据计算服务MaxCompute深度融合,可以组成一体化的大数据查询与分析架构。在MaxCompute公共数据集中,存储了历史GitHub全量数据。如果想要做更长时间的数据分析,有两种方式...

物联网设备数据上云存储

业务基于 TSDB 进行数据分析、监控和大数据分析。物联网平台规则引擎 物联网设备基于消息 Topic 进行通信,使用规则引擎对 Topic 中的数据进行处理然后转发到 TSDB。只需要在规则引擎中配置一些简单的规则,就可以将设备数据存储到指定的...

典型场景

大数据分析平台 对于MaxCompute、Hadoop和Spark中保存的海量数据,可通过采用数据集成服务(DataX)或通过对象存储服务(OSS),快速批量导入到 云原生数据仓库AnalyticDB PostgreSQL版,帮助您实现高性能分析处理和在线数据探索。数据湖...

面临的业务挑战

越来越多的企业大数据分析已不再局限于传统的T+1场景,对数据的实时性分析和处理要求提出了更高要求。传统的批处理模式往往有数小时甚至数天的延迟,不能满足T+0的业务需要,用户要求在秒级,甚至毫秒级完成对海量数据分析。系统极复杂 ...

基础分析

基础分析数据维度 在基础分析功能中系统支持以时间维度、技能组、对话轮次和和自定义数据维度进行分析。通话内容分布 通话内容分布是分析呼叫中心呼入电话内容的业务情况,并展示各个通话中涉及到的各项业务占比。分析时以用户定义的业务...

功能发布记录(2024年)

2024.2.6 所有地域 所有DataWorks用户 系统配置 2024-01 功能名称 功能描述 发布时间 发布地域 使用客户 相关文档 数据开发与数据分析的查询结果支持脱敏展示 数据保护伞支持对E-MapReduce表数据进行分类分级、敏感数据识别、数据脱敏展示...

ActionTrail日志清洗

以操作DLA的账号为例,该账号下每天会产生几千个数据文件,一个月的文件数将达到几十万个,大量的数据文件对数据分析非常不便,分析数据耗时,且需要足够的集群资源才能进行数据分析。前提条件 使用ActionTrail日志清洗之前,您需要...

Quick BI连接MaxCompute

步骤二:使用Quick BI查询及分析数据 在Quick BI操作界面,您可以基于新创建的数据连接,查询MaxCompute项目数据及分析数据。您可以执行如下操作,操作详细指导,请参见 管理数据表 和 数据分析。查看所有表 成功添加MaxCompute数据源后,...

Spark概述

Spark是一个通用的大数据分析引擎,具有高性能、易用性和普遍性等特点。架构 Spark架构如下图所示,基于Spark Core构建了Spark SQL、Spark Streaming、MLlib和Graphx四个主要编程库,分别用于离线ETL(Extract-Transform-Load)、在线数据...

读写RDS MySQL数据

DLA支持连接RDS(MySQL、SQLServer、PostgreSQL)数据源,然后通过SQL语法查询和分析RDS数据,同时支持将分析结果回写入RDS。本文以RDS MySQL为例介绍如何通过DLA读写RDS数据。注意事项 如果您的RDS实例位于VPC网络内,默认情况下DLA无法...

在工作空间创建数据源或注册集群

工作空间创建完成后,您需要先将您的数据库或数据仓库,通过创建数据源的方式添加至DataWorks工作空间,或将您的集群注册至DataWorks工作空间,以便进行数据同步、数据分析与开发、数据调度等操作。本文主要以使用正式开发环境为例,为您...

AnalyticDB MySQL助力Flowerplus业务高速发展

由此可见,Flowerplus对大数据分析的实时性要求较高,而传统的MySQL数据库无法满足这一需求。复杂数据查询性能 使用传统MySQL数据库对订单、商品流量、采购、业务转化率以及商品售罄报警等分析时速度较慢,数据达到千万级或者亿级时,复杂...

我是普通用户

数据导出 进行大量数据分析或提取相关数据时可以使用数据导出功能。数据追踪 由于误操作等原因导致数据不符合预期时,可以通过数据追踪将数据快速恢复到正常状态。测试数据构建 测试数据结构可以在频繁的数据准备过程中确保数据安全、保障...

背景信息以及准备工作

背景信息 DLA作为无服务化的大数据分析服务,通过标准的SQL语句直接对存储在阿里云对象存储服务(Object Storage Service,简称 OSS)、表格存储(Table Store)中的数据进行清洗。例如,使用DLA对OSS中的历史数据按天进行清洗。DataWorks...

冷热分层

更多介绍请参见 结构化大数据分析平台设计、面向海量数据的极致成本优化-云HBase的一体化冷热分离 和 云上如何做冷热数据分离。冷热数据 数据按照实际访问的频率可以分为热数据、温数据和冷数据。其中冷数据数据量较,很少被访问,甚至...

数据上云场景

MaxCompute平台提供了丰富的数据上传下载工具,可以广泛应用于各种数据上云的应用场景,本文为您介绍三种经典数据上云场景。Hadoop数据迁移 您可使用MMA...具体场景示例请参见 Flume收集网站日志数据到MaxCompute 和 海量日志数据分析与应用。

简介

系统兼容开源GeoMesa、GeoServer等生态,内置了高效的时空索引算法、空间拓扑几何算法、遥感影像处理算法等,结合云数据库HBase强大的分布式存储能力以及Spark分析平台能力,广泛应用于空间、时空、遥感大数据存储、查询、分析与数据挖掘...

后续指引

开发与分析 数据类型 MaxCompute支持三种数据类型版本,为您介绍各版本支持的数据类型、适用场景及各版本间的差异,避免开发过程中出现数据类型无法解析问题。介绍:数据类型 常见问题:数据类型常见问题 常用命令 提供开发过程中的针对 表...

基于混合负载的查询优化

传统数仓方案,通过组合多套数据与大数据产品,利用各自不同的优势来解决不同的分析场景,带来的问题就是整个数据冗余,同时管理多个异构系统的代价。完备数据仓库,首要解决的问题包括:如何更好的支持数据库场景下的交互式分析以及大...

应用场景

大数据场景:海量数据存储与分析 Lindorm支持海量数据的低成本存储、快速批量导入和实时访问,具备高效的增量及全量数据通道,可轻松Spark、MaxCompute等大数据平台集成,完成数据规模离线分析。优势 低成本:高压缩比,数据冷热分离...

数据分析概述

数据分析数据辅助决策的最后一公里,是最终的数据可视化展示探索分析的部分,选择使用最适合的数据展示方式,可以帮助分析人员大大提升分析效率。仪表板:支持近40种数据图表,操作方便简单,如果您是专业版用户,还可以在群空间下配置...

功能发布记录(2023年)

2023.4.18 所有地域 所有DataWorks用户 SQL查询 大数据公共数据集上线 基于大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等),通过DataWorksMaxCompute快速完成TB级别大数据分析。2023.4.11 所有地域 所有DataWorks用户 SQL...

快速使用TPC-DS测试数据

TPC-DS是一套决策支持系统测试基准,提供99个SQL查询(SQL99或2003),分析数据,测试数据实际商业数据高度相似,同时具有各种业务模型(分析报告型,数据挖掘型等等)。使用DLF数据探索,可以便捷地快速创建TPC-DS数据集,便于用户...

使用流程

ADAM(数据应用迁移)使用主要分为数据库评估,数据改造迁移,应用评估改造三个流程。整体迁移流程简介 数据库评估:帮助用户了解源库现状、提供目标库的选型建议,根据评估结果为用户迁移到目标库提供可行性参考。数据改造迁移:帮助...

数据传输迁移概述

类型 典型场景 数仓管理员对数据进行预览 DataWorks-数据分析数据管理、数据开发调度(数据通道)。Kettle。商业智能,制作报表,看板 Quick BI。Superset。离线数据批量数据读取(外部表-湖仓一体)场景特征:主要用于数据联邦查询分析...

数据可视化展现

数据分析中使用数据源,需要先给数据源授权,您可以进入 安全中心>安全策略>数据查询与分析管控>可查询数据源 界面,找到需要查询的数据源,单击 操作 列的 授权,为您的账号授权,详情请参见 安全中心。创建 临时文件。方式一:首次进入...

数据源Data Lake Analytics

添加Data Lake Analytics数据源用于连通阿里云Data Lake Analytics数据库与Quick BI,连接成功后,您可以在Quick BI上进行数据分析与展示。Quick BI支持以公网连接阿里云Data Lake Analytics,本文为您介绍如何添加阿里云Data Lake ...

通过Quick BI连接StarRocks实例

添加StarRocks数据源用于连通StarRocks数据库与Quick BI,连接成功后,您可以在Quick BI上进行数据分析与展示。本文为您介绍如何通过Quick BI连接StarRocks实例。背景信息 Quick BI是由阿里云提供的一款全场景数据消费式的BI平台,无缝...

Notebook概述

可形成完整的数据分析报告,方便您进行分析过程结果回顾,也可分享给其他Dataphin实例的用户查看。便捷地查询数据:您可以在Dataphin Notebook中便捷地进行数据查询与分析。可快速切换运行项目。如您不在任何项目中,您也可以使用已绑定...

Quick BI数据可视化

Quick BI支持连接 云数据库 SelectDB 版 实例,连接成功后,您可以在Quick BI上进行数据分析与展示。本文为您介绍如何为Quick BI添加 云数据库 SelectDB 版 数据源。前提条件 已为 云数据库 SelectDB 版 实例 申请公网地址。具体操作,请...

Notebook概述

可形成完整的数据分析报告,方便您进行分析过程结果回顾,也可分享给其他Dataphin实例的用户查看。便捷地查询数据:您可以在Dataphin Notebook中便捷地进行数据查询与分析。可快速切换运行项目。如您不在任何项目中,您也可以使用已绑定...

背景信息以及准备工作

或者对存储在 阿里云对象存储服务(Object Storage Service,简称 OSS)、表格存储(Table Store)上的大数据进行分析之后,通过DLA把结果数据回写到MongoDB,供前台业务使用。前提条件 使用DLA读写MongoDB数据前,您需要通过以下操作在...

DataWorks V3.0

交互式分析:交互式分析(Interactive Analytics)是一种全面兼容PostgreSQL协议,并与大数据生态无缝打通的实时交互式分析产品。交互式分析支持对万亿级数据进行高并发、低延时、多维分析透视和业务探索,可以让您快速对接现有的BI工具。...

创建实例

通过创建StarRocks实例,您可以快速获取一个托管的且高性能的环境,无需自行搭建和维护基础设施,轻松进行规模数据分析和查询。操作步骤 进入EMR Serverless StarRocks实例列表页面。登录 E-MapReduce控制台。在左侧导航栏,选择 EMR ...

准备工作

TPC-DS是一套决策支持系统测试基准,主要用于衡量大数据产品的分析性能。您可以在AnalyticDB MySQL中进行完整的TPC-DS基准测试,了解AnalyticDB MySQL的分析性能。说明 本文的TPC-DS的实现基于TPC-DS的基准测试,并不能已发布的TPC-DS...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将...MaxCompute处理业务数据和日志数据后,可以通过Quick BI快速地以可视化方式展现数据处理结果,详情请参见 基于MaxCompute的大数据BI分析
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云原生大数据计算服务 MaxCompute 数据库备份 DBS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用