MapReduce

海量数据挖掘:非结构化数据、时空数据和图像数据挖掘。机器学习:监督学习、无监督学习和分类算法(例如决策树、SVM)。自然语言处理:基于大数据的训练和预测。基于语料库构建单词同现矩阵,频繁项集数据挖掘、重复文档检测等。广告推荐...

应用场景

要深度并且快速的挖掘海量数据的关联特征,使用传统的方法则会面临非常大的技术挑战。通过图表示学习技术,提取知识图谱中的拓扑信息特征,作为风控模型的输入条件,参与模型训练,可以帮助金融机构构建更高精度的风控模型。商品推荐 基于...

导出数据

分析型数据库MySQL版对海量数据分析计算后支持输出(DUMP)数据结果,目前支持两种DUMP方式:导出数据到OSS 导出数据到MaxCompute

产品优势

数据安全中心DSC(Data Security Center)可扫描和识别海量数据,帮您实时获取数据的安全状态。本文介绍 数据安全中心 的产品优势。合规性 使用数据安全中心产品,可以帮助企业满足等保2.0对“云计算环境下安全审计”及“个人信息保护”的...

典型场景

云原生数据仓库PostgreSQL版支持对海量数据的复杂ETL进行处理,这些操作任务也可以被DataWorks调度。同时它还支持高性能的在线分析能力,可以通过Quick BI、DataV、Tableau、帆软等即时查询数据,并将数据以报表形式展现。大数据分析平台 ...

引擎简介

核心能力 低成本 通过高密度低成本介质、智能冷热分离、高压缩比算法、自适应编码等技术,达到海量数据存储处理成本比自建低80%。云原生弹性 通过存计分离架构和Serverless技术,支持计算和存储资源的按需即时弹性。企业级稳定性 基于高...

应用场景

敏感数据识别与打标 DSC 能从海量数据中发现和锁定保护对象,精准区分敏感数据与非敏感数据。通过内置算法规则和自定义敏感数据识别规则,对其存储的数据库类型数据以及非数据库类型文件进行整体扫描、分类、分级,并根据结果做进一步的...

扩展性

具备横向的扩展性,单DC单个集群支持500节点,支持最多3个DC。无Master、Proxy节点,节约资源。支持QPS从1000到10000万QPS,QPS会随着添加节点水平扩展,没有中心瓶颈。...支持海量数据存储(160GB~10PB)。支持从单DC在线扩展至多DC。

品牌升级

PolarDB-X 融合分布式SQL引擎与分布式自研存储X-DB,专注解决海量数据存储、超高并发吞吐、大表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里云各行业客户业务的考验。此次品牌升级,存量DRDS实例不受影响,可正常续费...

互联网服务:小打卡

PolarDB-X 专注解决海量数据存储、超高并发吞吐、大表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里云各行业客户业务的考验,助力企业加速完成业务数字化转型。本文介绍小打卡如何通过 PolarDB-X 应对业务挑战。所属...

RDS搭配大数据计算服务实现大规模数据计算

开放数据处理服务又称为大数据计算服务(MaxCompute,原名ODPS),可服务于批量结构化数据的存储和计算,提供海量数据仓库解决方案以及针对大数据的分析建模服务。通过 数据集成 服务,可将RDS数据导入MaxCompute,实现大规模的数据计算,...

实时数据API

处理实时数据业务的整个链路中,要求数据库提供高性能的计算服务,存储海量数据,同时对接多种BI分析工具。单一的数据库很难实现以上所有功能,您必须借助其他数据库的相关能力完成业务流程。借助其他数据库在导入导出数据时会产生冗余存储...

计算设置概述

设置Dataphin实例的计算引擎为MaxCompute AnalyticDB for PostgreSQL 专注于OLAP领域的分析型数据库,是云端托管的PB级高并发实时数据仓库,具备海量数据计算无缝伸缩能力 设置Dataphin实例的计算引擎AnalyticDB for PostgreSQL E-...

基于MaxCompute进行大数据BI分析

AnalyticDB MySQL:用于进行海量数据实时高并发在线分析,详情请参见 云原生数据仓库AnalyticDB MySQL版。DataWorks:可实现ETL功能,对复杂数据集进行采集、加工及分析处理,详情请参见 什么是DataWorks。Quick BI:对处理后的数据进行...

未来规划

如何对海量数据进行在线分析和计算,支持实时在线交互式分析,需要做并行处理(DSP 模型、MPP 模型等等),对并行调度计算进行优化。系统能力提升:智能化+安全(使用方便可靠、运维简易)。如在管控平台的层面如何做智能化的调度、监控...

湖仓一体新能力:EMR支持Hologres和MaxCompute数据

背景信息 Hologres 是阿里巴巴自主研发的一站式实时数仓引擎,支持海量数据实时写入、实时更新、实时加工、实时分析,支持标准SQL(兼容PostgreSQL协议),支持PB级数据多维分析(OLAP)与即席分析(Ad Hoc),支持高并发低延迟的在线数据...

方案背景

表格存储作为阿里云面向海量结构化数据提供Serverless表存储服务,具有海量数据存储、热点数据自动分裂、海量数据多维检索等功能,可以有效的地解决地理位置数据量大膨胀这一挑战。需求场景 某店铺搜索平台,提供了亿量级的店铺信息。用户...

应用场景

大数据场景:海量数据存储与分析 Lindorm支持海量数据的低成本存储、快速批量导入和实时访问,具备高效的增量及全量数据通道,可轻松与Spark、MaxCompute等大数据平台集成,完成数据的大规模离线分析。优势 低成本:高压缩比,数据冷热分离...

应用场景

大数据存储与分析 传统的数据分析场景下,用户需要把数据从在线数据库(Operational Database)复制到离线数据仓库(Data Warehouse)上之后再进行数据分析,这需要海量数据的多次复制、传输、加载和存储等多方面工作。HybridDB for MySQL...

应用场景

大数据 大数据具有数据规模大、数据类型多样、生成速度快、价值巨大但密度低的特点,如何高性价比存储海量持续增长的数据以及快速从海量数据中获取有价值的信息成为大数据领域的关注重点。表格存储 数据湖架构能有效的解决大数据领域面临的...

什么是云数据库SelectDB版

云数据库SelectDB版 是新一代实时数据仓库 SelectDB 在阿里云上的全托管服务,您可以在阿里云上便捷地购买 SelectDB 数仓服务,满足海量数据分析需求。产品优势 高性价比 高性能:支持亚秒级响应海量数据查询、万级高并发点查询以及高吞吐...

应用场景

网页或者移动应用的静态和动态资源分离 利用海量互联网带宽,OSS可以实现海量数据的互联网并发下载。OSS提供原生的 传输加速 功能,支持上传加速、下载加速,提升跨国、跨洋数据上传、下载的体验。同时,OSS也可以结合CDN产品,提供静态...

使用说明

对于海量数据的复杂查询,可以使用多机MPP进行查询加速。具体操作请参见 使用多机MPP对海量数据分析提速。其他 如果您对列存索引背后的原理感兴趣,您可以参考以下文档来进一步了解列存索引:PolarDB IMCI发表在 SIGMOD2023上的论文 列存...

数据迁移

背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大时,可以将数据迁移至 MaxCompute。MaxCompute为您提供了完善的数据迁移方案以及多种经典的分布式计算模型,能够快速地解决海量数据存储和...

概述

适用于海量账单、IM消息、物联网、车联网、风控、推荐等场景中的结构化数据存储,提供海量数据低成本存储、毫秒级的在线数据查询和检索以及灵活的数据分析能力。更多信息,请参见 什么是表格存储。云原生大数据计算服务(MaxCompute)是一...

SQL概述

应用场景 MaxCompute SQL适用于海量数据(GB、TB、EB级别)、离线批量计算的场景。提交MaxCompute作业后,会存在几十秒到数分钟不等的排队调度,所以适合处理批作业,提交一次作业批量处理海量数据。不适合直接对接需要每秒处理几千至数万...

教程概述

本文为您介绍当需要通过DataV展示海量数据的分析结果时,如何使用DataWorks的数据服务开发数据API,并快速在DataV中调用API,最终将来自MaxCompute的数据成果展示在DataV大屏中,数据开发到数据服务再到数据分析展现一气呵成。注意 本案例...

数据服务集群

Apache HBase支持海量数据存储,具有很高的存储和计算扩展性,以及很好的读写性能,支持动态列、数据多版本存储,以及数据的生命周期管理等特点。适用场景 基于Apache HBase的优势和特点,DataServing适用于以下场景:风控或画像等需要支持...

基本概念

为了进一步提高效率,云数据库ClickHouse 将海量数据分散存储到多台服务器上,每台服务器只存储和处理海量数据的一部分,在这种架构下,每台服务器被称为一个分片(Shard)。副本(Replica)为了在异常情况下保证数据的安全性和服务的高...

快速使用TPC-DS测试数据

TPC-DS是一套决策支持系统测试基准,提供99个SQL查询(SQL99或2003),分析数据量大,测试数据与实际商业数据高度相似,同时具有各种业务模型(分析报告型,数据挖掘型等等)。使用DLF数据探索,可以便捷地快速创建TPC-DS数据集,便于用户...

物联网存储介绍

基于物联网场景中多源异构数据存储、高并发吞吐、海量数据高性价比存储、多维度数据处理与分析等需求,表格存储推出了一站式物联网存储IoTstore解决方案,为物联网设备元数据、消息数据、时序轨迹等海量数据提供存储、查询、检索、分析、...

通过DMS访问沙箱实例

后续步骤 DMS支持数据开发、分析、挖掘、可视化等功能:配置任务流:通过一个或多个任务编排而成的任务组,实现数据归档、数据集成、数仓数据开发、数据挖掘等需求。数据服务概览:将DMS上管控的数据以API的形式快速对外输出。数据可视化...

方案背景

表格存储作为阿里云提供的一款全托管、分布式NoSql型数据存储服务,具有【海量数据存储】、【热点数据自动分片】、【海量数据多维检索】等功能,天然地解决了数据大爆炸这一挑战;在应对数据横向、纵向扩展上能充分发挥其优势。多元索引...

产品架构

其整体架构与宽表引擎一致,基于数据自动分区+分区多副本+Lucene的结构设计,具备全文检索、聚合计算、复杂多维查询等能力,支持水平扩展、一写多读、跨机房容灾、TTL等,满足海量数据下的高效检索需求,具体如下:LindormSearch 的数据...

查询执行模式

背景 云原生数据仓库AnalyticDB MySQL版(简称ADB MySQL版),是阿里巴巴自主研发的海量数据实时高并发在线分析云计算服务,可以对海量数据进行即时的多维分析透视和业务探索。AnalyticDB MySQL 的执行引擎是MPP DAG的融合执行引擎,能够...

概述

此方法适用于海量数据场景,对数据量不设上限,同时支持行、列和TEXTFILE等各种存储格式以及用户自定义分区配置。DataWorks数据集成 通过DataWorks配置离线同步节点和同步任务将日志数据同步至MaxCompute。详情请参见 通过DataWorks数据...

生态集成

云原生数据仓库AnalyticDB PostgreSQL版 具备完善和开放的生态系统,支持无缝对接业界以及阿里云生态的...云原生数据仓库AnalyticDB PostgreSQL版 内置了数据挖掘引擎MADlib及空间数据引擎PostGIS,用户可以基于这些内置能力更好的进行分析。

典型应用

海量数据实时多维查询 在数亿至数百亿记录规模大宽表,数百以上维度自由查询,响应时间通常在100毫秒以内。让业务人员能持续探索式查询分析,无需中断分析思路,便于深挖业务价值,具有非常好的查询体验。用户画像分析 随着数据时代的发展...

概述

十年来专注于为海量数据访问提供低消耗、高性能、高可用的轻量级解决方案,确保在高并发、数据库异常的情况下依然非常稳定与可靠。数据访问代理兼容 MySQL 协议和语法,支持分库分表、平滑扩容、服务升降配、透明读写分离和分布式事务等...

背景信息及准备工作

提供海量数据实时在线分析服务,支持拖拽式操作、提供了丰富的可视化效果。您可以将OSS数据的查询分析结果以BI报表形式展现,帮助您轻松自如地完成数据分析、业务数据探查、报表制作等工作。本示例主要介绍如何使用OSS+DLA+Quick BI实现...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 云数据库 RDS 云数据库 Redis 版 日志服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用