验证分析型查询请求能力

它适用于处理规模、多维的数据集,能够帮助用户进行数据分析、数据挖掘、业务决策等。并行执行 OceanBase 数据库的并行执行指的是在分布式架构下进行的并发处理。OceanBase 数据库采用了分布式架构,将数据分片存储在不同的节点上,通过...

产品架构

优化与加速框架:包括DatasetAcc数据集加速、TorchAcc训练加速、EPL并行训练框架、Blade推理加速、AIMaster自动容错训练以及EasyCkpt秒级异步训练快照等。按照机器学习全流程,PAI分别提供了数据准备、模型开发与训练以及模型部署阶段的...

CPFS并行文件存储

完全对称式分布式架构,元数据和实体数据的吞吐带宽都可以得到线性伸缩。真正无缝扩容:扩容时自动检测现有存储节点负载,控制扩容速度。多级存储架构:支持云 CPFS并行文件存储 扩容到云上CPFS、OSS存储。高性能 单集群 CPFS并行文件...

玄武分析型存储

高吞吐实时写入 AnalyticDB通过三层并行架构实现了极强的吞吐能力,从接入层、到存储节点层再到持久分布式存储层,都可以并行扩展,再结合行列混合存储引擎,增量和全量的异步转换实现了高吞吐高并发实时写入。在实时可见性方面,...

功能特性

计算 MaxCompute向用户提供了多种经典的分布式计算模型,提供TB、PB、EB级数据计算能力,能够更快速的解决用户海量数据计算问题,有效降低企业成本。功能 功能 功能描述 参考文档 SQL开发 DDL语句 DDL语句 DDL DML操作 DML操作 DML操作 ...

什么是数据管理DMS

MongoDB:云数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份恢复、性能优化等功能。AnalyticDB MySQL版:云原生数据仓库AnalyticDB ...

产品优势

微服务产品提供金融级分布式架构的基础设施能力,包括 RPC 框架及服务治理、服务注册与发现、动态配置、定时任务、服务限流等,为传统单体应用架构深入拆分为分布式应用架构提供稳定可靠的基础设施能力,帮助企业级客户快速构建基于微服务...

TCC 模式接入

分布式事务支持以 TCC 模式接入 SOFARPC、Dubbo 和 Spring Cloud 远程服务框架。本文将介绍如何定义接口、实现接口,并针对远程服务框架进行发布服务。定义接口 TCC 参与者需要实现三个方法,分别是一阶段 Try 方法、二阶段 Confirm 方法...

2023年

支持用户通过SQL、PyODPS、Python等进行数据分析、探索,挖掘数据的价值,完成大数据与AI的融合应用开发。本文为您介绍如何使用Notebook功能。(邀测)MaxCompute Notebook使用说明 2023-09-12 新增在本地环境上使用PyODPS 新说明 PyODPS是...

PolarDB-X适用场景

目前,PolarDB-X 具备从单机到分布式的平滑演进能力,支持动态通过DDL将一张表动态调整为分布式的分区表,结合分布式事务、以及兼容MySQL binlog的数据回流,可完成单机到分布式的快速改造。数据库国产化替换 场景描述 信息系统国产化是...

应用场景

数据分析 云服务器ECS提供了大数据类型实例规格族,支持Hadoop分布式计算、日志处理和大型数据仓库等业务场景。由于大数据类型实例规格采用了本地存储的架构,云服务器ECS在保证海量存储空间、高存储性能的前提,可以为云端的Hadoop集群...

技术架构

数据传输服务(Data Transmission Service,简称DTS),支持关系型数据库、NoSQL、大数据等数据源,数据迁移、订阅及实时同步功能于一体,能够解决公共云、混合云场景,远距离、毫秒级异步数据传输难题。其底层基础设施采用阿里双11...

客户案例

基于金融云计算平台以及 OceanBase 的海量存储,网商银行拥有处理高并发金融交易、海量大数据和弹性扩容的能力,可以利用互联网和大数据的优势,给更多小微企业提供金融服务。唐家才 网商银行 CTO“网商银行选择 OceanBase 三地五中心部署...

什么是 SOFAStack

提供项目管理、微服务应用开发、部署发布、监控运维、容灾高可用等全栈式解决方案,并兼容 Dubbo、Spring Cloud 等微服务运行环境,助力客户各类应用轻松转型分布式架构。SOFAStack 的名称来自蚂蚁内部发展十多年的金融级分布式中间件 SOFA...

应用场景

大数据分析:可对接Storm、Spark等实时数据处理引擎,亦可对接Hadoop等离线数据仓库系统。日志聚合 许多公司,例如淘宝、天猫等,每天都会产生大量的日志(一般为流式数据,例如搜索引擎PV、查询等)。相较于以日志为中心的系统,例如...

数据服务集群

EMR HBase存算分离架构下,除了HBase自身的Block Cache外,还支持基于Jindofsx分布式缓存服务来充分利用集群本地磁盘来加速读访问。存算分离优势如下:更低的存储成本:OSS存储。更低的运维成本:存储全托管。支持弹性伸缩:按需扩缩容计算...

未来规划

一代的企业级数据库架构应该是将云原生架构和分布式架构以及HTAP完美结合起来。上层是分库分表Shared-Nothing的架构,下层是存储与计算分离的云原生架构,这种架构的好处在于既能够水平扩展,又能够实现高可用的能力。而且面对高并发的...

JindoFS实战演示

视频发布时间 描述 Fluid+JindoFS对OSS上的数据进行训练加速 Fluid+JindoFS对OSS上的数据进行训练加速 2021-07-06 Fluid是一个开源的Kubernetes原生的分布式数据集编排和加速引擎,主要服务于云原生场景的数据密集型应用,例如大数据应用...

AI加速概述

PAI-AI加速器主要用于训练加速和推理加速,它通过数据集加速、计算加速、优化算法、调度算法和资源优化技术等多种手段,提高了AI训练和推理的速度、易用性和稳定性,全面提升了AI计算的效率。本文为您介绍AI加速器的功能亮点。AI加速器功能...

产品架构

作为分布式架构的平台管控层,单元化应用服务还承担与各相关系统的对接能力。与研发效能产品对接,提供持续集成与交付功能,生成 LHC 产品的发布单。与各 PaaS 基础产品对接,提供权限、资源、应用元数据、工作空间、部署单元等领域模型的...

2021年

大数据集情况,其相较于Btree等索引,在可以达到相近甚至超越的性能的同时,只需要很小的物理存储,并且索引生成代价远远小于Btree等索引。索引管理 并行查询(Beta)新增 rds_segment_expansion_coeff 参数,Session级别,取值为整数...

产品整体介绍

云原生数据仓库AnalyticDB PostgreSQL版 提供PB级数据实时交互分析、ETL/ELT、BI报表展示功能,支持数据高吞吐实时写入与批量导入,提供ACID保证和标准事务隔离级别,采用MPP全并行架构,是一款具有高性价比的云原生数仓产品,提供基于...

名词解释

表列出了 AnalyticDB PostgreSQL 所涉及到的基本概念:名词 解释 MPP Massively Parallel Processing,一种分布式 Shared Nothing 计算架构,支持多个无共享的节点,执行全并行计算,计算性能随节点增加而线性提升。AnalyticDB for ...

内存型

最佳实践:基于TairZset轻松实现多维排行榜、基于TairZset实现分布式架构排行榜。GeoSpatial GIS 无 TairGIS是一种使用R-Tree做索引,支持地理信息系统GIS(Geographic Information System)相关接口的数据结构。支持点、线、面的查询,...

概述

高性能 通过分布式以及优化的底层架构、支持多层调度模式可进行无限拆分,多线程并行处理,显著提升大数据量的批任务处理的性能。可视化集中式管理 通过简易操作的可视化集中式管理平台可对上万个任务节点进行集中化管理,简化运维管理操作...

全场景解决方案

金融级分布式架构,快速迭代、弹性扩展 经济性:高可靠、高性能、低成本,灵活扩展 方案优势 金融级云原生架构体系 技术上引入阿里“全家桶”云原生架构技术体系,包括飞天平台、企业级分布式架构平台、OceanBase 数据库、大数据平台、移动...

搭建Hadoop环境

本文介绍如何在Linux操作系统的ECS实例上快速搭建Hadoop分布式环境。前提条件 搭建Hadoop环境时,已有的ECS实例必须满足以下条件:公网IP:实例已分配公网IP地址或绑定弹性公网IP(EIP)。操作系统:Linux操作系统。实例安全组的入方向规则...

概述

弹性并行查询(Elastic Parallel Query)针对云上用户实例CPU资源利用率较低、使用不均衡的特征,充分挖掘集群中多核CPU的并行处理能力,以8核32 GB(独享规格)的 PolarDB MySQL版 集群版为例,示意图如下所示:前提条件 PolarDB 集群版本...

应用场景

基于蚂蚁集团中台战略及架构的最佳实践,将企业级公共能力进行抽象,形成以客户服务、运营服务、分布式架构为基础的业务中台体系,实现开放、可扩展、组件化、分布式的业务架构,支持业务快速、高效、低成本创新,满足互联网场景化快速多变...

异构数据源访问

准备测试数据集 准备测试数据集,并执行 hadoop fs-put<本地文件名称><文件保存在Hadoop集群的路径>命令将数据集保存在Hadoop集群路径。例如,将本地文件/home/user/file.txt 上传到HDFS的/tmp 目录,执行 hadoop fs-put/home/user/file....

E-MapReduce弹性低成本离线大数据分析

离线大数据分析概述 主流的三大分布式计算框架系统分别为Hadoop、Spark和Storm:Hadoop可以运用在很多商业应用系统,可以轻松集成结构化、半结构化以及非结构化数据集。Spark采用了内存计算,允许数据载入内存作反复查询,融合数据仓库、流...

企业版和标准版功能对比

不支持 支持 一写多读集群 PolarDB 采用分布式集群架构,一个集群版集群包含一个主节点和最多15个只读节点(可以只包含一个主节点),多个数据库节点构成数据库引擎层。主节点处理读写请求,只读节点仅处理读请求。主节点和只读节点之间...

YARN高可用特性使用指南

基本介绍 Hadoop YARN是基于Master与Slave主从架构分布式集群资源管理系统,其中RM(ResourceManager)是Master组件,负责整个集群的资源管理与任务调度,NM(NodeManager)是Slave组件,负责单个节点的任务管理与监控。YARN高可用特性主要...

创建集群

通过阿里云E-MapReduce(简称EMR),您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行大规模数据处理和分析等操作。本文为您介绍在EMR on ECS上创建集群的操作步骤和相关配置,帮助您快速搭建和管理大数据集群。...

PolarDB HTAP实时数据分析技术解密

在存储计算分离架构下,减少网络读取的数据量,可以缩短对查询处理的响应时间。列存储同样能提高CPU在处理数据时的执行效率。首先,列存的紧凑排列方式可提升CPU访问内存效率,减少L1/L2 Cache miss导致的执行停顿。其次,在列存储上...

列存索引技术架构介绍

基于多副本的Divergent Design方法 随着互联网而兴起的新兴数据库产品很多都兼容了MySQL协议,这些分布式数据库产品部分采用了分布式Share Nothing方案,其一个核心特点是使用分布式一致性协议来保障单个partition多副本之间的数据一致性...

技术面临的挑战与革新

在Proxy的协同,甚至可以做到节点切换对应用无感知 传统分布式架构与存储计算分离架构对比 分布式数据库其实已经有了不短的历史,早期的分布式数据库,在整体架构上可以分为share nothing和share disk两类。share disk通过扩展底层的...

PolarDB PostgreSQL版架构介绍

分布式执行加速索引创建 分布式并行执行加速多模:时空数据库 传统数据库的问题 随着用户业务数据量越来越,业务越来越复杂,传统数据库系统面临巨大挑战,例如:存储空间无法超过单机上限。通过只读实例进行读扩展,每个只读实例独享一...

技术架构

架构演进理念 当前,分布式领域有3技术方向:Sharding技术,NewSQL原生分布式技术,云原生DB技术。每种分布式都有其独特的优势和特点。PolarDB-X 1.0 的架构继承了DRDS和X-DB技术的稳定性,结合了PolarDB的云原生技术,融入了NewSQL对于...

强一致分布式事务

任意时间点的数据恢复(PITR,point-in-time recovery)都可以快速将时间戳转化为分布式的中心授时,在备份恢复中按数据的版本可见性进行处理,同时 PolarDB-X 结合分布式的多节点并行来全面提升备份恢复的效率。具体特性请参见 数据备份与...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 MongoDB 版 数据传输服务 云数据库 Redis 版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用