本文将介绍如何选择云原生数据仓库AnalyticDB PostgreSQL版实例规格。

实例资源类型

AnalyticDB PostgreSQL版推荐使用存储弹性模式和Serverless版本两种实例资源类型:

  • 存储弹性模式

    产品功能完整,使用存储计算一体架构,支持计算节点垂直升降配,横向扩容和存储灵活调整。

    购买时需要指定实例系列计算节点规格计算节点数存储节点类型单节点存储大小

  • Serverless版本

    自研存储计算分离的架构,支持秒级扩缩容、按需存储,轻松覆盖业务存在明显闲忙的资源需求场景。

    购买时需要指定实例系列计算节点规格计算节点数

具体信息如下表所示:

表 1. 存储弹性模式(推荐)
实例系列 节点规格 存储磁盘类型 地域 适配场景
高可用 2C16G ESSD云盘

高效云盘

华北2(北京)

华东1(杭州)

华东2(上海)

华南1(深圳)

华北5(呼和浩特)

新加坡

印度(孟买)

印度尼西亚(雅加达)

西南1(成都)

澳大利亚(悉尼)

华北3(张家口)

德国(法兰克福)

英国(伦敦)

日本(东京)

马来西亚(吉隆坡)

中国(香港)

POC测试。

个人学习使用,体验测试产品能力。

4C32G 适合计算存储均衡场景,60%用户的选择。
8C64G 适合计算密集型场景,支持大量高复杂度数据分析,高并发等场景。
16C128G 适合企业级平台建设,适用于高并发场景,大规模企业核心数据平台推荐选择。
高性能(基础版) 2C8G ESSD云盘 华北2(北京)

华东1(杭州)

华东2(上海)

华南1(深圳)

新加坡

印度尼西亚(雅加达)

POC测试。

个人学习使用,体验测试产品能力。

4C16G 适合计算存储均衡场景,适合离线分析业务。
注意 高性能(基础版)不提供高可用,请谨慎选择该系列。
8C32G
16C64G
表 2. Serverless版本(新)
实例系列 节点规格 存储磁盘类型 地域 适配场景
高可用 4C16G 共享存储 华北2(北京)

华东1(杭州)

华东2(上海)

华南1(深圳)

新加坡

新产品形态,支持秒级变配、按需存储及数据共享。

适合如下场景:

  • 业务负载变动较大。
  • 新业务无法明确资源计划。
  • 业务负载隔离明确。
8C32G

核心能力选型推荐

典型数据入仓场景

场景 存储弹性模式 Serverless版本
RDS 支持 暂不支持
Flink 支持 暂不支持
Kafka 支持 暂不支持
自建数据库(MySQL,PostgreSQL等) 支持 暂不支持
MaxCompute 支持 支持
OSS数据(JSON,AVRO,CSV等) 支持 支持
JDBC、ODBC客户端写入 支持 支持

数据分析场景

场景 存储弹性模式 Serverless版本
标准SQL能力 支持 支持
时空分析场景

PostGIS、GANOS

支持 暂不支持
机器学习场景 支持 支持
数据湖分析(OSS,ODPS) 支持 支持
联邦分析(OSS,ODPS) 支持 支持
大量离线数据批处理 支持 支持
向量分析场景 支持 暂不支持

负载管理场景

场景 存储弹性模式 Serverless版本
资源隔离 支持 支持
多租户分库分仓 支持 支持
多业务实例间关联分析 暂不支持 支持
分时弹性 暂不支持 暂不支持

实例配置选型案例

案例一:互联网用户和制造业用户

用户为互联网客户和制造业客户,目前自建业务数据库和Greenplum数仓,希望能够完成云化部署。

建议:使用AnalyticDB PostgreSQL版存储弹性模式进行部署。

优势AnalyticDB PostgreSQL版兼容所有Greenplum、PostgreSQL语法和开源生态,可完成能力的全无缝对接并按需进行资源调整。

案例二:互联网SaaS用户

用户为互联网SaaS客户,需要建立数据中台,涉及多数据源包括RDS、Flink、OSS等,期待在平台上完成数据的ETL流程,实现多源处理以及分析侧不同场景的混合负载支持,需要高稳定性保证,同时平台对接数据应用支持报表和企业级数据服务。

建议:使用AnalyticDB PostgreSQL版存储弹性模式, 实例系列为高可用版,计算节点规格为4C32G以上,计算节点数量为4个以上。

优势:存储弹性模式打通了阿里云产品生态,支持导入阿里云或其他云产品进行的数据,提供企业级能力,例如通过UDF或Resource Queue进行负载管理。可实现仓内的ETL全流程,同时提供高于传统数仓系统约3倍的计算性能,支持分析侧的应用变化,支持垂直升降配和扩容,具有较高的平台扩展性。

案例三:传统企业数字化转型

用户为传统企业,需进行数字化转型,替代IDC上的Teradata、Oracle、DB2、传统Greenplum等传统数仓。

建议:使用AnalyticDB PostgreSQL版存储弹性模式,实例系列可根据业务类型选择高可用版或基础版,计算节点规格为4C32G以上,计算节点数量为4个以上。

优势AnalyticDB PostgreSQL版是替代Teradata、Oracle的标杆产品,已在数百家金融、运营商、政企验证完备的替代能力和解决方案。

案例四:自动驾驶企业

用户为自动驾驶领域企业,需要基于车采数据进行地理位置和时序的采集数据分析,要求对JSON格式的友好兼容和时空数据的分析能力,构建业务看板并支持特征工程。

建议:使用AnalyticDB PostgreSQL版存储弹性模式,实例系列为基础版,计算节点规格为4C32G以上。

优势:存储弹性模式具备PostGIS和Ganos的时空分析引擎,同时可实现在MPP架构下的查询加速;支持JSON等半结构化数据分析;支持数据湖分析,可实现最大程度的数据分析灵活性。

案例五:互联网游戏企业

用户为互联网游戏企业,需要构建数据中台,对行为数据进行分析。平台通过清洗业务日志和数据关联分析,实时支持运营工具。存在工作时间的混合业务负载和资源隔离需求。

建议:使用AnalyticDB PostgreSQL版Serverless版本,计算节点规格为4C16G以上,计算节点数量为4个以上。

优势:Serverless版本可以灵活的根据不同的时段进行资源的调整。对于日志数据提供SLS+OSS成熟的解决方案,能够实现仓内的高效数据清洗。Serverless版本分析能力完备,具备更强的单点计算能力。

案例六:新零售企业

用户为新零售企业,需要构建CDP平台,平台需要完备的多数据源汇入能力,并提供CDP下游人群圈选的成熟解决方案。

建议:使用AnalyticDB PostgreSQL版存储弹性模式,实例系列可根据需求选择高可用版或基础版,计算节点规格为4C32G以上,计算节点数量为4个以上。

优势:存储弹性模式支持多种数据格式,例如JSON、CSV、AVRO、PARQUET等,可实现数据快速汇聚并完成标签生成。支持阿里云自研的Quick Audience等产品,可快速实现云上平台的一站式搭建。

案例七:大型互联网企业

用户为大型互联网企业,各业务线具有各自独立的业务中台,企业存在统一的数据中台,希望可以快速部署独立资源支持不同的业务负载,且未来不会产生数据孤岛。

建议:使用AnalyticDB PostgreSQL版Serverless版本,计算节点规格为4C16G以上,计算节点数量为2个以上,可部署多个实例。

优势:Serverless版本快速的资源部署和弹性的特性规避了对业务的资源部署进行繁重的前期规划,可动态适配业务负载。多个实例间可实现数据共享,无需担心业务中台的发展和数据体系建设会造成数据孤岛;独立的实例可完全保证资源隔离;每个业务的使用情况也可以直接反映在账单上。

案例八:构建数据开发平台

用户需要构建一个数据开发平台,期望减少开发过程中对线上业务的影响同时增加开发效率。

建议:使用AnalyticDB PostgreSQL版Serverless版本,计算节点规格为4C16G以上,计算节点数量为2个以上,可部署多个实例。

优势:生产库使用AnalyticDB PostgreSQL版Serverless版本,在需要进行数据开发时,通过数据共享和测试实例实现生产数据的实时同步可用,同时避免了开发时对生产环境的影响,也可用高时效性的数据进行数据开发。