2025年

更新时间:

本文介绍2025云原生数据仓库AnalyticDB PostgreSQL存储弹性模式的内核功能发布记录。

202512

V7.2.1.9

类别

功能

功能描述

相关文档

缺陷修复

启动

修复特殊场景下宕机后启动失败的问题。

扩缩容

修复扩容时实时物化视图失败的问题。

Beam

修复若干稳定性问题。

pgsearch

修复超长query引发的OOM。

CDC

修复数据同步稳定性相关的若干问题。

优化

重启

优化重启集群的时间,解决在高连接数情况下集群重启速度慢的问题。

202511

V7.2.1.8

类别

功能

功能描述

相关文档

缺陷修复

AOCS

修复AOCSALTER COLUMN TYPE稳定性问题。

Beam

修复特殊场景下重复写入delta索引问题。

优化器

修复了在字典处理时若干稳定性的问题。

分区表

修复分区表字典导入内存占用过高的问题。

CDC

修复数据同步稳定性相关的若干问题。

优化

安全

安全加固。

202509

V7.2.1.7

类别

功能

功能描述

相关文档

缺陷修复

优化器

  • 修复CTE中的optimizer_transform_or_join_to_join_under_unionall导致的“unionall”列裁剪问题。

  • 修复了ORCA优化器在处理right semi anti join not in操作时,当关联列均为非空时数据重复且右表发生广播的问题。

  • 修复text <> all(text[])参数为“{NULL}”时的报错问题。

  • 修复了众多场景下字典相关问题。

升降级

修复小版本升级后部分只读状态未解除的问题。

存储引擎

  • 修复Beam引擎预排序并写入索引的过程中,对谓词索引处理不当的问题。

  • 修复timestamptztimestamp过滤条件无法应用Zonemap能力的问题。

  • 修复sortkey内存泄露等问题。

优化

镜像

AnalyticDB PostgreSQL镜像瘦身,占用磁盘空间下降。

GraphRAG

实现图检索GraphRAG插件众多优化与默认安装。

auto-pipeload

auto-pipeload插件默认安装。

202508

V7.2.1.6

类别

功能

功能描述

相关文档

缺陷修复

CDC

修复稳定性问题。

ANALYZE

修复AO表统计信息采样行数的计算方式可能会遗漏新数据的问题。

优化

实时物化视图

  • 支持强制创建为Beam存储。

  • 支持修改存储方式。

执行器

实现对Beam表的支持优化。

长记忆

支持长记忆检索时增加自定义过滤条件。

V7.2.1.5

类别

功能

功能描述

相关文档

新增

使用Auto-PipeLoad自动化导入非结构化数据

云原生数据仓库AnalyticDB PostgreSQL推出Auto-PipeLoad插件,旨在无缝连接对象存储(OSS)与数据库,实现非结构化数据的自动化ETL。该插件专为现代AI应用设计,原生支持对非结构化数据(如.pdf.docx.txt)的文本提取、智能分块和向量化,高效地将其转化为可供分析的结构化或向量化数据,极大简化了从原始数据到AI应用的链路。

使用Auto-PipeLoad自动化导入非结构化数据

V7.0.1.17

类别

功能

功能描述

相关文档

缺陷修复

稳定性

修复cursor查询可能出现的“could not find Shared Local Snapshot!”报错

存储

修复Beam排序过程中更新可能导致的主键重复的问题。

执行器

修复了字典编码在初始化执行字典时由于字典维护长度超出USSR最大值而导致的coredump问题。

CDC

解决`adbpg_replication_lsn_map`表在高并发场景下更新过于频繁导致的问题,包括表膨胀严重和影响同步性能。

优化器

用于修复nestedloop在部分场景下不保序导致的结果错误问题。

202507

V7.3.2.0

类别

功能

功能描述

相关文档

新增

构建长记忆应用

大模型虽能记忆一定长度的对话,但受注意力机制限制可能会遗漏某些信息,导致生成内容质量下降。即使扩大大模型的上下文窗口长度,仍可能会遗漏关键信息,并且增加成本,降低模型效率。长记忆技术针对对话过程中的关键信息(主要为用户个性化信息,如用户特征、偏好等),进行提取并持久化存储,使AI应用在后续交互中引用相关记忆信息,从而提升对话质量与交互体验。

基于AnalyticDB for PostgreSQL构建长记忆应用

新增

GraphRAG服务

传统RAG(Retrieval Augmented Generation)因为上下文理解能力不足、文档相似性偏差等缺陷,在处理复杂关系、多跳推理和知识关联时存在局限性。GraphRAG在传统RAG检索路径的基础上,提供了基于知识图谱的索引、检索、生成能力,从而提升了对复杂数据的理解与生成的质量。

使用GraphRAG服务

V7.2.1.4

类别

功能

功能描述

相关文档

新增

构建长记忆应用

大模型虽能记忆一定长度的对话,但受注意力机制限制可能会遗漏某些信息,导致生成内容质量下降。即使扩大大模型的上下文窗口长度,仍可能会遗漏关键信息,并且增加成本,降低模型效率。长记忆技术针对对话过程中的关键信息(主要为用户个性化信息,如用户特征、偏好等),进行提取并持久化存储,使AI应用在后续交互中引用相关记忆信息,从而提升对话质量与交互体验。

基于AnalyticDB for PostgreSQL构建长记忆应用

202505

V7.3.0.0

类别

功能

功能描述

相关文档

新增

访问Iceberg数据

AnalyticDB for PostgreSQL支持通过OSS外表访问Iceberg数据。您可直接访问Iceberg数据,或将本地表和Iceberg表进行关联分析等。此外支持与Hive、Spark、StarRocks以及云上EMR等兼容Iceberg的系统实现数据共享。

使用OSS Foreign Table访问Iceberg数据

202504

类别

功能

功能描述

相关文档

新增

自动迁移Amazon Redshift数据

阿里云提供了自动化迁移工具,支持DDL转换,可以帮助您将Amazon Redshift数据自动迁移至AnalyticDB for PostgreSQL

自动迁移Amazon Redshift数据至AnalyticDB for PostgreSQL

V7.2.1.0

类别

功能

功能描述

相关文档

新增

图分析引擎

云原生数据仓库 AnalyticDB PostgreSQL 版以插件形式集成了图分析引擎功能,并支持使用Cypher查询语言对图数据进行高效查询与操作。图分析引擎在处理高度互联的数据集时表现出色,广泛应用于社交网络、欺诈检测、推荐引擎、知识图谱以及网络/IT 运维等场景。

图分析引擎

202503

V7.2.2.1

类别

功能

功能描述

相关文档

新增

fixnumeric插件

云原生数据仓库 AnalyticDB PostgreSQL 版引入了FIXNUMERIC类型,通过固定精度与底层整数存储结合,在计算密集场景中性能显著优于原生NUMERICDECIMAL类型,聚合和四则运算等操作性能提升数倍,同时在指定范围内保持无损精度。

fixnumeric

V7.2.1.0

类别

功能

功能描述

相关文档

新增

pgml插件

  • pgml插件支持对文本Embedding模型进行微调。

  • pgml插件支持图像Embedding能力。

In-Database AI/ML

OSS外表

  • 支持ORC格式并行读取功能。

  • 支持对外表Auto Analyze(自动收集统计信息)。该功能从OSS ORC外表中收集更准确的统计信息,优化查询性能。

Flink CDC

Flink CDC支持订阅实时物化视图和DTS同步强一致功能。

Flink CDC实时订阅全量和增量数据

分层存储

分层存储支持增减列。

优化

OSS外表

OSS FDWORC文件之间的链路进行了优化,增强了对bytea类型数据的写入支持。

使用OSS外表高速导入OSS数据

存储引擎

Beam默认存储设置为auto

自研高性能存储引擎Beam

ANALYZE

优化了ANALYZE在合并表统计信息时的内存占用。

手动收集统计信息

缺陷修复

升级

修复若干小版本升级稳定性问题。

ANALYZE

修复对外表分区表或冷热分层表主表进行ANALYZE时,可能会报错的问题。

手动收集统计信息

执行引擎

  • 修复了在包含LATERAL JOIN的查询中,Gather Motion操作未正确传递排序键导致结果未按预期排序的问题。

  • 修复了在同时启用ORCALASER时,DATE类型的LEASTGREATEST函数可能出现的计算结果错误问题。

存储引擎

  • 修复了带主键的Beam表出现重复数据的问题。

  • 修复了ALTER TABLE SET (querycache_enabled = ON/OFF)Beam表中无法生效的问题。

自研高性能存储引擎Beam

优化器

  • 修复了在开启ORCA优化器时,中文别名字符串可能错误显示为Unknown的问题。

  • 修复了ORCA优化器在处理包含联合统计信息的表时,因特定格式的CTEROLLUP操作可能导致的程序崩溃(coredump)问题,提升了复杂查询场景下的稳定性和兼容性。

  • 修复若干ORCA优化器稳定性问题。

  • 修复了部分场景中因无法找到排序依据(PathKey)而导致的could not find pathkey item to sort报错问题。

pg_search

修复pgsearch插件在处理TIMESTAMPTZ类型字段时,可能导致搜索结果错误的问题。

BM25高性能全文检索

V7.1.1.4

类别

功能

功能描述

相关文档

新增

Flink CDC实时数据订阅

AnalyticDB for PostgreSQL提供自研的CDC连接器,基于PostgreSQL的逻辑复制功能实现订阅全量数据和增量数据,可与Flink无缝集成。

Flink CDC实时订阅全量和增量数据

优化

存储引擎

内核版本为7.1.1.4及以上的AnalyticDB for PostgreSQL7.0版实例默认存储引擎为Beam。存量实例升级版本不改变默认存储格式。

自研高性能存储引擎Beam

202502

V7.1.1.3

类别

功能

功能描述

相关文档

新增

存储引擎

  • Beam行锁能力支持表级别选项。

  • Beam存储引擎支持VARCHAR等类型的排序键过滤。

自研高性能存储引擎Beam

优化

实时物化视图

支持Beam表构建实时物化视图。

实时物化视图

缺陷修复

向量引擎

  • 修复了多版本码本加载时导致内存溢出的问题。

  • 修复了多个向量索引并行构建时Parallel Worker冲突的问题。

向量检索引擎使用指南

存储引擎

修复了Beam存储引擎中ALTER TYPE操作与USING辅助表结合使用时的错误。该问题发生在对相同类型进行转换时。

自研高性能存储引擎Beam

202501

V7.2.1.0

类别

功能

功能描述

相关文档

新增

高性能全文检索

自定义分词词典

您可以根据所在行业或特定应用场景的需求,在词典中添加专有名词、行业术语甚至最新流行词语等,从而实现更符合实际需求的文本分割,以提高分词精度和检索效率。

配置自定义分词词典

停用词词典

配置停用词可以提高检索效率、增强检索准确性,并减少存储空间等。您可以根据所在行业或特定应用场景的需求,定制属于您的专用停用词词典。

配置停用词词典

BM25索引新增用于创建索引的函数pgsearch.field()pgsearch.tokenizer()

  • pgsearch.field():用于定义字段的索引方式。

  • pgsearch.tokenizer():用于定义分词器的种类、使用词典和分词器等。

BM25高性能全文检索

高性能全文检索内置的jieba分词器新增hmmsearch参数。

  • hmm:设置为true时,分词器将使用HMM(Hidden Markov Model)处理未登录词。HMM辅助分词通过上下文信息判断词边界,从而提升分词的准确性。

  • search:设置为true时,文本将按照最细粒度分词。这将对长词再次切分,增加短语的匹配度。

BM25高性能全文检索

V7.1.1.2

类别

功能

功能描述

相关文档

优化

存储引擎

  • 优化了Beam表级别控制行锁功能。

  • 优化了Beam索引执行Optimize的写入。

自研高性能存储引擎Beam

实时物化视图

优化对可变函数(mutable function)的处理,并支持使用now()current_date()等时间相关的函数。

实时物化视图

缺陷修复

存储引擎

  • 修复了在修改Beam表结构时(表结构中使用了USING辅助表)报错问题。

  • 修复BeamZoneMap现已支持Varchar等数据类型。

自研高性能存储引擎Beam

检索

修复了pgsearch插件中的Timestampz检索结果错误。

BM25高性能全文检索

计划器

修复Planner对于执行计划(Execution Plan)中包含InitPlan节点,且该节点上方有SubqueryScan时,会导致TargetList(目标列)为空,从而导致返回了正确的行数,但每行数据的实际值都是NULL。

稳定性

修复部分实例升级后,查询结果中的中文表头被替换为UNKNOWN的问题。

V7.0.6.11

类别

功能

功能描述

相关文档

优化

存储引擎

优化了Beam表级别控制行锁功能。

自研高性能存储引擎Beam

实时物化视图

优化对可变函数(mutable function)的处理,并支持使用now()current_date()等时间相关的函数。

实时物化视图

缺陷修复

存储引擎

修复BeamZoneMap现已支持Varchar等数据类型。

自研高性能存储引擎Beam

优化器

修复ORCA在处理多个SQL字句(COUNT DISTINCT等)时可能会输出表的所有系统表列,针对beam表与aocs表会输出xmin等系统列报错的问题。

计划器

修复Planner对于执行计划(Execution Plan)中包含InitPlan节点,且该节点上方有SubqueryScan时,会导致TargetList(目标列)为空,从而导致返回了正确的行数,但每行数据的实际值都是NULL。