本文介绍2025年6月4日发布的实时计算Flink版的重大功能变更和主要缺陷修复。
概述
2025年6月4日正式对外发布实时计算Flink版新版本,包含平台升级、引擎更新、连接器更新、性能优化以及缺陷修复。
平台侧
本次平台功能更新聚焦于提升使用体验和运维效率。以下是本次更新亮点:
支持对接Git:支持对接GitHub、GitLab和Gitee远程仓库,优化代码版本管理流程,提升团队协作效率。
平台信息支持对接到SLS:支持将作业启动日志、运行事件及资源用量等数据持久化存储至SLS,便于进行历史数据查询与审计。
日志页面体验优化:优化日志输出配置,支持可视化操作配置,降低误操作风险。
云监控告警体验优化:告警通知内容中新增作业名称展示,便于快速定位异常作业。
引擎侧
引擎侧正式发布VVR 11.1版本。该版本基于Apache Flink 1.20.1内核深度定制,在继承社区能力的基础上进行了优化和增强。主要变更涵盖以下维度:
升级说明
请参见作业引擎版本升级和VVR版本号变更策略。
不兼容改动说明
Java SDK将默认采用JDK 11作为标准运行时环境,并正式终止对JDK 8版本的支持。Jar作业需使用JDK 11重新编译打包,SQL作业不受影响。
Hologres连接器优化系统架构,对部分历史参数进行了调整与移除。
全新能力
大模型实时向量构建与推理。
向量构建:深度集成百炼大模型,实现流式数据实时向量化,支撑推荐系统、智能搜索的实时特征计算。
文本推理:基于预训练模型实现文本摘要、机器翻译等动态内容生成功能,支持业务场景的智能化文本处理。
Milvus向量数据库写入链路支持。
Milvus Sink Connector:支持将Flink处理后的向量数据实时写入Milvus向量数据库,满足AI场景下高频检索与大规模向量存储的性能要求。
能力增强
物化表支持定时回刷:支持Paimon物化表的定时回刷,能够按设定周期自动刷新整个链路的数据。
StarRocks维表实时Join:新增Flink与StarRocks维表的实时关联能力。
SLS CDC与Paimon模式演化:YAML CDC新增对SLS数据源的支持,并实现SLS到Paimon的Schema自动演化,简化数据湖仓场景中元数据管理复杂度。
数据摄入升级至Flink CDC 3.4:包含该版本的核心能力,增强数据采集功能体系。
数据摄入支持SLS Source:实现SLS到Paimon的数据流转及Schema动态演进功能。
数据摄入支持MaxCompute Sink:数据摄入功能新增MaxCompute Sink,支持TB级以上大规模数据写入。
FlinkSQL 集合操作优化:UNION ALL查询调试结果可以保留字段别名。
性能提升
PostgreSQL CDC全量数据读取优化:优化PostgreSQL CDC数据切片机制,采用异步切片与数据读取并行处理模式,显著提升全量数据读取性能。
云数据库Tair(Redis开源版)缓存策略优化:支持按天或固定时间段配置缓存更新黑名单,避免高峰期资源竞争,提升缓存服务的稳定性。
体验优化
Source/Sink数据量透出:支持监控Source和Sink任务的输入输出数据量,以帮助验证数据的完整性并进行作业调优。
安全提升
云数据库Tair(Redis开源版) 支持TLS/SSL连接:增强连接器安全性,支持TLS/SSL加密连接模式,满足金融、政务等高安全等级场景的接入要求。
Parquet安全漏洞修复:升级Apache Parquet至1.15.1,修复Avro格式反序列化远程代码执行漏洞,消除数据处理环节的潜在安全风险。
MaxCompute身份标识上报:上报applicationName至MaxCompute服务端,以便精准追踪Flink作业对第三方服务的资源占用,从而提升跨系统资源访问的可审计性。
功能介绍
特性 | 详情 | 相关文档 |
支持对接Git | 实时计算开发控制台支持对接GitHub、GitLab和Gitee远程仓库,支持拉取推送SQL代码和作业配置等基础操作,并内置冲突解决机制。 | |
支持消息投递到SLS | 支持将目标项目空间下的作业启动日志、运行事件及资源用量等数据投递到SLS。 | |
日志配置页面体验优化 | 在作业运维中,作业日志可以通过界面配置,将日志信息输出至其他数据存储(例如SLS、OSS或Kafka)。 | |
数据摄入支持MaxCompute Sink | 支持MaxCompute连接器用于数据摄入YAML作业的开发,作为目标端进行数据写入。 | |
数据摄入功能优化 |
| |
Elasticsearch连接器优化 | 允许字段为NULL时不覆盖ES已有数据,保留下游存储的字段值,增强数据写入的鲁棒性。 | |
Hologres连接器优化 | 为优化系统架构、提升维护效率,对部分历史参数进行了调整与移除。不同版本在功能实现和使用方式上存在差异,请根据实际使用的VVR版本,参考对应配置文档进行适配,确保作业兼容性与运行稳定。 | |
MongoDB连接器优化 | 新增 | |
Mysql连接器优化 | 修改property-version参数默认值为1。 | |
Kafka连接器优化 |
| |
RocketMQ连接器优化 | 新增 | |
云数据库Tair(Redis开源版)连接器优化 |
| |
StarRocks连接器优化 |
| |
Paimon连接器优化 |
| |
AnalyticDB PostgreSQL版(ADB PG)连接器优化 |
| |
新增Milvus连接器 | Milvus是一个高度可扩展的向量数据库,专为处理大规模非结构化数据(如图像、文本和音频)设计。支持高效的相似性搜索,适用于推荐系统、图像检索、语义搜索等场景。 | |
物化表优化 |
| |
FlinkSQL支持Hive Kerberos认证 | 支持通过SQL安全访问Hive数据,集成Kerberos认证协议,实现客户端与服务端的双向身份验证及加密传输,有效防止数据窃取与越权访问。 | |
PyFlink Docker镜像升级 | 升级PyFlink的基础Docker镜像,提高了对不同Python版本和glibc版本的兼容性。 | 暂无。 |
窗口函数优化 | 支持Flink 1.20版本全新的SESSION WINDOW行为,相较于VVR 8.x版本SESSION WINDOW(建议弃用)与聚合语句耦合的强制要求,该版本提供了更为灵活的使用场景。 | |
SelectDB正式内置 | 从公测版本正式迭代为稳定高效的内置版本。 | |
Table API作业优化 | Table API作业支持通过SQL文本方式调用内置函数。 | |
大模型实时向量构建与推理 |
|
主要缺陷修复
连接器缺陷修复
修复SLS新架构转义字符。
修复RocketMQ延迟Topic消息丢失问题。
修复云数据库Tair(Redis开源版)双库写入冲突问题。
修复Hologres维表JOIN空指针异常。
修复Paimon主键表写入。
修复Lindorm维表JOIN只能匹配一行的问题。
SQL及转换缺陷修复
修复YAML转换操作符,解决Calcite解析器未识别字符串比较操作符导致的编译错误。
修复CTAS作业Schema合并冲突。
修复Hive Catalog访问非Hive表的权限限制问题。
稳定性及性能优化
修复Paimon Sink关闭阶段耗时过长问题。
修复表过滤异常,支持
debezium.table.exclude.list
参数绕行。修复Minibatch导致的数据不一致问题。
修复PyFlink Table API对VVR内置函数的调用兼容性问题。