ApacheSeaTunnel2.3.13震撼来袭不容错过的十大亮点功能

作者:互联网

2026-03-20

AI快讯

Apache SeaTunnel迎来重大更新,2.3.13版本带来多项突破性功能升级,为数据集成领域注入全新动能。

经过50多位社区开发者的共同努力,本次版本包含100多个PR的改进,在数据处理、引擎支持、连接器生态等方面实现全方位提升。特别值得关注的是新增的Checkpoint API、Flink 1.20.1支持、大文件并行处理等核心功能,大幅增强了数据同步的稳定性和效率。

以下是本次版本最值得关注的更新内容:

  1. 完整版Release Note:https://github.com/apache/seatunnel/releases/tag/2.3.13

数据可靠性方面,2.3.13版本引入Checkpoint API(#10065),使任务状态管理更加灵活。Zeta引擎支持配置Checkpoint最小间隔(#9804),有效避免频繁检查点带来的系统压力。同时新增了Sink提交指标计算功能(#10233)和Pending队列查看API(#10078),大大提升了任务监控能力。

引擎支持方面,本次升级全面适配Flink 1.20.1(#9576)。CDC Source新增Schema Evolution支持(#9867),能够在源表结构变化时自动调整同步任务。NO_CDC Source也实现了checkpoint功能(#10094),显著提升了任务恢复能力。

文件处理性能获得突破性提升:HDFS File Connector支持大文件并行切分(#10332),LocalFile Connector实现CSV/Text/JSON大文件并行读取(#10142),Parquet文件支持Logical Split(#10239)。HDFS File还新增多表读取能力(#9816),这些改进使TB级文件处理效率显著提升。

文件同步模式实现重要升级,FTP、SFTP和LocalFile Source(#10437)以及HdfsFile Source(#10268)都新增了sync_mode=update支持,使文件同步任务能够处理更新语义,更好地适应增量数据场景。

连接器生态持续丰富:新增DuckDB Source/Sink(#10285)支持本地数据分析;Apache HugeGraph Sink(#10002)、AWS DSQL Sink(#9739)、Lance Dataset Sink(#9894)等Lakehouse连接器增强;IoTDB 2.x Source/Sink(#9872)为时序数据库提供支持。已有连接器如PostgreSQL(#10048)、Hive(#9743)、MongoDB(#9958/#9883)等也获得重要功能升级。

类别Connector类型功能亮点PR号
分析型数据库DuckDBSource/Sink支持从 DuckDB 读取数据和写入数据,适合本地分析和数据探索#10285
图数据库Apache HugeGraphSink支持将数据写入 HugeGraph#10002
SQL LakehouseAWS DSQLSink支持将数据写入 AWS DSQL#9739
文件/数据集Lance DatasetSink支持写入 Lance Dataset#9894
时序数据库IoTDB 2.xSource/Sink新增 IoTDB 2.x 源和写入支持#9872
关系型数据库PostgreSQLSource支持读取 TIMESTAMP_TZ 类型#10048
数据仓库HiveSink

相关标签:

Apache SeaTunnel 2.3.13 重磅发布!最值得关注的 Top 10 功能更新