一元机场.cn官网下载

产品展示

Amazon Managed Service for Apache Flink 现已支持 Apach

Amazon托管的Apache Flink服务现已支持Apache Flink 118版

关键要点

Apache Flink 118版本的新增功能

Amazon托管的Apache Flink服务现已支持最新的Apache Flink 1181版本,增强了流处理能力和新功能。

在本文中,我们将探讨在Apache Flink 116、117和118版本中引入的一些新功能,及其在Amazon托管的Apache Flink服务中的应用。

一元机场.cn登录入口

新连接器

OpenSearch

现已提供针对OpenSearch的专用连接器,使Apache Flink应用能够直接将数据写入OpenSearch,无需依赖Elasticsearch的兼容模式。此连接器兼容Amazon OpenSearch服务和OpenSearch服务无服务器版本。

主要特性支持SQL和表API,适用于Java和Python。提供atleastonce保证,通过Flink进行写入同步。

Amazon DynamoDB

现在,Apache Flink的开发者可以利用专用连接器将数据写入Amazon DynamoDB。这个连接器基于Apache Flink的AsyncSink,旨在简化高效接收连接器的实现。

主要特性同样支持SQL和表API以及数据流API。通过指定关键字,可以实现客户端去重,每批写入仅发送每个关键字的最新记录。

MongoDB

我们还引入了针对MongoDB的连接器。本连接器同时支持源和接收,适用于SQL和表API和数据流API。

主要特性源可用作有界源或查找。支持批处理和流式处理模式,支持插入和附加模式。

新连接器版本控制

自Apache Flink 117版本起,许多连接器已从Apache Flink主分发中外部化,并采用独立版本控制。

示例依赖关系

以下是Apache Flink 118所需连接器的示例依赖关系:

xmlltdependencygt ltgroupIdgtorgapacheflinklt/groupIdgt ltartifactIdgtflinkconnectorkafkalt/artifactIdgt ltversiongt310118lt/versiongtlt/dependencygt

SQL的改善

在Apache Flink SQL中,用户可以为连接查询提供提示。特别是在流式应用中,查找连接用于增强流数据表,从外部系统查询的数据通常是数据库。

改进特性

查找缓存:允许在内存中缓存最常用的记录。异步查找:能够在不阻塞处理线程的情况下发出新请求。

使用示例

sqlSELECT / LOOKUP(table=Customers async=true outputmode=allowunordered) / Oorderid Ototal CaddressFROM Orders AS O JOIN Customers FOR SYSTEMTIME AS OF Oproctime AS C ON Ocustomerid = Ccustomerid

PyFlink的改进

Python 310支持

Apache Flink的最新版本已引入对Python 310的支持,之前的Python 36支持已完全移除。

功能接近性

在API层面,PyFlink正逐步接近Java的功能。

线程模式改进

线程模式允许Python用户自定义函数在JVM内运行,从而消除序列化/反序列化带来的开销,极大提高性能。

其他显著改进

以下是一些其他显著的功能和性能改进:

Amazon Managed Service for Apache Flink 现已支持 Apach无序检查点改进:在Flink 115中,已有增量检查点等支持,为性能优化提供帮助。数据偏斜处理:通过水印机制确保数据流的有序执行。Protobuf格式的直接支持:SQL和表API现在直接支持Protobuf格式。

结语

本文审视了Apache Flink中的若干新功能,及其在Amazon托管服务中的支持。通过支持Apache Flink 118,Managed Service为开发者提供了极好的体验和最新的功能。

如需更多关于Apache Flink的热门功能信息,可以访问:

Amazon托管的Apache Flink发布说明Apache Flink 118启动文章

关于作者

Lorenzo Nicora 是AWS的高级流处理解决方案架构师,拥有超过25年的云原生数据系统构建经验。Francisco Morillo 是AWS的流处理解决方案架构师,专注于设计实时分析架构。

Amazon EventBridge Pipes 增加日志支持关键要点AWS 今天宣布对 EventBridge Pipes 提供日志支持。EventBridge Pipes 是一种点对点集成解决方案,旨在连接事件生产者和消费方,同时可选择过滤、转换和增强步骤。这一功能不仅能减少开发者在构建事件驱动...