这篇文章主要介绍“Apache Beam2.23.0更新了哪些内容”,在日常操作中,相信很多人在Apache Beam2.23.0更新了哪些内容问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Apache Be
这篇文章主要介绍“Apache Beam2.23.0更新了哪些内容”,在日常操作中,相信很多人在Apache Beam2.23.0更新了哪些内容问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Apache Beam2.23.0更新了哪些内容”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
Apache Beam 2.23.0
现已发布。Apache Beam
是 Google
在 2016 年 2 月份贡献给 Apache
基金会的项目,主要目标是统一批处理和流处理的编程范式,为无限、乱序、WEB-scale
的数据集处理提供简单灵活,功能丰富以及表达能力十分强大的 SDK
。Apache Beam
项目重点在于数据处理的编程范式和接口定义,并不涉及具体执行引擎的实现,Apache Beam
希望基于 Beam
开发的数据处理程序可以执行在任意的分布式计算引擎上。
Twister2 Runner
(BEAM-7304)。
python 3.8
支持(BEAM-8494)。
添加了对 Snowflake reading
的支持(Java)(BEAM-9722)。
增加了对写入 Splunk
的支持(Java)(BEAM-8596)。
添加了对 assume role
的支持(Java)(BEAM-10335)。
已添加一个新的可从 BigQuery
读取的 transfORM:apache_beam.io.GCp.bigquery.ReadFromBigQuery
。此 transform
是实验性的。它通过将数据导出到 Avro
文件并读取这些文件来从 BigQuery
读取数据。它还支持通过导出到 JSON
文件来读取数据。与时间和日期相关的字段在行为上有很小的差异。
为 SnowflakeIO.write
添加 dispositions
(BEAM-10343)
更新 Snowflake JDB
C 依赖关系,并将 application=beam
添加到 connection URL
(BEAM-10383)。
在反序列化 jsON(Java)时,RowJson.RowJsonDeserializer
、JsonToRow
和PubsubJsonTableProvider
现在默认接受“implicit nulls
”。以前的 null 只能用 explicit null 值表示,例如 {"foo": "bar", "baz": null}
,而像{"foo": "bar"}
这样的 implicit null
值则会引发异常。现在,两个 JSON 字符串默认都会产生相同的结果。可以使用用RowJson.RowJsonDeserializer#withNullBehavior
来覆盖此行为。
修复 Python 中GroupIntoBatches
实验转换中的一个错误,该错误实际上是按键对批次进行分组的。这将更改此转换的输出类型(BEAM-6696)。
删除 Gearpump runner。(BEAM-9999)
删除 Apex 运行程序。(BEAM-9999)
到此,关于“Apache Beam2.23.0更新了哪些内容”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!
--结束END--
本文标题: Apache Beam2.23.0更新了哪些内容
本文链接: https://lsjlt.com/news/309923.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
2024-05-24
2024-05-24
2024-05-24
2024-05-24
2024-05-24
2024-05-24
2024-05-24
2024-05-24
2024-05-24
2024-05-24
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0