math.max(x.length, y.length)." /> math.max(x.length, y.length)." />

扫码关注官方微信

扫码下载APP

返回顶部

首页 > 资讯 > 数据库 >Spark高级算子aggregate所遇到的坑

947

0

分享到

Spark高级算子aggregate所遇到的坑

Spark高级算子aggregate所遇到的坑 2018-06-26 09:06:43 947人浏览猪猪侠

摘要

val rdd3 = sc.parallelize(List("12","23","345","4567"),2) rdd3.aggregate("")((x,y) => math.max(x.length, y.length).

Spark高级算子aggregate所遇到的坑

val rdd3 = sc.parallelize(List("12","23","345","4567"),2)

rdd3.aggregate("")((x,y) => math.max(x.length, y.length).toString, (x,y) => x + y)

两个分区先计算出字符串的最大长度，然后合成字符串

结果可能是：”24”，也可能是：”42”，体现了并行化特点。

val rdd4 = sc.parallelize(List("12","23","345",""),2)

rdd4.aggregate("")((x,y) => math.min(x.length, y.length).toString, (x,y) => x + y)

结果是：”10”，也可能是”01”，

原因：注意有个初始值””，其长度0，然后0.toString变成字符串。值"0".toString的长度为0,"0".toString.length的长度为1 。分区可能为（“12”，“23”）和（“345”，“”）；初始值为""，然后初始值和“12”，“34”比较，或者是""和“345”比较，然后和“”比较。

math.min("".length, "12".length ) 的结果是：0 , math.min("0".length, "23".length ) 的结果是1

math.min("".length, "345".length) 的结果是：0 , math.min("0".length, "".length) 的结果是：0

val rdd5 = sc.parallelize(List("12","23","","345"),2)

rdd5.aggregate("")((x,y) => math.min(x.length, y.length).toString, (x,y) => x + y)

结果是：”11”，原因如下：

math.min("".length, "12".length ) 的结果是：0 , math.min("0".length, "23".length ) 的结果是：1

math.min("".length, "".length) 的结果是：0 , math.min("0".length, "345".length) 的结果是：1

注意：值"0".toString的长度为0,"0".toString.length的长度为1

您可能感兴趣的文档:

--结束END--

本文标题: Spark高级算子aggregate所遇到的坑

本文链接: https://lsjlt.com/news/5979.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

Spark高级算子aggregate所遇到的坑

val rdd3 = sc.parallelize(List("12","23","345","4567"),2) rdd3.aggregate("")((x,y) => math.max(x.length, y.length)....

99+

2018-06-26

Spark高级算子aggregate所遇到的坑
我从jdk1.8升级到jdk11所遇到的坑都有这些

目录一、jdk11 移除了 Base64替代方案二、Maven 打包报错修改方案,更新maven打包插件三、Lombok 无法使用解决方案，升级lombok四、xmlelement ...

99+

2024-04-02
centos7 mysql5升级到mysql8 遇到GroupBy的坑

ERROR 1055 (42000): Expression #7 of SELECT list is not in GROUP BY clause and contains nonaggregated column "pos...

99+

2014-09-26

centos7 mysql5升级到mysql8 遇到GroupBy的坑
Android Studio升级到3.0后遇到的坑有哪些

这篇文章主要介绍Android Studio升级到3.0后遇到的坑有哪些，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！第一坑、必须升级gradle到4.0以上相信这个大坑，一般使用as的人都会解决了，所以就不多说第二...

99+

2023-05-30

android studio
Android 弹出软键盘所遇到的坑及解决方法

demo下载重要代码： //1、此layout作为最外层的layout； //2、设置需要调整的view: setAdjustView(View view); //3、如果...

99+

2022-06-06

方法软键盘 Android
mysql 8.0.18 压缩包安装及忘记密码重置所遇到的坑

http://www.cppcns.com/shujuku/mysql/283231.html 也可以参照这个8.0.18安装方法 1.下载zip安装包（解压到指定文件夹） 1)从...

99+

2024-04-02
SpringCloud项目中Feign组件添加请求头所遇到的坑及解决

目录前言分析解决原因找到了总结前言在spring cloud的项目中用到了feign组件，简单配置过后即可完成请求的调用。又因为有向请求添加Header头的需求，查阅了官方示例后...

99+

2023-05-18

SpringCloud中Feign组件 Feign组件添加请求头 Feign添加请求头
leetcode 中的 Python 编程算法指南：从基础到高级。

Leetcode 中的 Python 编程算法指南：从基础到高级在计算机科学领域，算法被认为是解决问题的最佳方法。Leetcode 是一个流行的编程挑战平台，旨在帮助开发人员提高算法能力。Python 是一种流行的编程语言，因其易于学习、...

99+

2023-07-23

编程算法 leetcode 文件
Java编程中的文件操作：从基础到高级算法

Java是一种非常流行的编程语言，它可以应用于各种领域，例如Web开发、游戏开发、移动应用程序开发等。在Java编程中，文件操作是非常基础和重要的一部分。本文将从基础的文件操作开始，逐渐深入到高级算法。文件的创建和读写 Java中，...

99+

2023-11-04

文件编程算法对象

软考高级职称资格查询

热门wiki

mysql删除数据恢复

mysql删表能回滚吗

mysql找回删除的表

mysql不小心删除了表

mysql不小心把表删了怎么恢复数据

mysql数据表删除后能恢复么

mysql误删表数据恢复

mysql误删表恢复

mysql删除表怎么恢复

近期文章

Python连接和操作PostgreSQL数据库的流程步骤

关于SQL建表语句使用详解

RedisTemplate的使用与注意事项小结

使用MySQL从JSON字符串提取数据的方法详解

MySQL免密登录的几种配置方式小结

Oracle更换监听端口的流程步骤

Linux的HBASE数据库集群部署方法

MySQL与HBase在数据湖架构中的互补与融合

HBase的Region Server资源分配与调度策略

MySQL的查询优化器与HBase的查询优化策略在大数据查询中的协同

推荐阅读

关于SQL建表语句使用详解

2024-10-23

HBase在大数据审计与合规性追踪中的应用

2024-10-22

MySQL与HBase在大数据金融分析中的性能与可扩展性对比

2024-10-22

HBase的Region Server之间的网络通信优化

2024-10-22

HBase在大数据监控与告警系统中的实时数据处理能力

2024-10-22

MySQL与HBase在大数据安全策略中的实现与对比

2024-10-22

HBase的分布式事务处理在复杂业务场景中的应用

2024-10-22

MySQL与HBase在混合存储架构中的整合策略

2024-10-22

HBase如何支持高效的二级索引查询

2024-10-22

MySQL与HBase在物联网数据收集与处理中的协作模式

2024-10-22

热门问答

1

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

1

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

1

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

1

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

1

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

1

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

1

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

1

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

1

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

1

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

编程网，编程工程师的家园，是目前国内优秀的开源技术社区之一，形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容，为IT开发者提供了一个发现、使用、并交流开源技术的平台。

官方手机版
微信公众号
商务合作

Powered by 编程网 | Copyright © 2018-2023, 版权所有. | 网站地图 | 苏ICP备17033115号