hadoop中mapreducez如何自定义分区

2023-06-02 22:06:15 509人浏览薄情痞子

摘要

这篇文章主要为大家展示了“hadoop中mapReducez如何自定义分区”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“hadoop中mapreducez如何自定义分区”这篇文章吧。packag

这篇文章主要为大家展示了“hadoop中mapReducez如何自定义分区”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“hadoop中mapreducez如何自定义分区”这篇文章吧。

package hello_hadoop;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.DoubleWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Job;import org.apache.hadoop.mapreduce.Mapper;import org.apache.hadoop.mapreduce.Partitioner;import org.apache.hadoop.mapreduce.Reducer;import org.apache.hadoop.mapreduce.lib.input.FileInputFORMat;import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;public class AutoParitionner {public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {if(args.length!=2) {System.err.println("Usage: hadoop jar xxx.jar <input path> <output path>");System.exit(1);}Configuration conf = new Configuration();Job job = Job.getInstance(conf, "avg of grades");job.setJarByClass(AutoParitionner.class);job.setMapperClass(PartitionInputClass.class);job.setReducerClass(PartitionOutputClass.class);job.setMapOutpuTKEyClass(Text.class);job.setMapOutputValueClass(DoubleWritable.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(DoubleWritable.class);//声明自定义分区的类，下面有类的声明job.setPartitionerClass(MyPartitioner.class);job.setNumReduceTasks(2);FileInputFormat.addInputPath(job, new Path(args[0]));FileOutputFormat.setOutputPath(job, new Path(args[1]));System.exit(job.waitForCompletion(true)?0:1);}}class PartitionInputClass extends Mapper<LongWritable, Text, Text, DoubleWritable>{@Overrideprotected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, DoubleWritable>.Context context)throws IOException, InterruptedException {String line = value.toString();if(line.length()>0){String[] array = line.split("\t");if(array.length==2){String name=array[0];int grade = Integer.parseInt(array[1]);context.write(new Text(name), new DoubleWritable(grade));}}}}class PartitionOutputClass extends Reducer<Text, DoubleWritable, Text, DoubleWritable>{@Overrideprotected void reduce(Text text, Iterable<DoubleWritable> iterable,Reducer<Text, DoubleWritable, Text, DoubleWritable>.Context context) throws IOException, InterruptedException {int sum = 0;int cnt= 0 ;for(DoubleWritable iw : iterable) {sum+=iw.get();cnt++;}context.write(text, new DoubleWritable(sum/cnt));}}//自定义分区的类//Partitioner<Text  , DoubleWritable > Text,DoubleWirtable分别为map结果的key,valueclass MyPartitioner extends Partitioner<Text  , DoubleWritable >{@Overridepublic int getPartition(Text text, DoubleWritable value, int numofreuceTask) {String name = text.toString();if(name.equals("wd")||name.equals("wzf")||name.equals("xzh")||name.equals("zz")) {return 0;}elsereturn 1;}}

以上是“hadoop中mapreducez如何自定义分区”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注编程网精选频道！

--结束END--

本文标题: hadoop中mapreducez如何自定义分区

本文链接: https://lsjlt.com/news/231383.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

hadoop中mapreducez如何自定义分区

这篇文章主要为大家展示了“hadoop中mapreducez如何自定义分区”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“hadoop中mapreducez如何自定义分区”这篇文章吧。packag...

99+

2023-06-02
hadoop如何自定义分区

今天小编给大家分享一下hadoop如何自定义分区的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。分区概念分区这个词对很多同学来...

99+

2023-06-29
hadoop全面解读自定义分区

分区概念分区这个词对很多同学来说并不陌生，比如Java很多中间件中，像kafka的分区，mysql的分区表等，分区存在的意义在于将数据按照业务规则进行合理的划分，方便后续对各个分区...

99+

2024-04-02
hadoop如何自定义格式化输出

这篇文章给大家分享的是有关hadoop如何自定义格式化输出的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。import java.io.IOException;import java.net.U...

99+

2023-06-02
hadoop如何自定义GroupComparator实现求最大值

小编给大家分享一下hadoop如何自定义GroupComparator实现求最大值，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！import java....

99+

2023-06-02
Hadoop中怎么自定义输出排序

本篇文章为大家展示了Hadoop中怎么自定义输出排序，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。package com.hgs;import java.io.DataInput...

99+

2023-06-02
「 Hadoop」mapreduce对温度数据进行自定义排序、分组、分区等【转载】

原帖地址：http://www.ptbird.cn/mapreduce-tempreture.html 「 Hadoop」mapreduce对温度数据进行自定义排序、分组、分区等一、需求说明 1、数据文件说明 hdfs...

99+

2017-04-10

「 Hadoop」mapreduce对温度数据进行自定义排序分组分区等【转载】
怎么自定义JDBCRDD的分区

这篇文章主要讲解了“怎么自定义JDBCRDD的分区”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“怎么自定义JDBCRDD的分区”吧！1,JDBCRDD使用val data = new Jdb...

99+

2023-06-19
如何用 Golang 创建自定义时区？

要在 golang 中创建自定义时区，可以使用 time.fixedzone 函数或 time.newfixedzone 函数。time.fixedzone 函数用于修改时区偏移，而 t...

99+

2024-05-22

golang 时区标准库
JavaScript如何自定义分页样式

小编给大家分享一下JavaScript如何自定义分页样式，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们一起去了解一下吧！html部分<div...

99+

2024-04-02
Angular2如何自定义分页组件

这篇文章主要介绍了Angular2如何自定义分页组件，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。在项目中，前端传给后台的参数有：pageS...

99+

2024-04-02
Android如何自定义评分控件

今天小编给大家分享一下Android如何自定义评分控件的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。自定义参数为了方便扩展，...

99+

2023-06-30
Keras中如何定义一个自定义的层

要定义一个自定义的层，需要继承keras.layers.Layer类，并重写__init__和call方法。下面是一个简单的示例： ...

99+

2024-03-14

Keras
SpringBoot中如何自定义参数绑定

这篇文章给大家介绍SpringBoot中如何自定义参数绑定，内容非常详细，感兴趣的小伙伴们可以参考借鉴，希望对大家能有所帮助。自定义参数转换器自定义参数转换器实现Converter接口，如下：public class D...

99+

2023-06-19
js+css如何自定义分页效果

这篇文章给大家分享的是有关js+css如何自定义分页效果的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。网上看了好多分页插件都不太满意，所以根据网上的一些东西自己做了一个，可以搭配...

99+

2024-04-02
angularjs+bootstrap如何实现自定义分页

这篇文章主要介绍angularjs+bootstrap如何实现自定义分页，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！目前在做一个java web页面，没有使用到框架的分页，所以需要...

99+

2024-04-02
win10自定义分辨率如何设置

这篇文章主要讲解了“win10自定义分辨率如何设置”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“win10自定义分辨率如何设置”吧！win10自定义分辨率设置方法：在右下角的搜索中输入控制面...

99+

2023-07-01
AntDesignVuetable组件如何自定义分页器

目录Ant Design Vue table组件自定义分页器使用Ant Design Vue的Table组件，解决点击任意内容详情，点击返回分页器页数默认回到第一页问题描述解决方法总...

99+

2023-05-16

Ant Design Vue Ant Design Vue table组件 table组件自定义分页器
sqlserver中如何自定义函数

这期内容当中小编将会给大家带来有关sqlserver中如何自定义函数，文章内容丰富且以专业的角度为大家分析和叙述，阅读完这篇文章希望大家可以有所收获。“自定义函数”是我们平常的说法，而“用户定义的函数”是 ...

99+

2024-04-02
如何在zabbix中自定义key

这篇文章主要介绍了如何在zabbix中自定义key，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。如何在zabbix中自定义key，并使用...

99+

2024-04-02