返回顶部
首页 > 资讯 > 精选 >hadoop中mapreducez如何自定义分区
  • 509
分享到

hadoop中mapreducez如何自定义分区

2023-06-02 22:06:15 509人浏览 薄情痞子
摘要

这篇文章主要为大家展示了“hadoop中mapReducez如何自定义分区”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“hadoop中mapreducez如何自定义分区”这篇文章吧。packag

这篇文章主要为大家展示了“hadoopmapReducez如何自定义分区”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“hadoop中mapreducez如何自定义分区”这篇文章吧。

package hello_hadoop;import java.io.IOException;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.DoubleWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Job;import org.apache.hadoop.mapreduce.Mapper;import org.apache.hadoop.mapreduce.Partitioner;import org.apache.hadoop.mapreduce.Reducer;import org.apache.hadoop.mapreduce.lib.input.FileInputFORMat;import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;public class AutoParitionner {public static void main(String[] args) throws IOException, ClassNotFoundException, InterruptedException {if(args.length!=2) {System.err.println("Usage: hadoop jar xxx.jar <input path> <output path>");System.exit(1);}Configuration conf = new Configuration();Job job = Job.getInstance(conf, "avg of grades");job.setJarByClass(AutoParitionner.class);job.setMapperClass(PartitionInputClass.class);job.setReducerClass(PartitionOutputClass.class);job.setMapOutpuTKEyClass(Text.class);job.setMapOutputValueClass(DoubleWritable.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(DoubleWritable.class);//声明自定义分区的类,下面有类的声明job.setPartitionerClass(MyPartitioner.class);job.setNumReduceTasks(2);FileInputFormat.addInputPath(job, new Path(args[0]));FileOutputFormat.setOutputPath(job, new Path(args[1]));System.exit(job.waitForCompletion(true)?0:1);}}class PartitionInputClass extends Mapper<LongWritable, Text, Text, DoubleWritable>{@Overrideprotected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, DoubleWritable>.Context context)throws IOException, InterruptedException {String line = value.toString();if(line.length()>0){String[] array = line.split("\t");if(array.length==2){String name=array[0];int grade = Integer.parseInt(array[1]);context.write(new Text(name), new DoubleWritable(grade));}}}}class PartitionOutputClass extends Reducer<Text, DoubleWritable, Text, DoubleWritable>{@Overrideprotected void reduce(Text text, Iterable<DoubleWritable> iterable,Reducer<Text, DoubleWritable, Text, DoubleWritable>.Context context) throws IOException, InterruptedException {int sum = 0;int cnt= 0 ;for(DoubleWritable iw : iterable) {sum+=iw.get();cnt++;}context.write(text, new DoubleWritable(sum/cnt));}}//自定义分区的类//Partitioner<Text  , DoubleWritable > Text,DoubleWirtable分别为map结果的key,valueclass MyPartitioner extends Partitioner<Text  , DoubleWritable >{@Overridepublic int getPartition(Text text, DoubleWritable value, int numofreuceTask) {String name = text.toString();if(name.equals("wd")||name.equals("wzf")||name.equals("xzh")||name.equals("zz")) {return 0;}elsereturn 1;}}

以上是“hadoop中mapreducez如何自定义分区”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注编程网精选频道!

--结束END--

本文标题: hadoop中mapreducez如何自定义分区

本文链接: https://lsjlt.com/news/231383.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • hadoop中mapreducez如何自定义分区
    这篇文章主要为大家展示了“hadoop中mapreducez如何自定义分区”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“hadoop中mapreducez如何自定义分区”这篇文章吧。packag...
    99+
    2023-06-02
  • hadoop如何自定义分区
    今天小编给大家分享一下hadoop如何自定义分区的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。分区概念分区这个词对很多同学来...
    99+
    2023-06-29
  • hadoop全面解读自定义分区
    分区概念 分区这个词对很多同学来说并不陌生,比如Java很多中间件中,像kafka的分区,mysql的分区表等,分区存在的意义在于将数据按照业务规则进行合理的划分,方便后续对各个分区...
    99+
    2024-04-02
  • hadoop如何自定义格式化输出
    这篇文章给大家分享的是有关hadoop如何自定义格式化输出的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。import java.io.IOException;import java.net.U...
    99+
    2023-06-02
  • hadoop如何自定义GroupComparator实现求最大值
    小编给大家分享一下hadoop如何自定义GroupComparator实现求最大值,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!import java....
    99+
    2023-06-02
  • Hadoop中怎么自定义输出排序
    本篇文章为大家展示了Hadoop中怎么自定义输出排序,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。package com.hgs;import java.io.DataInput...
    99+
    2023-06-02
  • 「 Hadoop」mapreduce对温度数据进行自定义排序、分组、分区等 【转载】
    原帖地址:http://www.ptbird.cn/mapreduce-tempreture.html 「 Hadoop」mapreduce对温度数据进行自定义排序、分组、分区等   一、需求说明 1、数据文件说明 hdfs...
    99+
    2017-04-10
    Hadoop」mapreduce对温度数据进行自定义排序 分组 分区等 【转载】
  • 怎么自定义JDBCRDD的分区
    这篇文章主要讲解了“怎么自定义JDBCRDD的分区”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么自定义JDBCRDD的分区”吧!1,JDBCRDD使用val data = new Jdb...
    99+
    2023-06-19
  • 如何用 Golang 创建自定义时区?
    要在 golang 中创建自定义时区,可以使用 time.fixedzone 函数或 time.newfixedzone 函数。time.fixedzone 函数用于修改时区偏移,而 t...
    99+
    2024-05-22
    golang 时区 标准库
  • JavaScript如何自定义分页样式
    小编给大家分享一下JavaScript如何自定义分页样式,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!html部分<div...
    99+
    2024-04-02
  • Angular2如何自定义分页组件
    这篇文章主要介绍了Angular2如何自定义分页组件,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。在项目中,前端传给后台的参数有:pageS...
    99+
    2024-04-02
  • Android如何自定义评分控件
    今天小编给大家分享一下Android如何自定义评分控件的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。自定义参数为了方便扩展,...
    99+
    2023-06-30
  • Keras中如何定义一个自定义的层
    要定义一个自定义的层,需要继承keras.layers.Layer类,并重写__init__和call方法。下面是一个简单的示例: ...
    99+
    2024-03-14
    Keras
  • SpringBoot中如何自定义参数绑定
    这篇文章给大家介绍SpringBoot中如何自定义参数绑定,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。自定义参数转换器自定义参数转换器实现Converter接口,如下:public class D...
    99+
    2023-06-19
  • js+css如何自定义分页效果
    这篇文章给大家分享的是有关js+css如何自定义分页效果的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。网上看了好多分页插件都不太满意,所以根据网上的一些东西自己做了一个,可以搭配...
    99+
    2024-04-02
  • angularjs+bootstrap如何实现自定义分页
    这篇文章主要介绍angularjs+bootstrap如何实现自定义分页,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!目前在做一个java web页面,没有使用到框架的分页,所以需要...
    99+
    2024-04-02
  • win10自定义分辨率如何设置
    这篇文章主要讲解了“win10自定义分辨率如何设置”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“win10自定义分辨率如何设置”吧!win10自定义分辨率设置方法:在右下角的搜索中输入控制面...
    99+
    2023-07-01
  • AntDesignVuetable组件如何自定义分页器
    目录Ant Design Vue table组件自定义分页器使用Ant Design Vue的Table组件,解决点击任意内容详情,点击返回分页器页数默认回到第一页问题描述解决方法总...
    99+
    2023-05-16
    Ant Design Vue Ant Design Vue table组件 table组件自定义分页器
  • sqlserver中如何自定义函数
    这期内容当中小编将会给大家带来有关sqlserver中如何自定义函数,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。“自定义函数”是我们平常的说法,而“用户定义的函数”是 ...
    99+
    2024-04-02
  • 如何在zabbix中自定义key
    这篇文章主要介绍了如何在zabbix中自定义key,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。 如何在zabbix中自定义key,并使用...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作