返回顶部
首页 > 资讯 > 数据库 >完全分布式Hadoop2.X的搭建
  • 193
分享到

完全分布式Hadoop2.X的搭建

完全分布式Hadoop2.X的搭建 2015-11-18 02:11:12 193人浏览 无得
摘要

准备工作: 安装jdk 克隆2台虚拟机完成后:新的2台虚拟机,请务必依次修改3台虚拟机的ip地址和主机名称【建议三台主机名称依次叫做:master、node1、node2 】(虚拟机的克隆,前面的博客,三台虚拟机都要开机) 这里我们安装的

完全分布式Hadoop2.X的搭建

准备工作:

安装jdk

克隆2台虚拟机完成后:新的2台虚拟机,请务必依次修改3台虚拟机的ip地址和主机名称【建议三台主机名称依次叫做:master、node1、node2 】(虚拟机的克隆,前面的博客,三台虚拟机都要开机)

这里我们安装的是hadoop2.7.6版本:https://hadoop.apache.org/releases.html

1、设置主机名与ip的映射,修改配置文件命令:vi /etc/hosts

 

 

 

2、将hosts文件拷贝到node1和node2节点

 

命令:

 

scp /etc/hosts node1:/etc/hosts

 

scp /etc/hosts node2:/etc/hosts

这里我们可以在bin目录下面写一个分发的脚本

cd /bin/

vim xsync

#!/bin/bash
#1. 判断参数个数
if [ $# -lt 1 ]
then
  echo Not Enough Arguement!
  exit;
fi
#2. 遍历集群所有机器
for host in master node1 node2
do
 echo ====================  $host  ====================
  #3. 遍历所有目录,挨个发送
  for file in $@
  do
    #4. 判断文件是否存在
    if [ -e $file ]
    then
      #5. 获取父目录
      pdir=$(cd -P $(dirname $file); pwd)
      #6. 获取当前文件的名称
      fname=$(basename $file)
      ssh $host "mkdir -p $pdir"
      rsync -av $pdir/$fname $host:$pdir
    else
      echo $file does not exists!
    fi
  done
done

修改脚本 xsync 具有执行权限:chmod 777 xsync

注意:完成上述操作后,三台需要刷新一下配置环境变量的文件:source /etc/profile 

 

4、关闭防火墙(三台都要操作),使用命令:service iptables stop

5、关闭防火墙的自动启动(三台都要操作),使用命令:chkconfig iptables off

 

6、设置ssh免密码登录(只在Master 这台主机操作)

主节点执行命令  ssh-keygen -t rsa     产生密钥 一直回车

  执行命令

 

7、将密钥拷贝到其他两个子节点,命令如下:

ssh-copy-id -i node1

ssh-copy-id -i node2

实现免密码登录到子节点

 

8、将hadoop的jar包先上传到虚拟机/usr/local/module,使用xftp来上传

 

 

 9、解压Hadoop

 tar -xvf hadoop-2.7.6.tar.gz -C /usr/local/soft/

 

10、配置环境变量

这是我配置的环境变量,一定要有jdk和Hadoop

vim /etc/profile

export JAVA_HOME=/usr/local/soft/jdk1.8.0_171
export PATH=$PATH:$JAVA_HOME/bin
export Redis_HOME=/usr/local/soft/redis/
export PATH=$PATH:$REDIS_HOME/bin
export HADOOP_HOME=/usr/local/soft/hadoop-2.7.6
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

 

 

 

分发给node1与node2:xsync  /etc/profile

三台都需要:source /etc/profile

11、修改配置文件

hadoop 配置文件在/usr/local/soft/hadoop-2.7.6/etc/hadoop/

cd /usr/local/soft/hadoop-2.7.6/etc/hadoop/

 

11.1、hadoop-env.sh : Hadoop 环境配置文件
vim hadoop-env.sh
修改JAVA_HOME
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171

 

11.2、slaves : 从节点列表(datanode)
vim slaves
增加node1, node2

 

 

 

11.3、core-site.xml : hadoop核心配置文件
vim core-site.xml

在configuration中间增加以下内容


>fs.defaultFS
>hdfs://master:9000
</property>

>
>hadoop.tmp.dir
>/usr/local/soft/hadoop-2.7.6/tmp
</property>

>
>fs.trash.interval
>1440
</property>

11.4、hdfs-site.xml : hdfs配置文件

vim hdfs-site.xml

在configuration中间增加以下内容


>dfs.replication
>1
</property>

>
>dfs.permissions
>false
</property>

11.5、yarn-site.xml: yarn配置文件

vim yarn-site.xml

在configuration中间增加以下内容

 


>yarn.resourcemanager.hostname
>master
</property>

>
>yarn.nodemanager.aux-services
>mapReduce_shuffle
</property>

>
>yarn.log-aggregation-enable
>true
</property>

>
>yarn.log-aggregation.retain-seconds
>604800
</property>

>  
>yarn.nodemanager.resource.memory-mb  
>20480  
</property>  

>  
>yarn.scheduler.minimum-allocation-mb  
>2048  
</property>  

>  
>yarn.nodemanager.vmem-pmem-ratio  
>2.1  
</property>  

 

 

 11.6、mapred-site.xml: mapreduce配置文件

在这里需要重命名mapred-site.xml.template 

命令:mv mapred-site.xml.template mapred-site.xml

vim mapred-site.xml

在configuration中间增加以下内容


>mapreduce.framework.name
>yarn
</property>

>  
>mapreduce.jobhistory.address  
>master:10020  
</property>  

>  
>mapreduce.jobhistory.WEBapp.address  
>master:19888  
</property> 

 

 

12、将hadoop安装文件同步到子节点

xsync  /usr/local/soft/hadoop-2.7.6


13、格式化namenode

hdfs namenode -fORMat

 


14、启动hadoop

在Hadoop的sbin目录下执行:

    /usr/local/soft/hadoop-2.7.6/sbin

    启动命令:start-all.sh

 

 

 

15、访问hdfs页面验证是否安装成功

 

Http://master:50070

 

 

 

 

 

 

 

 

用Java内部命令jps来看是否成功

 

 

 

 

 

 

 这里同样我们可以使用脚本查看三台节点的jps

在cd /bin/ 目录下 vim jpsall

#!/bin/bash

for i in hadoop102 hadoop103 hadoop104
do
        echo =============== $i ===============
        ssh $i "$*" "/usr/local/soft/jdk1.8.0_212/bin/jps"
done

修改脚本 jpsall 具有执行权限:chmod 777 jpsall

 

 

 

16、如果安装失败
stop-all.sh
再次重启的时候
1需要手动将每个节点的tmp目录删除: 所有节点都要删除
rm -rf /usr/local/soft/hadoop-2.7.6/tmp
然后执行将namenode格式化
2在主节点执行命令:
hdfs namenode -format
3启动hadoop
start-all.sh

 

 

 

 

您可能感兴趣的文档:

--结束END--

本文标题: 完全分布式Hadoop2.X的搭建

本文链接: https://lsjlt.com/news/8773.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 完全分布式Hadoop2.X的搭建
    准备工作: 安装jdk 克隆2台虚拟机完成后:新的2台虚拟机,请务必依次修改3台虚拟机的ip地址和主机名称【建议三台主机名称依次叫做:master、node1、node2 】(虚拟机的克隆,前面的博客,三台虚拟机都要开机) 这里我们安装的...
    99+
    2015-11-18
    完全分布式Hadoop2.X的搭建
  • 完全分布式Hadoop3.X的搭建
    准备工作以及安装Hadoop之前的操作和Hadoop2.X的安装相同,在我上一篇博客中,这里不做过多介绍 https://www.cnblogs.com/lmandcc/p/15306163.html   1. 写一些关键脚本,利于后续集...
    99+
    2014-05-18
    完全分布式Hadoop3.X的搭建
  • Hadoop完全分布式集群搭建
    Hadoop的运行模式 Hadoop一般有三种运行模式,分别是: 单机模式(Standalone Mode),默认情况下,Hadoop即处于该模式,使用本地文件系统,而不是分布式文件系统。,用于开发和调试。 伪分布式模式(Pseudo D...
    99+
    2021-07-05
    Hadoop完全分布式集群搭建
  • hadoop完全分布式怎么搭建
    要搭建Hadoop完全分布式集群,需要按照以下步骤进行操作: 准备环境:首先需要准备多台服务器,至少需要3台以上的服务器来搭建H...
    99+
    2024-03-13
    hadoop
  • Hadoop环境搭建-单机、伪分布式、完全分布式
    目录 一、单机安装  二、伪分布式环境搭建 配置SSH免密登录  三、完全分布式环境搭建 设置免密 修改配置文件 本文的所有配置文件,除注释部分都可直接复制粘贴。因为本文的配置文件的语言语法采用的是HTML或JAVA,...
    99+
    2023-10-23
    hadoop 分布式 linux
  • zookeeper3.5.5 centos7 完全分布式 搭建随记 - G
    zookeeper3.5.5 centos7 完全分布式 搭建随记 这里是当初在三个ECS节点上搭建hadoop+zookeeper+hbase+solr的主要步骤,文章内容未经过润色,请参考的同学搭配其他博客一同使用,并记得根据...
    99+
    2020-03-11
    zookeeper3.5.5 centos7 完全分布式 搭建随记 - G
  • hbase2.1.9 centos7 完全分布式 搭建随记 - G
    hbase2.1.9 centos7 完全分布式 搭建随记 这里是当初在三个ECS节点上搭建hadoop+zookeeper+hbase+solr的主要步骤,文章内容未经过润色,请参考的同学搭配其他博客一同使用,并记得根据实际情况...
    99+
    2020-10-25
    hbase2.1.9 centos7 完全分布式 搭建随记 - G
  • 完全分布式hadoop搭建的步骤是什么
    搭建完全分布式Hadoop集群通常包括以下步骤: 准备环境:确保所有节点都有相同的操作系统和Java版本,并且具有网络互通的能力...
    99+
    2024-03-05
    hadoop
  • Hadoop完全分布式集群搭建(超详细)
    目录 1.1.1 完全分布式介绍 1.1.2 平台软件说明 1.1.3 守护进程布局 1.2.1 集群搭建准备 1.2.2 总纲 1.2.3防火墙关闭 1.2.4 主机映射 1.2.5 免密登陆 1.2.6 jdk安装和hadoop安装及...
    99+
    2023-10-23
    hadoop 分布式 hdfs
  • 浅析Hadoop完全分布式集群搭建问题
    目录一、Hadoop是什么二、Hadoop组成1、Hadoop1.x2、Hadoop2.x三、Hadoop集群搭建所需工具(链接如下,自行下载)四、Hadoop集群配置前期准备五、H...
    99+
    2024-04-02
  • ubantu 16.4下Hadoop完全分布式搭建实战教程
    前言 本文主要介绍了关于ubantu 16.4 Hadoop完全分布式搭建的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧 一个虚拟机 1.以  NAT网卡模式  ...
    99+
    2022-06-04
    ubuntu16安装hadoop hadoop集群搭建 ubantu搭建深度学习框架
  • Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的
    这期内容当中小编将会给大家带来有关Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。最近在自己的笔记本电脑上搭建了Apache Hadoop分...
    99+
    2023-06-19
  • CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境
    这篇文章将为大家详细讲解有关CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。(一)软件准备1,hadoop-2.7.3.tar.gz(包)2...
    99+
    2023-06-03
  • Hadoop 2.x中怎么搭建伪分布式环境
    这期内容当中小编将会给大家带来有关Hadoop 2.x中怎么搭建伪分布式环境,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。1、修改hadoop-env.sh、yarn-e...
    99+
    2024-04-02
  • 如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群
    本篇内容主要讲解“如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何使用Centos7系统搭建Hadoop-3.1.4完全分布...
    99+
    2023-06-15
  • Zookeeper分布式集群搭建
    文中Zookeeper分布式集群搭建在Linux CentOS7系统之上。搭建大数据分布式集群,不建议使用root用户直接操作,故文中使用bigdata用户进行集群的搭建。 一、环境准备 软件 版本 Linux系统 CentOS7...
    99+
    2015-10-26
    Zookeeper分布式集群搭建
  • hadoop伪分布式如何搭建
    要搭建Hadoop伪分布式,需要按照以下步骤进行操作:1. 安装Java开发工具:首先,确保已在计算机上安装了Java开发工具。Ha...
    99+
    2023-09-21
    hadoop
  • linux怎么搭建分布式存储
    在Linux环境下搭建分布式存储通常会使用一些开源的分布式存储软件,比如Ceph、GlusterFS等。以下是一个简单的步骤来搭建一...
    99+
    2024-04-09
    linux
  • mysql分布式集群怎么搭建
    要搭建一个 MySQL 分布式集群,可以采用以下步骤: 选择合适的分布式架构:MySQL 分布式集群可以采用主从复制、主从同步复制...
    99+
    2024-04-18
    mysql
  • Hadoop伪分布式环境的搭建步骤
    这篇文章主要讲解了“Hadoop伪分布式环境的搭建步骤”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Hadoop伪分布式环境的搭建步骤”吧!安装准备将系统安...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作