返回顶部
首页 > 资讯 > 数据库 >Hadoop Sqoop
  • 550
分享到

Hadoop Sqoop

2024-04-02 19:04:59 550人浏览 八月长安
摘要

一、概述:Sqoop是一款开源的工具,主要用于在hadoop(如Hive、hdfs)与传统的数据库(Mysql、oracle ...)间进行数据的传递,可以将一个关系型数据库(如 mysql ,O

一、概述:

Sqoop是一款开源工具,主要用于在hadoop(如Hivehdfs)与传统的数据库(Mysqloracle ...)间进行数据的传递,可以将一个关系型数据库(如 mysql ,Oracle...)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。其实质就是将导入导出命令转换成mapReduce程序来实现。

二、安装和配置

1、修改配置文件sqoop-env.sh:

#Set path to where bin/hadoop is available

export HADOOP_COMMON_HOME=/home/hadoop/app/hadoop-2.4.1


#Set path to where hadoop-*-core.jar is available

export HADOOP_MAPRED_HOME=/home/hadoop/app/hadoop-2.4.1


#set the path to where bin/HBase is available

export HBASE_HOME=/home/hadoop/app/hbase-0.96.2-hadoop2


#Set the path to where bin/hive is available

export HIVE_HOME=/home/hadoop/app/hive-0.12.0-bin


#Set the path for where zookeper config dir is

export ZOOCFGDIR=/home/hadoop/app/ZooKeeper-3.4.5/conf


2、将sqoop添加到环境变量。


3、将数据库连接驱动拷贝到$SQOOP_HOME/lib里。


三、导入导出:

1、数据库中的数据导入到HDFS上:

(1)、指定导入的字段:

sqoop import 

--connect jdbc:mysql://192.168.1.10:3306/itcast 

--username root --passWord 123  

--table trade_detail 

--columns 'id, account, income, expenses'

(2)、指定输出路径、指定数据分隔符:

sqoop import 

--connect jdbc:mysql://192.168.1.10:3306/itcast 

--username root --password 123  

##要导入数据的表

--table trade_detail 

##数据导入hdfs后所存放的目录

--target-dir '/sqoop/td' 

##导入的数据字段之间的分隔符

--fields-terminated-by '\t'

(3)、指定Map数量 -m 

sqoop import 

--connect jdbc:mysql://192.168.1.10:3306/itcast 

--username root --password 123  

--table trade_detail 

--target-dir '/sqoop/td1' 

--fields-terminated-by '\t'

##指定做导入处理时的map 任务数 

-m 2


(4)、增加where条件, 注意:条件必须用引号引起来

sqoop import 

--connect jdbc:mysql://192.168.1.10:3306/itcast 

--username root --password 123  

--table trade_detail 

--where 'id>3' 

--target-dir '/sqoop/td2' 


(5)、增加query语句(使用 \ 将语句换行)

sqoop import 

--connect jdbc:mysql://192.168.1.10:3306/itcast 

--username root --password 123 

--query 'SELECT * FROM trade_detail where id > 2 AND $CONDITioNS' 

--split-by trade_detail.id 

--target-dir '/sqoop/td3'

注意:如果使用--query这个命令的时候,需要注意的是where后面的参数,AND $CONDITIONS这个参数必须加上

而且存在单引号与双引号的区别,如果--query后面使用的是双引号,那么需要在$CONDITIONS前加上\即\$CONDITIONS

如果设置map数量为1个时即-m 1,不用加上--split-by ${tablename.column},否则需要加上

2、将HDFS上的文件数据导出到数据库的表里面去:

sqoop export 

--connect jdbc:mysql://192.168.8.120:3306/itcast 

--username root --password 123 

##你要导出的数据所在的目录

--export-dir '/td3' 

##你要导往的目标关系表

--table td_bak 

-m 1 

##你要导出的文件的字段分隔符

--fields-termianted-by '\t'

四、用python导入导出表:

import os


from_table="rpt_daily"


to_table="rpt_daily"


sqoop1="sqoop import --connect jdbc:mysql://172.30.200.219/bi_warehouse --username root " \

      "--password artisan  --table "+from_table+"  --fields-terminated-by '\\001' --target-dir /db/as_main/modifier/lzf/"+from_table+"  --delete-target-dir --num-mappers 1 "

os.system(sqoop1)


sqoop2="sqoop export --connect \"jdbc:mysql://192.168.1.4/bi_warehouse?useUnicode=true&characterEncoding=utf-8\" --username root --password root --table "+to_table+"  " \

       "--export-dir /db/as_main/modifier/lzf/"+to_table+"/part-m-00000 --input-fields-terminated-by '\\001'"


os.system(sqoop2)



执行有2种方法:

方法1、linux行,执行Python ,进入python,然后将上面内容粘贴后回车即可


方法2、在linux行,执行python  test2.py,即python调用文件(test2.py为上述内容保存的文件名称)


您可能感兴趣的文档:

--结束END--

本文标题: Hadoop Sqoop

本文链接: https://lsjlt.com/news/38430.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Hadoop Sqoop
    一、概述:Sqoop是一款开源的工具,主要用于在Hadoop(如Hive、HDFS)与传统的数据库(mysql、Oracle ...)间进行数据的传递,可以将一个关系型数据库(如 MySQL ,O...
    99+
    2024-04-02
  • Hadoop hive sqoop zookeeper hb
    6、问题及解决方案1. 问题描述:WARN util.NativeCodeLoader: Unable to load native-hadoop library foryour platform… usi...
    99+
    2024-04-02
  • hadoop-ha+zookeeper+hbase+hive+sqoop+flume+kafka+spark集群安装
    创建3台虚拟机 主机为桌面版 其他为迷你版本 ******************************常用命令、进程名称****************************启动集群命令: start-all.sh...
    99+
    2017-03-10
    hadoop-ha+zookeeper+hbase+hive+sqoop+flume+kafka+spark集群安装
  • Hadoop学习之第八章节:Sqoop安装配置
    一、Sqoop介绍   Sqoop是一个用来将Hadoop(Hive、HBase)和关系型数据库中的数据相互转移的工具,可以将一个关系型数据库(例如:MySQL ,Oracle ,Pos...
    99+
    2024-04-02
  • Sqoop怎么实现和Hadoop之间的数据传输
    Sqoop是一个用于在Apache Hadoop和关系数据库之间传输数据的工具。使用Sqoop可以轻松地将数据从关系数据库中导入到H...
    99+
    2024-04-02
  • Sqoop
    简介 Sqoop是一款开源工具,主要用于Hadoop(HDFS、Hbase、HIVE)与传统数据库(Mysql、Oracle、Postgresql)间进行数据的传递。 它可以将一个关系型数据库中的数据导入到Hadoop的HDFS中,也可以...
    99+
    2018-10-02
    Sqoop
  • sqoop导入关系型数据库-解密Sqoop
    Sqoop作为Hadoop与传统数据库之间的桥梁,对于数据的导入导出有着重要作用。通过对Sqoop基本语法以及功能的阐述,深刻解密Sqoop的作用和价值。 一、什么是Apache SqoopClo...
    99+
    2024-04-02
  • Sqoop 1.4.6 安装
    下载安装包http://archive.apache.org/dist/sqoop/1.4.6/sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz  &...
    99+
    2024-04-02
  • sqoop 中文手册
    1.     概述本文档主要对SQOOP的使用进行了说明,参考内容主要来自于Cloudera SQOOP的官方文档。为了用中文更清楚明白地描述各参数的使用含义,本文档...
    99+
    2024-04-02
  • Sqoop怎么安装
    这篇文章主要介绍了Sqoop怎么安装,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。一、Sqoop的安装1.1 下载上传安装包首先下载安装包,点击此处进行下载。将下载的安装包上...
    99+
    2023-06-14
  • sqoop export是什么
    这篇文章主要讲解了“sqoop export是什么”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“sqoop export是什么”吧!一、Sqoop export简介  Sqoop ...
    99+
    2023-06-03
  • sqoop 安装与使用
    Sqoop(发音:skup)是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可...
    99+
    2020-02-07
    sqoop 安装与使用
  • Sqoop 1.4.6如何安装
    这篇文章主要介绍Sqoop 1.4.6如何安装,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完! sqoop数据迁移1 概述sqoop是apache旗下一款“Hadoop和关系数据库服务器之间传送数据”的工具。 ...
    99+
    2023-06-03
  • 数据集成:Flume和Sqoop
    Flume和Sqoop是Hadoop数据集成和收集系统,两者的定位不一样,下面根据个人的经验与理解和大家做一个介绍:Flume由cloudera开发出来,有两大产品:Flume-og和Flume-ng,Fl...
    99+
    2024-04-02
  • sqoop脚本批量生成
    通过all_tab_columnss字典表生成hive的建表语句 create or replace view create_sql as--通过all_tab_columnss字典表生成hive的建表语句select own...
    99+
    2023-01-31
    批量 脚本 sqoop
  • Linux系统怎么安装sqoop
    这篇文章的内容主要围绕Linux系统怎么安装sqoop进行讲述,文章内容清晰易懂,条理清晰,非常适合新手学习,值得大家去阅读。感兴趣的朋友可以跟随小编一起阅读吧。希望大家通过这篇文章有所收获!sqoop简介:正如Sqoop的名字所示:Sqo...
    99+
    2023-06-28
  • Linux系统如何安装Sqoop
    这篇文章主要为大家展示了“Linux系统如何安装Sqoop”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Linux系统如何安装Sqoop”这篇文章吧。Sqoop简介:Sqoop : SQL-to...
    99+
    2023-06-28
  • Sqoop ETL工具的基本操作
    Sqoop ETL工具的基本操作查看 sqoop 命令说明sqoop help查看某一个命令的使用说明:sqoop cammond -help从orange,mysql到hdfssqoop import -...
    99+
    2024-04-02
  • sqoop的安装和使用方法
    这篇文章主要讲解了“sqoop的安装和使用方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“sqoop的安装和使用方法”吧!#解压包  从http...
    99+
    2024-04-02
  • Sqoop的主要用途有哪些
    Sqoop的主要用途包括: 数据迁移:Sqoop可以将关系型数据库中的数据导入到Hadoop中的Hive表中,也可以将Hive表...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作