返回顶部
首页 > 资讯 > 精选 >数据到hadoop的迁移步骤
  • 714
分享到

数据到hadoop的迁移步骤

2023-06-03 02:06:14 714人浏览 八月长安
摘要

本篇内容主要讲解“数据到hadoop的迁移步骤”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“数据到hadoop的迁移步骤”吧!最近在用flume和sqoop来做非关系数据(日志)和关系数据(MY

本篇内容主要讲解“数据到hadoop的迁移步骤”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“数据到hadoop的迁移步骤”吧!

最近在用flume和sqoop来做非关系数据(日志)和关系数据(MYSQL)迁移到hdfs的工作,简单记录下使用过程,以此总结
一 flume的使用
使用flume把WEB的log日志数据导入到hdfs上
步骤
1 在 elephant 节点上
先安装flume sudo yum install --assumeyes flume-ng
2 创建配置文件
vi /etc/hadoop/conf/flume-conf.properties

tail1.sources = src1
tail1.channels = ch2
tail1.sinks = sink1
tail1.sources.src1.type = exec
tail1.sources.src1.command = tail -F /tmp/access_log
tail1.sources.src1.channels = ch2
tail1.channels.ch2.type = memory
tail1.channels.ch2.capacity = 500
tail1.sinks.sink1.type = avro
tail1.sinks.sink1.hostname = localhost
tail1.sinks.sink1.port = 6000
tail1.sinks.sink1.batch-size = 1
tail1.sinks.sink1.channel = ch2
##
collector1.sources = src1
collector1.channels = ch2
collector1.sinks = sink1
collector1.sources.src1.type = avro
collector1.sources.src1.bind = localhost
collector1.sources.src1.port = 6000
collector1.sources.src1.channels = ch2
collector1.channels.ch2.type = memory
collector1.channels.ch2.capacity = 500
collector1.sinks.sink1.type = hdfs
collector1.sinks.sink1.hdfs.path = flume/collector1
collector1.sinks.sink1.hdfs.filePrefix = access_log
collector1.sinks.sink1.channel = ch2

配置文件说明结构是
src取日志数据,通过内存传送到本地以avro文件格式保存,做中转,然后从avro文件,通过内存传送到hdfs上。hdfs保存路径是flume/collector1,

3 在hfds上创建保存目录
hadoop fs -mkdir -p flume/collector1

4 模拟产生大量日志文件,在log目录中
$ accesslog-gen.bash /tmp/access_log
5 启动日志收集器
flume-ng agent --conf /etc/hadoop/conf/ \
--conf-file /etc/hadoop/conf/flume-conf.properties \
--name collector1
6 启动日志采集器
$ flume-ng agent \
--conf-file /etc/hadoop/conf/flume-conf.properties \
--name tail1

二 sqoop的使用
使用sqoop把Mysql中的表数据导入到hdfs
1安装sqoop
sudo yum install --assumeyes sqoop
2在sqoop的lib下创建一个mysql连接的驱动链接,也就是在sqoop的lib下面能找到mysql的驱动包
就是在/usr/lib/sqoop/lib目录,创建 $ sudo ln -s /usr/share/java/mysql-connector-java.jar /usr/lib/sqoop/lib/
3导入数据
sqoop help
用sqoop查看mysql中有哪些数据库
sqoop list-databases \
--connect jdbc:mysql://localhost \
--username training --passWord training
再看看库里有哪些表
sqoop list-tables \
--connect jdbc:mysql://localhost/movielens \
--username training --password training
开始导入命令表movie到hdfs,表中字段的数据用tab分割
sqoop import \
--connect jdbc:mysql://localhost/movielens \
--table movie --fields-terminated-by '\t' \
--username training --password training
4验证
hadoop fs -ls movie
hadoop fs -tail movie/part-m-00000
可以看到数据已文件形式保存到hdfs

到此,相信大家对“数据到hadoop的迁移步骤”有了更深的了解,不妨来实际操作一番吧!这里是编程网网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

--结束END--

本文标题: 数据到hadoop的迁移步骤

本文链接: https://lsjlt.com/news/232192.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 数据到hadoop的迁移步骤
    本篇内容主要讲解“数据到hadoop的迁移步骤”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“数据到hadoop的迁移步骤”吧!最近在用flume和sqoop来做非关系数据(日志)和关系数据(MY...
    99+
    2023-06-03
  • hadoop服务器迁移的步骤是什么
    Hadoop服务器迁移包括以下步骤: 确定迁移目标:确定新服务器的配置和位置,确保新服务器满足集群需求。 数据备份:在执行迁...
    99+
    2024-04-15
    hadoop
  • Mongodb数据迁移步骤是什么
    本篇内容介绍了“Mongodb数据迁移步骤是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!需求:需要将...
    99+
    2024-04-02
  • mysql数据库迁移详细步骤
    mysql 数据库迁移步骤概述:准备并备份源数据库,优化迁移速度。配置目标数据库,确保空间和资源充足。传输源数据库架构,在目标数据库中重新创建。传输源数据库数据,验证正确导入。管理用户和...
    99+
    2024-08-02
    mysql 数据丢失
  • mysql数据库迁移的步骤是什么
    MySQL数据库迁移的步骤通常包括以下几个方面:1.备份原始数据库:在开始迁移之前,首先需要对原始数据库进行备份,以防止数据丢失或损...
    99+
    2023-09-27
    mysql数据库
  • docker迁移数据目录的方法步骤
    目录查看磁盘使用磁盘清理 (切勿轻易使用)迁移数据查看磁盘使用 # du -hs /var/lib/docker/ 237G /var/lib/docker/ # docke...
    99+
    2024-04-02
  • 从MySQL迁移到Oracle数据库的详细步骤和方法
    系列文章目录 文章目录 系列文章目录前言一、备份MySQL数据库二、安装Oracle数据库三、数据转换四、导出MySQL数据五、导入数据到Oracle六、重新创建索引和约束七、测试和验证八、...
    99+
    2023-09-24
    数据库 mysql oracle
  • MySQL迁移数据到MongoDB并同步
    因公司业务要求使用mongodb,故做了测试如下:第三方数据复制引擎--Tungsten-Replicator 主要特点:1 支持高版本MySQL向低版本复制,5.1-->5.0&...
    99+
    2024-04-02
  • MySQL数据库数据文件路径迁移步骤
    一、关闭mysql. $ service mysqld stop 二、将/data/mysql下的mysql目录mv(移动)到data目录。 mysql> show variables like...
    99+
    2024-04-02
  • Android项目迁移到AndroidX的方法步骤
    1. 写在前面 迁移前请确认所有代码都已提交至代码托管平台或已手动备份! 迁移前请确认所有代码都已提交至代码托管平台或已手动备份! 迁移前请确认所有代码都已提交至代码托管平台...
    99+
    2022-06-06
    方法 Android
  • 阿里云数据库迁移步骤详解
    随着信息化的快速发展,企业对数据库的需求也在不断变化。有时,由于某种原因,企业可能需要将现有的数据库迁移到阿里云数据库。本文将详细介绍阿里云数据库迁移的步骤,希望能对您有所帮助。 一、准备阶段在开始迁移之前,需要对现有的数据库进行详细的了解...
    99+
    2023-11-10
    阿里 详解 步骤
  • MySQL 集群迁移到 Kubernetes操作步骤
    目录背景适用场景前提条件操作步骤Step 1:自建集群开启 GTIDStep 2:容器集群在线迁移全量数据Step 3:进行增量同步Step 4:同步数据到容器集群的其他节点Step 5:业务切换Step 6:停止同步总...
    99+
    2024-04-02
  • MySQL集群迁移到Kubernetes操作步骤
    目录背景适用场景前提条件操作步骤Step 1:自建集群开启 GTIDStep 2:容器集群在线迁移全量数据Step 3:进行增量同步Step 4:同步数据到容器集群的其他节点Step...
    99+
    2024-04-02
  • MySQL数据库管理--迁移表操作步骤
    下面一起来了解下MySQL数据库管理--迁移表操作步骤,相信大家看完肯定会受益匪浅,文字在精不在多,希望MySQL数据库管理--迁移表操作步骤这篇短内容是你想要的。      ...
    99+
    2024-04-02
  • 阿里云数据库迁移到宝塔详细指南与步骤
    随着互联网技术的发展,数据的存储和管理变得越来越重要。阿里云数据库作为一款高效稳定的数据存储和处理工具,受到了广大用户的喜爱。然而,如果用户需要迁移数据到其他平台上,可能会面临一些挑战。本文将提供一种详细的阿里云数据库迁移到宝塔的方法,包括...
    99+
    2023-11-12
    阿里 宝塔 步骤
  • MySQL迁移KingbaseESV8R2的实现步骤
    目录1. 使用Oracle中转2. 使用KingbaseESV8R3中转3. 其他问题1.自增2.uuid4. 已发现的 SQL 问题1. 使用Oracle中转 KingbaseES...
    99+
    2024-04-02
  • 数据库迁移系列之--Oracle迁移到Mysql
    敬请期待......
    99+
    2017-12-07
    数据库迁移系列之--Oracle迁移到Mysql
  • 从 MySQL迁移数据到Oracle
    从 MySQL 迁移数据到 Oracle 中的全过程 zhengqingya 22019.12.26 16:53:14字数 911阅读 480 一、前言 这里记录一次将MySQL数据库中的表数...
    99+
    2024-01-21
    mysql 数据库 中间件 centos
  • hadoop数据怎么迁移至对象存储
    将Hadoop数据迁移至对象存储可以通过以下步骤实现: 确保您已经设置好了对象存储服务,并拥有相应的权限和凭证。 使用Hadoop...
    99+
    2024-04-11
    hadoop
  • Oracle XTTS跨平台数据库迁移(从Unix迁移数据库到Linux)_Oracle数据库迁移项
     Oracle数据库迁移教程04 Oracle XTTS跨平台数据库迁移实战(真正超越OCP/OCM的项目实战系列教程)本套风哥Oracle教程学习内容1.Oracle XTTS技术基础知识2.Oracle...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作