首页 > 资讯 > 精选 >数据到hadoop的迁移步骤

714

分享到

数据到hadoop的迁移步骤

2023-06-03 02:06:14 714人浏览八月长安

摘要

本篇内容主要讲解“数据到hadoop的迁移步骤”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“数据到hadoop的迁移步骤”吧!最近在用flume和sqoop来做非关系数据(日志)和关系数据(MY

本篇内容主要讲解“数据到hadoop的迁移步骤”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“数据到hadoop的迁移步骤”吧!

最近在用flume和sqoop来做非关系数据(日志)和关系数据(MYSQL)迁移到hdfs的工作，简单记录下使用过程，以此总结
一 flume的使用
使用flume把WEB的log日志数据导入到hdfs上
步骤
1 在 elephant 节点上
先安装flume sudo yum install --assumeyes flume-ng
2 创建配置文件
vi /etc/hadoop/conf/flume-conf.properties

tail1.sources = src1
tail1.channels = ch2
tail1.sinks = sink1
tail1.sources.src1.type = exec
tail1.sources.src1.command = tail -F /tmp/access_log
tail1.sources.src1.channels = ch2
tail1.channels.ch2.type = memory
tail1.channels.ch2.capacity = 500
tail1.sinks.sink1.type = avro
tail1.sinks.sink1.hostname = localhost
tail1.sinks.sink1.port = 6000
tail1.sinks.sink1.batch-size = 1
tail1.sinks.sink1.channel = ch2
##
collector1.sources = src1
collector1.channels = ch2
collector1.sinks = sink1
collector1.sources.src1.type = avro
collector1.sources.src1.bind = localhost
collector1.sources.src1.port = 6000
collector1.sources.src1.channels = ch2
collector1.channels.ch2.type = memory
collector1.channels.ch2.capacity = 500
collector1.sinks.sink1.type = hdfs
collector1.sinks.sink1.hdfs.path = flume/collector1
collector1.sinks.sink1.hdfs.filePrefix = access_log
collector1.sinks.sink1.channel = ch2

配置文件说明结构是
src取日志数据,通过内存传送到本地以avro文件格式保存，做中转，然后从avro文件，通过内存传送到hdfs上。hdfs保存路径是flume/collector1，

3 在hfds上创建保存目录
hadoop fs -mkdir -p flume/collector1

4 模拟产生大量日志文件，在log目录中
$ accesslog-gen.bash /tmp/access_log
5 启动日志收集器
flume-ng agent --conf /etc/hadoop/conf/ \
--conf-file /etc/hadoop/conf/flume-conf.properties \
--name collector1
6 启动日志采集器
$ flume-ng agent \
--conf-file /etc/hadoop/conf/flume-conf.properties \
--name tail1

二 sqoop的使用
使用sqoop把Mysql中的表数据导入到hdfs
1安装sqoop
sudo yum install --assumeyes sqoop
2在sqoop的lib下创建一个mysql连接的驱动链接，也就是在sqoop的lib下面能找到mysql的驱动包
就是在/usr/lib/sqoop/lib目录，创建 $ sudo ln -s /usr/share/java/mysql-connector-java.jar /usr/lib/sqoop/lib/
3导入数据
sqoop help
用sqoop查看mysql中有哪些数据库
sqoop list-databases \
--connect jdbc:mysql://localhost \
--username training --passWord training
再看看库里有哪些表
sqoop list-tables \
--connect jdbc:mysql://localhost/movielens \
--username training --password training
开始导入命令表movie到hdfs，表中字段的数据用tab分割
sqoop import \
--connect jdbc:mysql://localhost/movielens \
--table movie --fields-terminated-by '\t' \
--username training --password training
4验证
hadoop fs -ls movie
hadoop fs -tail movie/part-m-00000
可以看到数据已文件形式保存到hdfs

到此，相信大家对“数据到hadoop的迁移步骤”有了更深的了解，不妨来实际操作一番吧！这里是编程网网站，更多相关内容可以进入相关频道进行查询，关注我们，继续学习！

--结束END--

本文标题: 数据到hadoop的迁移步骤

本文链接: https://lsjlt.com/news/232192.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

数据到hadoop的迁移步骤

数据到hadoop的迁移步骤

hadoop服务器迁移的步骤是什么

Mongodb数据迁移步骤是什么

mysql数据库迁移详细步骤

mysql数据库迁移的步骤是什么

docker迁移数据目录的方法步骤

从MySQL迁移到Oracle数据库的详细步骤和方法

MySQL迁移数据到MongoDB并同步

MySQL数据库数据文件路径迁移步骤

Android项目迁移到AndroidX的方法步骤

阿里云数据库迁移步骤详解

MySQL 集群迁移到 Kubernetes操作步骤

MySQL集群迁移到Kubernetes操作步骤

MySQL数据库管理--迁移表操作步骤

阿里云数据库迁移到宝塔详细指南与步骤

MySQL迁移KingbaseESV8R2的实现步骤

数据库迁移系列之--Oracle迁移到Mysql

从 MySQL迁移数据到Oracle

hadoop数据怎么迁移至对象存储

Oracle XTTS跨平台数据库迁移（从Unix迁移数据库到Linux）_Oracle数据库迁移项

使用golang框架有哪些常见的问题？

golang框架与其他流行框架的比较？

如何使用 C++ STL 扩展 C++ 语言的功能？

PHP 框架安全指南：如何实现安全编码实践？

mysql拆分函数使用要注意哪些事项

C++ 思维导图：全面整理编程核心知识

基于社区支持最强大的PHP框架

如何在 C++ 中有效使用 STL 函数对象？

PHP 框架中的调试和故障排除技术

经验丰富的开发者的PHP框架评估指南