首页 > 资讯 > 操作系统 >如何进行Linux大文件重定向和管道的效率对比

265

分享到

如何进行Linux大文件重定向和管道的效率对比

2023-06-28 17:06:29 265人浏览薄情痞子

摘要

这篇文章的内容主要围绕如何进行linux大文件重定向和管道的效率对比进行讲述，文章内容清晰易懂，条理清晰，非常适合新手学习，值得大家去阅读。感兴趣的朋友可以跟随小编一起阅读吧。希望大家通过这篇文章有所收获！Linux入门# 命令1

这篇文章的内容主要围绕如何进行linux大文件重定向和管道的效率对比进行讲述，文章内容清晰易懂，条理清晰，非常适合新手学习，值得大家去阅读。感兴趣的朋友可以跟随小编一起阅读吧。希望大家通过这篇文章有所收获！

# 命令1，管道导入shell> cat huge_dump.sql | mysql -uroot;

# 命令2，重定向导入shell> Mysql -uroot

大家先看一下上面二个命令，假如huge_dump.sql文件很大，然后猜测一下哪种导入方式效率会更高一些？

这个问题挺有意思的，我的第一反应是：

没比较过，应该是一样的，一个是cat负责打开文件，一个是bash

这种场景在mysql运维操作里面应该比较多，所以就花了点时间做了个比较和原理上的分析：
我们先构造场景：
首先准备一个程序b.out来模拟mysql对数据的消耗：

int main(int arGC, char *argv[])  while(fread(buf, sizeof(buf), 1, stdin) > 0);    return 0;}$  gcc  -o b.out b.c$ ls|./b.out

再来写个systemtap脚本用来方便观察程序的行为。

$ cat test.stpfunction should_log(){  return (execname() == "cat" ||      execname() == "b.out" ||      execname() == "bash") ;}probe syscall.open,      syscall.close,      syscall.read,      syscall.write,      syscall.pipe,      syscall.fork,      syscall.execve,      syscall.dup,      syscall.wait4{  if (!should_log()) next;  printf("%s -> %s\n", thread_indent(0), probefunc());}probe kernel.function("pipe_read"),      kernel.function("pipe_readv"),      kernel.function("pipe_write"),      kernel.function("pipe_writev"){  if (!should_log()) next;  printf("%s -> %s: file ino %d\n",  thread_indent(0), probefunc(), __file_ino($filp));}probe begin { println(":~") }

这个脚本重点观察几个系统调用的顺序和pipe的读写情况，然后再准备个419M的大文件huge_dump.sql,在我们几十G内存的机器很容易在内存里放下：

$ sudo dd if=/dev/urandom of=huge_dump.sql bs=4096 count=102400102400+0 records in102400+0 records out419430400 bytes (419 MB) copied, 63.9886 seconds, 6.6 MB/s

因为这个文件是用bufferio写的，所以它的内容都cache在pagecahce内存里面，不会涉及到磁盘。

好了，场景齐全了，我们接着来比较下二种情况下的速度，第一种管道：

# 第一种管道方式$ time (cat huge_dump.sql|./b.out)real    0m0.596suser    0m0.001ssys     0m0.919s# 第二种重定向方式$ time (./b.out

从执行时间数看出来速度有3倍左右的差别了，第二种明显快很多。

是不是有点奇怪？好吧我们来从原来上面分析下，还是继续用数据说话：

这次准备个很小的数据文件，方便观察然后在一个窗口运行stap

$ echo hello > huge_dump.sql$ sudo stap test.stp:~     0 bash(26570): -> sys_read     0 bash(26570): -> sys_read     0 bash(26570): -> sys_write     0 bash(26570): -> sys_read     0 bash(26570): -> sys_write     0 bash(26570): -> sys_close     0 bash(26570): -> sys_pipe     0 bash(26570): -> sys_pipe     0 bash(26570): -> do_fork     0 bash(26570): -> sys_close     0 bash(26570): -> sys_close     0 bash(26570): -> do_fork     0 bash(13775): -> sys_close     0 bash(13775): -> sys_read     0 bash(13775): -> pipe_read: file ino 20906911     0 bash(13775): -> pipe_readv: file ino 20906911     0 bash(13776): -> sys_close     0 bash(13776): -> sys_close     0 bash(13776): -> sys_close     0 bash(13776): -> do_execve     0 bash(26570): -> sys_close     0 bash(26570): -> sys_close     0 bash(26570): -> sys_close     0 bash(13775): -> sys_close     0 bash(26570): -> sys_wait4     0 bash(13775): -> sys_close     0 bash(13775): -> sys_close     0 b.out(13776): -> sys_close     0 b.out(13776): -> sys_close     0 bash(13775): -> do_execve     0 b.out(13776): -> sys_open     0 b.out(13776): -> sys_close     0 b.out(13776): -> sys_open     0 b.out(13776): -> sys_read     0 b.out(13776): -> sys_close     0 cat(13775): -> sys_close     0 cat(13775): -> sys_close     0 b.out(13776): -> sys_read     0 b.out(13776): -> pipe_read: file ino 20906910     0 b.out(13776): -> pipe_readv: file ino 20906910     0 cat(13775): -> sys_open     0 cat(13775): -> sys_close     0 cat(13775): -> sys_open     0 cat(13775): -> sys_read     0 cat(13775): -> sys_close     0 cat(13775): -> sys_open     0 cat(13775): -> sys_close     0 cat(13775): -> sys_open     0 cat(13775): -> sys_read     0 cat(13775): -> sys_write     0 cat(13775): -> pipe_write: file ino 20906910     0 cat(13775): -> pipe_writev: file ino 20906910     0 cat(13775): -> sys_read     0 b.out(13776): -> sys_read     0 b.out(13776): -> pipe_read: file ino 20906910     0 b.out(13776): -> pipe_readv: file ino 20906910     0 cat(13775): -> sys_close     0 cat(13775): -> sys_close     0 bash(26570): -> sys_wait4     0 bash(26570): -> sys_close     0 bash(26570): -> sys_wait4     0 bash(26570): -> sys_write

stap在收集数据了，我们在另外一个窗口运行管道的情况：

$ cat huge_dump.sql|./b.out

我们从systemtap的日志可以看出:

bash fork了2个进程。
然后execve分别运行cat 和 b.out进程, 这二个进程用pipe通信。
数据从由cat从 huge_dump.sql读出，写到pipe,然后b.out从pipe读出处理。

那么再看下命令2重定向的情况:

$ ./b.out  sys_read     0 bash(26570): -> sys_read     0 bash(26570): -> sys_write     0 bash(26570): -> sys_read     0 bash(26570): -> sys_write     0 bash(26570): -> sys_close     0 bash(26570): -> sys_pipe     0 bash(26570): -> do_fork     0 bash(28926): -> sys_close     0 bash(28926): -> sys_read     0 bash(28926): -> pipe_read: file ino 20920902     0 bash(28926): -> pipe_readv: file ino 20920902     0 bash(26570): -> sys_close     0 bash(26570): -> sys_close     0 bash(26570): -> sys_wait4     0 bash(28926): -> sys_close     0 bash(28926): -> sys_open     0 bash(28926): -> sys_close     0 bash(28926): -> do_execve     0 b.out(28926): -> sys_close     0 b.out(28926): -> sys_close     0 b.out(28926): -> sys_open     0 b.out(28926): -> sys_close     0 b.out(28926): -> sys_open     0 b.out(28926): -> sys_read     0 b.out(28926): -> sys_close     0 b.out(28926): -> sys_read     0 b.out(28926): -> sys_read     0 bash(26570): -> sys_wait4     0 bash(26570): -> sys_write     0 bash(26570): -> sys_read

bash fork了一个进程，打开数据文件。
然后把文件句柄搞到0句柄上，这个进程execve运行b.out。
然后b.out直接读取数据。

现在就非常清楚为什么二种场景速度有3倍的差别：
命令1，管道方式： 读二次，写一次,外加一个进程上下文切换。
命令2，重定向方式：只读一次。

什么是Linux系统

Linux是一种免费使用和自由传播的类UNIX操作系统，是一个基于POSIX的多用户、多任务、支持多线程和多CPU的操作系统，使用Linux能运行主要的Unix工具软件、应用程序和网络协议。

感谢你的阅读，相信你对“如何进行Linux大文件重定向和管道的效率对比”这一问题有一定的了解，快去动手实践吧，如果想了解更多相关知识点，可以关注编程网网站！小编会继续为大家带来更好的文章！

--结束END--

本文标题: 如何进行Linux大文件重定向和管道的效率对比

本文链接: https://lsjlt.com/news/320980.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

如何进行Linux大文件重定向和管道的效率对比

什么是Linux系统

如何进行Linux大文件重定向和管道的效率对比

Linux大文件重定向和管道的效率是怎样的

Linux大文件重定向和管道的效率哪个更高

ASP 重定向和 IDE 文件：如何进行有效的调试和测试？

Linux 下如何使用 Java 对象进行重定向？

异步编程如何提高ASP文件的重定向效率？

Linux系统如何对文件进行分割和重组

PHP如何在Linux和Windows之间进行重定向？

Linux 中如何使用 Java 对象进行重定向操作？

如何理解Linux文件重定向和文件过滤器

Java和Linux教程：如何利用重定向提高编程效率？

如何使用Python文件重定向和load函数来提高代码效率？

Linux 系统如何利用 Java 对象进行重定向操作？

Linux如何实现文件描述符和重定向

Linux如何提高大文件的拷贝效率

Java 中如何使用 Linux 系统进行重定向操作和对象传递？

重定向和存储：如何在PHP和Linux之间进行平衡？

如何在Java中处理Shell框架的重定向和管道？

如何使用PHP进行大数据存储和重定向操作？

你知道吗？在Linux上使用PHP进行重定向和存储的技巧！

linux vmstat命令有哪些功能

linux转义字符使用的方法是什么

linux安装node怎么使用

如何查看Linux系统版本号

linux系统怎么配置ntp服务

win10安装报0x25D错误怎么解决

win10开机卡在用户登录界面如何解决

win10新机怎么跳过创建账户

win10中config.msi文章能不能删除

win10改为ahci后无法进入系统怎么解决