返回顶部
首页 > 资讯 > 前端开发 > JavaScript >Java如何高效的读取一个超大文件
  • 471
分享到

Java如何高效的读取一个超大文件

2024-04-02 19:04:59 471人浏览 薄情痞子
摘要

这篇文章主要介绍“Java如何高效的读取一个超大文件”,在日常操作中,相信很多人在Java如何高效的读取一个超大文件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java如何

这篇文章主要介绍“Java如何高效的读取一个超大文件”,在日常操作中,相信很多人在Java如何高效的读取一个超大文件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java如何高效的读取一个超大文件”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

前言

我最近在优化我的pdfWord开源工具,有时候会遇到一个问题,就是如果我的PDF文件比较大,几百兆,如何更快更节省内存的读取它。于是我分析对比了四种常见的读取文件的方式,并使用javaVisualVM工具进行了分析。最后的出的结论是commons-io时间和空间都更加的高效。研究分析依然来自哪位baeldung国外大佬。

下面我会给出几种常见的读取大文件的方式。

读取大文件的四种方式

首先我自己在本地压缩了一个文件夹,大概500M左右。虽然不是很大但是,相对还可以。

方法1:Guava读取

String path = "G:\\java书籍及工具.zip"; Files.readLines(new File(path), Charsets.UTF_8);

使用guava读取比较简单,一行代码就搞定了。

下面去jdk的bin目录找到javaVisualVM工具,然后双击运行即可。

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:20秒

  • 堆内存:最高2.5G

  • CPU消耗:最高50%

我们一个500M的文件,堆内存最高竟然2.5G,如果我们读取一个2G的文件,可能我们的电脑直接死机了就。

方式2:Apache Commons IO普通方式

String path = "G:\\java书籍及工具.zip"; FileUtils.readLines(new File(path), Charsets.UTF_8);

这种方式也比较简单,同样是一行代码。下面运行,也分析一波:

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:17秒

  • 堆内存:最高2.5G

  • CPU消耗:最高50%,平稳运行25%左右

这种方式和上面那种基本上消耗差不多,肯定不是我想要的。

方式3:java文件流

FileInputStream inputStream = null; Scanner sc = null; try {      inputStream = new FileInputStream(path);      sc = new Scanner(inputStream, "UTF-8");      while (sc.hasNextLine()) {           String line = sc.nextLine();           //System.out.println(line);      }      if (sc.ioException() != null) {           throw sc.ioException();      } } finally {      if (inputStream != null) {           inputStream.close();      }      if (sc != null) {            sc.close();      } }

这种方式其实就是java中最常见的方式,然后我们运行分析一波:

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:32秒,增加了一倍

  • 堆内存:最高1G,少了一半

  • CPU消耗:平稳运行25%左右

这种方式确实很优秀,但是时间上开销更大。

方式4:Apache Commons IO流

LineIterator it = FileUtils.lineIterator(new File(path), "UTF-8"); try {       while (it.hasNext()) {           String line = it.nextLine();       } } finally {      LineIterator.closeQuietly(it); }

这种方式代码看起来比较简单,所以直接运行一波吧:

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:16秒,最低

  • 堆内存:最高650M,少了一半

  • CPU消耗:平稳运行25%左右

OK,就它了,牛。

结论

通过以上的分析,我们可以得出一个结论,如果我们想要读取一个大文件,选择了错误的方式,就有可能极大地占用我的内存和CPU,当文件特别大时,会造成意向不到的问题。

因此为了去解决这样的问题,有四种常见的读取大文件的方式。通过分析对比,发现,Apache Commons IO流是最高效的一种方式。

到此,关于“Java如何高效的读取一个超大文件”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

--结束END--

本文标题: Java如何高效的读取一个超大文件

本文链接: https://lsjlt.com/news/67917.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Java如何高效的读取一个超大文件
    这篇文章主要介绍“Java如何高效的读取一个超大文件”,在日常操作中,相信很多人在Java如何高效的读取一个超大文件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java如何...
    99+
    2024-04-02
  • 怎么用Java高效读取大文件
    这篇文章主要讲解了“怎么用Java高效读取大文件”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么用Java高效读取大文件”吧!内存读取第一个版本,阿粉采用...
    99+
    2024-04-02
  • Java高效读取大文件实例分析
    1、概述本教程将演示如何用Java高效地读取大文件。Java——回归基础。2、在内存中读取读取文件行的标准方式是在内存中读取,Guava和ApacheCommonsIO都提供了如下所示快速读取文件行的方法:Files.readLines(n...
    99+
    2023-05-30
  • python如何读取一个大于10G的txt文件
    这篇文章给大家分享的是有关python如何读取一个大于10G的txt文件的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。前言用python 读取一个大于10G 的文件,自己电脑只有8G内存,一运行就报内存溢出:Me...
    99+
    2023-06-15
  • java如何读取大文件文本
    Java可以使用`BufferedReader`类来读取大文件文本。`BufferedReader`类提供了一个`readLine(...
    99+
    2023-08-08
    java
  • 如何在 PHP 中逐行读取一个大文件
    在本文中,我们将介绍在 PHP 中逐行读取一个大文件的方法。 使用 fgets() 函数 使用 file() 函数 使用 stream_get_line() 函数 在 ...
    99+
    2024-02-27
  • python如何流式读取数G超大文件
    这篇文章将为大家详细讲解有关python如何流式读取数G超大文件,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。如何流式读取数G超大文件使用 with...open... 可以从一个文件中读取数据,这是所有...
    99+
    2023-06-27
  • Java如何读取整个文件流
    在Java中,可以使用`InputStream`类来读取文件流。以下是一个示例代码,演示如何读取整个文件流并将其打印出来:```ja...
    99+
    2023-08-26
    Java
  • Java中如何使用缓存提高文件读取效率?
    在Java开发中,读取文件是非常常见的操作。但是,如果文件比较大,或者需要频繁读取,那么每次都读取文件的话,效率会非常低下。这时候,我们可以考虑使用缓存来提高文件读取效率。 Java中提供了多种缓存方式,比如使用缓存流、使用Buffere...
    99+
    2023-06-28
    缓存 文件 leetcode
  • python读取一个大于10G的txt文件的方法
    前言 用python 读取一个大于10G 的文件,自己电脑只有8G内存,一运行就报内存溢出:MemoryError python 如何用open函数读取大文件呢? 读取大文件 首先可...
    99+
    2024-04-02
  • 一文探索Java文件读写更高效方式
    目录背景场景分析场景1:小文件单文件压缩方式1:网上流传(流传在坊间的神话,其实是带刺的玫瑰)方式2:使用缓冲区方式3:使用通道方式4:使用mmp场景2:大文件单文件压缩场景3:大文...
    99+
    2024-04-02
  • 利用java读取超大文件时出现内存溢出如何解决
    利用java读取超大文件时出现内存溢出如何解决?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。1. 传统方式:在内存中读取文件内容读取文件行的标准方式是在内存中读...
    99+
    2023-05-31
    java ava
  • java中如何读取文件?
    读取文件有多种方式,基于传统的输入流方式或基于nio的Buffer缓冲对象和管道读取方式甚至非常快速的内存映射读取文件。java中四种读取文件方式:(推荐:java视频教程)RandomAccessFile:随机读取,比较慢优点就是该类可读...
    99+
    2016-06-13
    java
  • java中如何读取文件
    java读取文件的两种方法:java.io和java.lang.ClassLoader// java.io: File file = new File("..."); FileInputStream fis = new...
    99+
    2019-09-20
    java基础 java
  • 一个简单的Java文件读取的进度条
    目录Java 文件读取的进度条运行截图相关代码简要说明Java 文件读取的进度条 最近在做一个小的软件,想使用一下文件读取的进度条,发现书上有一个例子,但是运行之后发现无法显示进度条...
    99+
    2023-05-14
    Java文件读取 Java文件读取进度条
  • 如何提高Android从文件中读取图像的效率
    本篇文章给大家分享的是有关如何提高Android从文件中读取图像的效率,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。方法一start_time = Syst...
    99+
    2023-05-31
    android roi %d
  • 如何用 Java 实现高效的文件读写操作
    1. 使用缓冲流 缓冲流是一种可以将数据临时存储在缓冲区中的流。当需要读写数据时,它会先将数据读入或写入缓冲区,然后再从缓冲区读出或写入文件。这样可以减少对文件的读写次数,从而提高文件读写效率。 import java.io.*; p...
    99+
    2024-02-26
    Java 文件读写 性能优化
  • java读取大文件内存溢出如何解决
    在Java中,如果读取大文件时遇到内存溢出的问题,可以尝试以下几种解决方案:1. 使用缓冲区:使用BufferedReader或者B...
    99+
    2023-08-25
    java
  • java读取大文件如何防止内存泄漏
    读取大文件时,可以使用以下方法来防止内存泄漏: 使用缓冲流:通过缓冲流(如BufferedReader)来读取文件,可以减少内存...
    99+
    2024-04-08
    java
  • 详解PHP如何读取大文件
    目录衡量成功我们有什么选择?逐行读取文件文件之间的管道其他流过滤器自定义流创建自定义协议和过滤器总结衡量成功 唯一能确认我们对代码所做改进是否有效的方式是:衡量一个糟糕的情况,然后对...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作