首页 > 资讯 > 后端开发 > Python >python对大文件的增量读取

128

分享到

python对大文件的增量读取

增量大文件 python 2023-01-31 05:01:40 128人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

欢迎关注我的豆瓣Http://www.douban.com/note/484517776/ 对于很多大文件的增量读取，如果遍历每一行比对历史记录的输钱或者全都加载到内存通过历史记录的索引查找，是非常浪费资源的，网上有很多人的技术博客都是写

欢迎关注我的豆瓣Http://www.douban.com/note/484517776/

对于很多大文件的增量读取，如果遍历每一行比对历史记录的输钱或者全都加载到内存通过历史记录的索引查找，是非常浪费资源的，网上有很多人的技术博客都是写的用for循环readline以及一个计数器去增量读取，这样是十分脑残的，假如文件很大，遍历一次太久。
我们需要了解获取文件句柄的基本理论，其中包含的指针操作等。
原理是这样子，linux的文件描述符的struct里有一个f_pos的这么个属性，里面存着文件当前读取位置，通过这个东东经过vfs的一系列映射就会得到硬盘存储的位置了，所以很直接，很快。
以下是利用python实战代码,核心函数tell(),seek(). 也是调用的系统调用seek tell

seek()的三种模式：

（1）f.seek(p,0) 移动当文件第p个字节处，绝对位置

（2）f.seek(p,1) 移动到相对于当前位置之后的p个字节

（3）f.seek(p,2) 移动到相对文章尾之后的p个字节

tell()：
返回当前文件的读取位置。
代码：
#!/usr/bin/Python
fd=open("test.txt",'r') #获得一个句柄
for i in xrange(1,3): #读取三行数据
fd.readline()
label=fd.tell() #记录读取到的位置
fd.close() #关闭文件
#再次阅读文件
fd=open("test.txt",'r') #获得一个句柄
fd.seek(label,0)# 把文件读取指针移动到之前记录的位置
fd.readline() #接着上次的位置继续向下读取

后续：今儿有一人问我如何得知这个大文件行数，以及变化，我的想法是
方法1：
可以去遍历'\n'字符。
方法2：
从一开始就用for循环fd.readline()进行计数，然后变化的部分（用上文说的seek、tell函数做）再用for循环fd.readline()进行统计增加行数。

您可能感兴趣的文档:

--结束END--

本文标题: python对大文件的增量读取

本文链接: https://lsjlt.com/news/188716.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

python对大文件的增量读取

python对大文件的增量读取

Python 读取大文件

python读取大文件

Python读取大文件(GB)

强悍的 Python —— 读取大文件

python怎么读取大文件

python之批量读取文件

Python按行读取文件的实现方法【小文件和大文件读取】

怎么中python读取大文件

如何使用Python读取大数据中的对象文件？

Python读取大量Excel文件并跨文件批量计算平均值的方法

python简单读取大文件的方法

Python实现读取大量Excel文件并跨文件批量计算平均值

python如何流式读取大文件

python文件的读取

python怎么批量读取dat文件

python怎么批量读取文件名

Golang文件读取操作：快速读取大文件的技巧

python大批量读写.doc文件的解决

【Python】json文件的读取

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义