返回顶部
首页 > 资讯 > 后端开发 > Python >python大ip文件排重
  • 738
分享到

python大ip文件排重

文件pythonip 2023-01-31 01:01:25 738人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

1 需求:整理个IP列表,需要将IP去重下,统计一共多少来源本来想直接shell命令解决,简单的 sort 管道 uniq  然后wc下无奈文件太大,条数多,处理效率不堪文件大概5G,几亿条数据吧2 PLAN A  未遂 shell处理: 

1 需求:

整理个IP列表,需要将IP去重下,统计一共多少来源

本来想直接shell命令解决,简单的 sort 管道 uniq  然后wc下

无奈文件太大,条数多,处理效率不堪

文件大概5G,几亿条数据吧

image.png


2 PLAN A  未遂

 shell处理:

 #time sort ip | uniq | wc -l

然后没啥反应了。。。。 其实是在处理中,最后被我ctrl c了

image.png


3 PLAN B

没办法写个简单的python,用列表的排重特性(需要注意文件读取的方法,不要将文件一次全部读取到内存。。。):

#! /usr/bin/env Python 
d={}
with open('ip', 'rb') as f:
    for line in f:
        d[line] = 'ip'
print  len(d)
time python read.py

然后就很快结束了:

image.png


4 结束

简单看下资源消耗情况:


image.png



优势还是挺明显的,以小见大吧,希望python可以帮助大家解决工作中的实际问题,不论大小。



--结束END--

本文标题: python大ip文件排重

本文链接: https://lsjlt.com/news/183258.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • python大ip文件排重
    1 需求:整理个IP列表,需要将IP去重下,统计一共多少来源本来想直接shell命令解决,简单的 sort 管道 uniq  然后wc下无奈文件太大,条数多,处理效率不堪文件大概5G,几亿条数据吧2 PLAN A  未遂 shell处理: ...
    99+
    2023-01-31
    文件 python ip
  • Python 读取大文件
    在处理大数据时,有可能会碰到好几个 G 大小的文件。如果通过一些工具(例如:NotePad++)打开它,会发生错误,无法读取任何内容。 那么,在 Python 中,如何快速地读取这些大文件呢? | 版权声明:一去、二三里,未经博...
    99+
    2023-01-31
    大文件 Python
  • python读取大文件
    python读取文件对各列进行索引 可以用readlines, 也可以用readline, 如果是大文件一般就用readlined={} a_in = open("testfile.txt", "r") for line in a_in...
    99+
    2023-01-31
    大文件 python
  • linux查找大文件并排序的命令
    本篇内容介绍了“linux查找大文件并排序的命令”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!find . -type&...
    99+
    2023-06-19
  • django+python大文件上传
    大文件上传服务一、前端[webuploader](http://fex.baidu.com/webuploader/ ''webuploader'')二、后端django 2.0.0这里只贴出核心的代码:前端的: <!DOCTYPE ...
    99+
    2023-01-31
    大文件 上传 django
  • Python读取大文件(GB)
    最近处理文本文档时(文件约2GB大小),出现memoryError错误和文件读取太慢的问题,后来找到了两种比较快Large File Reading 的方法,本文将介绍这两种读取方法。 Preliminary   我们谈到“...
    99+
    2023-01-31
    大文件 Python GB
  • 华为OD机试 - 报文重排序(Java & JS & Python)
    题目描述 对报文进行重传和重排序是常用的可靠性机制,重传缓中区内有一定数量的子报文,每个子报文在原始报文中的顺序已知,现在需要恢复出原始报文。 输入描述 输入第一行为N,表示子报文的个数,0 <N ≤ 1000。 输入第二行为N个子报文,...
    99+
    2023-09-09
    算法 华为机试 Java JavaScript Python
  • 修改oracle重做日志文件大小
    创建3个新的日志组SQL> ALTER DATABASE ADD LOGFILE GROUP 4 ('/u01/app/oracle/oradata/orcl/redo06.log') SI...
    99+
    2024-04-02
  • python如何重命名文件
    这篇文章将为大家详细讲解有关python如何重命名文件,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。python重命名文件的方法:首先创建一个python示例文件;然后通过if判断文件是否是文件夹;最后通...
    99+
    2023-06-06
  • python怎样重命名文件
    这篇“python怎样重命名文件”文章,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要参考一下,对于“python怎样重命名文件”,小编整理了以下知识点,请大家跟着小编的步伐一步一步的慢慢理解,接下来就让我们进入主题...
    99+
    2023-06-06
  • python怎么重命名文件
    在python中,可以利用os包的rename()函数来重命名文件(目录),语法“os.rename(src_path,dst_path)”,可将src_path的文件重命名为dst_path。因为rename()是os包提供的一个函数,想...
    99+
    2023-05-14
    python
  • python打开大文件整理
    python中读取文件最常用的方式是: for line in open('myfile','r').readlines(): do_something(line) When this is done, however...
    99+
    2023-01-31
    大文件 python
  • python怎么读取大文件
    这篇文章主要介绍“python怎么读取大文件”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“python怎么读取大文件”文章能帮助大家解决问题。可以通过两种方法利用python读取大文件:第一种是利用...
    99+
    2023-06-30
  • Python实现文件及文件夹操作大全
    目录一、文件操作1.1 文件常规操作1.2 文件读写1.3 文件相关属性访问二、文件夹操作2.1 文件夹常规操作2.2 遍历文件夹2.3 文件夹相关属性访问三、其他相关操作3.1 工...
    99+
    2024-04-02
  • python怎么重命名文件夹
    使用python重命名文件夹的方法:os.rename()函数,用于命名文件或目录。在python中使用os.rename()函数重命名文件夹:os.rename()函数:python中os.rename()函数的作用是用于命名文件或目录。...
    99+
    2024-04-02
  • 如何实现Python文件去重
    这篇文章将为大家详细讲解有关如何实现Python文件去重,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。代码ing导出的文件都是保存在同一文件夹下的,格式也相同。然后,上网查了下 filecmp.cmp()...
    99+
    2023-06-20
  • 用Python实现大文本文件切割
    在实际工作中,有些场景下,因为产品既有功能限制,不支持特大文件的直接处理,需要把大文件进行切割处理。 当然可以通过UltraEdit编辑工具,或者从网上下载一些文件切割器之类的。但这些要么手工操作太麻烦,要么不能满足自定义需求。 而且,对...
    99+
    2023-01-31
    文本文件 Python
  • Go语言LeetCode题解937重新排列日志文件
    目录一 题目描述二 分析三 答案一 题目描述 937. 重新排列日志文件 - 力扣(LeetCode) (leetcode-cn.com) 给你一个日志数组 logs。每条日志都...
    99+
    2022-12-28
    Go语言重新排列日志文件 Go语言LeetCode题解
  • python 中yaml文件用法大全
    yaml简单介绍 YAML是一种标记语言,它使用空白符号缩进和大量依赖外观的特色,特别适合用来表达或编辑数据结构、各种配置文件、倾印调试内容、文件大纲。 大小写敏感 使用缩进表示层级关系 缩...
    99+
    2022-06-02
    python 中yaml文件用法 python yaml文件
  • python如何获得文件大小
    使用python获取文件大小的方法:1.新建python项目;2.导入os模块;3.使用os.stat()函数创建文件对象;4.使用st_size函数获取文件大小;具体步骤如下:首先,打开python,并新建一个python项目;pytho...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作