python统计前十出现最多的词

最多前十 python 2023-01-31 05:01:22 764人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

一、描述这是一道python面试题： “一个可读文件，有一万行，一行只有一个单词，单词可以重复的，求出这一万行中出现频繁次数最多的前10个单词”二、思路先读取文件变为列表，再用集合去重得到一个参照的列表，逆排

一、描述

这是一道python面试题：

“一个可读文件，有一万行，一行只有一个单词，单词可以重复的，求出这一万行中出现频繁次数最多的前10个单词”

二、思路

先读取文件变为列表，再用集合去重得到一个参照的列表，逆排序取前10（最大即最多的的10个元素），再用参照列表中的每个元素从文件中去统计，把参照列表中的元素作为键，统计到的结果为值，放入字典，打印出来。

三、代码

#!/usr/bin/Python
#coding:utf-8
all_C = []
with open("Words.txt",'r') as f:
    for line in f.readlines():
        all_C.append(line)
#获取无重复元素
all_set=set(sorted(all_C))
#统计为字典
counts={}
for key in all_set:
     counts[key] = all_C.count(key)
#获取前10个元素的个数变为列表
tens = sorted(counts.values(),reverse=True)[0:11]
print tens
#统计最终前十的元素及出现次数
tendict = {}
for k in counts.keys():
    if counts[k] in tens:
        tendict.setdefault(counts[k],k.strip("\n"))
print("出现最多的10个词为:%s \n") %tendict

#python tens.py

如图：

练习的文件类似如下10001行，以文件的方式读取还是很快的：

参考其他人代码二：

#!/usr/bin/python
#coding:utf-8
result= {}
with open("words.txt",'r') as fopen:
    fopen.seek(0,2)
    all = fopen.tell()
    fopen.seek(0,0)
    while fopen.tell() < all:
        lines = fopen.readline().strip()
        if lines in result:
            result[lines] += 1
        else:
            result[lines] = 1
print(sorted(result.items(),key=lambda k:k[1],reverse=True)[:11])

执行结果如图：

总结：

自己写的有点lower完全是练习，方法二高大上！还有更好的方法吗？

您可能感兴趣的文档:

--结束END--

本文标题: python统计前十出现最多的词

本文链接: https://lsjlt.com/news/188676.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

python统计前十出现最多的词

一、描述这是一道python面试题： “一个可读文件，有一万行，一行只有一个单词，单词可以重复的，求出这一万行中出现频繁次数最多的前10个单词”二、思路先读取文件变为列表，再用集合去重得到一个参照的列表，逆排...

99+

2023-01-31

最多前十 python
awk脚本统计一组单词中字母出现最多最少频率

目录字母计数打印相对频率最后的完整程序编写一个 awk 脚本来找到一组单词中出现次数最多（和最少）的单词。近一段时间，我开始编写一个小游戏，在这个小游戏里，玩家使用一个个字母块来组成单词。编写这个游戏之前，我需要先知道...

99+

2022-06-05

awk脚本统计字母频率 awk脚本统计
Java统计英文句子中出现次数最多的单词并计算出现次数的方法

本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法。分享给大家供大家参考，具体如下：import java.util.*;public class CountWord { public static String[]...

99+

2023-05-30
Python实现词云图词频统计

目录一：安装必要的库二：数据分析条形图可视化三：数据分析词频统计词云图可视化一：安装必要的库导入必要的库 import collections # 词频统计库 import...

99+

2022-12-26

Python词云图词频统计 Python词云图 Python 词频统计
python中文分词+词频统计的实现步骤

目录前言一、文本导入二、使用步骤1.引入库2.读入数据3.取出停用词表4.分词并去停用词（此时可以直接利用python原有的函数进行词频统计）5. 输出分词并去停用词的有用...

99+

2024-04-02
python如何统计字符串每个单词出现的次数

这篇文章主要介绍python如何统计字符串每个单词出现的次数，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！统计字符串每个单词出现的次数。def word_amount(se...

99+

2024-04-02
Python入门案例之找出文件中出现次数最多的10个单词

目录语法概要代码最近有点需求，在看python的入门基础，看完入门基础之后，跟着练习，找到文件中出现次数最多的10个单词，以此熟悉语法。语法概要 mac电脑命令行输入python3...

99+

2023-02-01

Python找出文件出现次数最多单词 Python找出文件单词 Python 文件单词
python中文分词和词频统计如何实现

这篇文章主要介绍“python中文分词和词频统计如何实现”，在日常操作中，相信很多人在python中文分词和词频统计如何实现问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”python中文分词和词频统计如何实现...

99+

2023-07-02
统计numpy数组中最频繁出现的值

arr = np.array([[1,2,100,4,5,6],[1,1,100,3,5,5],[2,2,4,4,6,6]]) 方法一： count = np.bincount(arr[:,2]) # 找出第3列最频繁出现的值 v...

99+

2023-01-30

组中频繁 numpy
awk统计文件中某关键词出现次数的命令

awk -F "" '{for(i=1;i<=NF;++i) if($i=="a") ++sum}END{print sum}' test.c[root@xiaobb 5906]# awk '{for...

99+

2022-06-04

关键词命令次数
python实现简单中文词频统计示例

本文介绍了python实现简单中文词频统计示例，分享给大家，具体如下：任务简单统计一个小说中哪些个汉字出现的频率最高知识点 1.文件操作 2.字典 3.排序 4.lambda 代码 import...

99+

2022-06-04

词频示例中文
如何利用python实现词频统计功能

目录功能要求方法如下运行结果总结功能要求这是我们老师的作业代码中都有注释要求词频统计软件： 1）从文本中读入数据：（文件的输入输出） 2）不区分大小写,去除特殊字符。 3）&...

99+

2024-04-02
Python词频统计的方法有哪些

这篇文章将为大家详细讲解有关Python词频统计的方法有哪些，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。统计文件里每个单词的个数思路：分别统计文档中的单词，与出现的次数用两个列表将其保存起来，最后再用z...

99+

2023-06-21
Python统计词频的方法有哪些

本文小编为大家详细介绍“Python统计词频的方法有哪些”，内容详细，步骤清晰，细节处理妥当，希望这篇“Python统计词频的方法有哪些”文章能帮助大家解决疑惑，下面跟着小编的思路慢慢深入，一起来学习新知识吧。方法一：运用集合去重方法&nb...

99+

2023-07-05
python如何统计在可迭代器中最常出现的元素

小编给大家分享一下python如何统计在可迭代器中最常出现的元素，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！统计在可迭代器中最常出现的元素>>> A ...

99+

2024-04-02
教你JavaScript利用charAt()统计出现次数最多的字符和次数

之前给大家介绍过简介JavaScript中charAt()方法的使用，今天通过本文给大家分享js统计次数最多的字符和次数的实例代码，具体内容如下所示：判断一个字符串'aabcdob...

99+

2024-04-02
Python jieba中文分词与词频统计的操作案例

这篇文章给大家分享的是有关Python jieba中文分词与词频统计的操作案例的内容。小编觉得挺实用的，因此分享给大家做个参考，一起跟随小编过来看看吧。Python主要用来做什么Python主要应用于：1、Web开发；2、数据科学研究；3、...

99+

2023-06-08
tr命令在统计英文单词出现频率中的妙用

tr命令我们很清楚，可以删除替换，删除字符串。在英文中我们要经常会经常统计英文中出现的频率，如果用常规的方法，用设定计算器一个个算比较费事，这个时候使用tr命令，将空格分割替换为换行符，再用tr命令删除掉有的单词后面的...

99+

2022-06-04

tr命令统计单词出现频率 tr命令在统计英文单词出现频率中的妙用
批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)

请问批处理可以统计词频吗？ 4字一行，只统计4字词组出现的频率。如：一丘之貉一丝不挂一丝不苟一事无成一亲对老一分身又一叶知秋一叶知秋一叶障目一叶障目一往无前...

99+

2024-04-02
Python统计词频的几种方法小结

目录方法一：运用集合去重方法方法二：运用字典统计方法三：使用计数器本文介绍python统计词频的几种方法，供大家参考方法一：运用集合去重方法 def word_count1(wo...

99+

2023-03-01

Python统计词频 Python 文本词频统计