返回顶部
首页 > 资讯 > 后端开发 > Python >Python入门案例之找出文件中出现次数最多的10个单词
  • 451
分享到

Python入门案例之找出文件中出现次数最多的10个单词

Python 官方文档:入门教程 => 点击学习

摘要

目录语法概要代码最近有点需求,在看python的入门基础,看完入门基础之后,跟着练习,找到文件中出现次数最多的10个单词,以此熟悉语法。 语法概要 Mac电脑命令行输入python3

最近有点需求,在看python入门基础,看完入门基础之后,跟着练习,找到文件中出现次数最多的10个单词,以此熟悉语法。

语法概要

Mac电脑命令行输入python3,回车可以执行语句,exit()退出 Python3 xx.py可以执行文件。

  • 初始赋值,一般用None
  • 声明变量不需要任何多余,没有var/const巴拉巴拉
  • 语法用:表示一起,缩进表示嵌套关系
  • 字典就是对象,用dict()新建,注意dict({'a':1})必须要用引号括起来键
  • 字典获取值的时候,键必须存在不然会报错,一般用 xxDict.get('a',0)来获取,这样没有就赋值0,有就获取
  • 列表就是数组,用list()新建,注意不能获取超过list长度的索引,如果取局部的话xxList[0:10]这样就行
  • 元组,在js中没有,虽然ts中有,元组类似列表,但不能编辑,表示为(1,2),如果你的列表不需要编辑,就可以用元组替换
  • sorted可以排序的方法,排序数组、对象的key、元组,通常排序对象的时候,如果需要排序value的话,可以用sorted(([(v,k) for (k,v) in xxDict.items()]))快速得到排序后的元组列表,从大到小的话,第二参数加上reverse=True
  • 打开文件open(filepath),但返回值不是字符串,需要for line in open(filepath),拿到每行的文本
  • 字符串变成数组,用split,默认分隔符是空格
  • try: expect: 关键语句,记得捕获错误,需要的话退出程序quit()

代码

# 本文件是获取 任意文件里出现次数前10的Word
# 借此学习python的简单数据结构
# python3 xx.py 执行就可以
filename = input('文件的路径:')
# 这里用户输入的文件路径可能打不开,所以try下,如果出错,程序退出
try:
  # 打开文件,获取文件手柄
  handle = open(filename)
except:
  print('File Cannot be opened',filename)
  quit()

countDict = dict()
# 遍历文件的每行,line就是每行的字符串
for line in handle:
  # 空格为分隔符,得到每行的单词列表
  words = line.split()
  # 遍历每行的单词列表,word是每个单词
  for word in words:
    # 此行相当于,没有key的话,新建key取0,有的话返回
    countDict[word] = countDict.get(word,0) + 1
    # 等同于
    # # word没出现在dic的话,需要赋值,不然读的话会报错
    # if word not in countDict :
    #   countDict[word] = 0
    # # 处理完之后,都加1
    # countDict[word] = countDict[word] + 1
# 得到各单词出现的次数字典
# print(countDict)

# 最大出现的次数
biGCount = None
# 最大出现的次数对应的word
bigKey = None
# 遍历字典,key就是word,value就是次数
for word in countDict:
  count = countDict[word]
  # 注意None的情况和大于的情况都需要赋值
  if bigCount is None or count>bigCount:
      bigCount = count
      bigKey = word
# print(bigCount)
# print(bigKey)

# python的字典key必须是字符串包裹
# a = dict({'a':1,'b':2})
# items字典会返回元组列表 [('a', 1), ('b', 2)]
# print(a.items())


# sorted排序元组列表
# 将countDict变成元组列表,然后将k,v对调,变成新元组列表
sortList = sorted(([(count,word) for (word,count) in countDict.items()]),reverse=True)
# 等同于以下
# # 装(value,key)的list
# tempList = list()
# # 遍历countDict.items(),能同时获取key,value
# for (word,count) in countDict.items():
#   # key value调换下位置
#   newTuple = (count,word)
#   # 装进tempList
#   tempList.append(newTuple)
# # sorted 排序元组的时候,先按照元组的第一项排序,这边就是按照count排序,且从大到小
# sortList = sorted(tempList,reverse=True)
# 取前10
tenList = sortList[0:10]

# 还需要将key和value反转回来
resDict = dict()
for (count,word) in tenList:
  resDict[word] = count

print(resDict)

到此这篇关于Python入门案例之找出文件中出现次数最多的10个单词的文章就介绍到这了,更多相关Python找出文件出现次数最多单词内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python入门案例之找出文件中出现次数最多的10个单词

本文链接: https://lsjlt.com/news/193775.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python入门案例之找出文件中出现次数最多的10个单词
    目录语法概要代码最近有点需求,在看python的入门基础,看完入门基础之后,跟着练习,找到文件中出现次数最多的10个单词,以此熟悉语法。 语法概要 mac电脑命令行输入python3...
    99+
    2023-02-01
    Python找出文件出现次数最多单词 Python找出文件单词 Python 文件 单词
  • Java统计英文句子中出现次数最多的单词并计算出现次数的方法
    本文实例讲述了Java统计英文句子中出现次数最多的单词并计算出现次数的方法。分享给大家供大家参考,具体如下:import java.util.*;public class CountWord { public static String[]...
    99+
    2023-05-30
  • python如何找出列表中出现最多次数的元素
    小编给大家分享一下python如何找出列表中出现最多次数的元素,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!找出列表中出现最多次数的元素list1 = [6, 1, 3, ...
    99+
    2023-06-27
  • Python中如何找出序列中出现次数最多的元素
    Python中如何找出序列中出现次数最多的元素,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。前言:有一个元素序列,想知道在序列中出现次数最多的元素是什么?col...
    99+
    2023-06-02
  • python如何查找列表中出现次数最多的数字
    小编给大家分享一下python如何查找列表中出现次数最多的数字,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!查找列表中出现次数最多的数字[1, 2, 3, 4, ...
    99+
    2023-06-26
  • 怎么用Python找出文本中每个字母出现的次数
    这篇文章主要介绍“怎么用Python找出文本中每个字母出现的次数”,在日常操作中,相信很多人在怎么用Python找出文本中每个字母出现的次数问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”怎么用Python找出...
    99+
    2023-06-04
  • 怎么用vbs计算某个词在日志文件中的出现次数
    本篇内容介绍了“怎么用vbs计算某个词在日志文件中的出现次数”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!复制代码 代码如下:Const&n...
    99+
    2023-06-08
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作