Python 官方文档:入门教程 => 点击学习
目录语法概要代码最近有点需求,在看python的入门基础,看完入门基础之后,跟着练习,找到文件中出现次数最多的10个单词,以此熟悉语法。 语法概要 Mac电脑命令行输入python3
最近有点需求,在看python的入门基础,看完入门基础之后,跟着练习,找到文件中出现次数最多的10个单词,以此熟悉语法。
Mac电脑命令行输入python3
,回车可以执行语句,exit()
退出 Python3 xx.py
可以执行文件。
None
var
/const
巴拉巴拉:
表示一起,缩进
表示嵌套关系dict()
新建,注意dict({'a':1})
必须要用引号括起来键xxDict.get('a',0)
来获取,这样没有就赋值0,有就获取list()
新建,注意不能获取超过list长度的索引,如果取局部的话xxList[0:10]
这样就行(1,2)
,如果你的列表不需要编辑,就可以用元组替换sorted(([(v,k) for (k,v) in xxDict.items()]))
快速得到排序后的元组列表,从大到小的话,第二参数加上reverse=True
open(filepath)
,但返回值不是字符串,需要for line in open(filepath)
,拿到每行的文本split
,默认分隔符是空格try: expect:
关键语句,记得捕获错误,需要的话退出程序quit()
# 本文件是获取 任意文件里出现次数前10的Word
# 借此学习python的简单数据结构
# python3 xx.py 执行就可以
filename = input('文件的路径:')
# 这里用户输入的文件路径可能打不开,所以try下,如果出错,程序退出
try:
# 打开文件,获取文件手柄
handle = open(filename)
except:
print('File Cannot be opened',filename)
quit()
countDict = dict()
# 遍历文件的每行,line就是每行的字符串
for line in handle:
# 空格为分隔符,得到每行的单词列表
words = line.split()
# 遍历每行的单词列表,word是每个单词
for word in words:
# 此行相当于,没有key的话,新建key取0,有的话返回
countDict[word] = countDict.get(word,0) + 1
# 等同于
# # word没出现在dic的话,需要赋值,不然读的话会报错
# if word not in countDict :
# countDict[word] = 0
# # 处理完之后,都加1
# countDict[word] = countDict[word] + 1
# 得到各单词出现的次数字典
# print(countDict)
# 最大出现的次数
biGCount = None
# 最大出现的次数对应的word
bigKey = None
# 遍历字典,key就是word,value就是次数
for word in countDict:
count = countDict[word]
# 注意None的情况和大于的情况都需要赋值
if bigCount is None or count>bigCount:
bigCount = count
bigKey = word
# print(bigCount)
# print(bigKey)
# python的字典key必须是字符串包裹
# a = dict({'a':1,'b':2})
# items字典会返回元组列表 [('a', 1), ('b', 2)]
# print(a.items())
# sorted排序元组列表
# 将countDict变成元组列表,然后将k,v对调,变成新元组列表
sortList = sorted(([(count,word) for (word,count) in countDict.items()]),reverse=True)
# 等同于以下
# # 装(value,key)的list
# tempList = list()
# # 遍历countDict.items(),能同时获取key,value
# for (word,count) in countDict.items():
# # key value调换下位置
# newTuple = (count,word)
# # 装进tempList
# tempList.append(newTuple)
# # sorted 排序元组的时候,先按照元组的第一项排序,这边就是按照count排序,且从大到小
# sortList = sorted(tempList,reverse=True)
# 取前10
tenList = sortList[0:10]
# 还需要将key和value反转回来
resDict = dict()
for (count,word) in tenList:
resDict[word] = count
print(resDict)
到此这篇关于Python入门案例之找出文件中出现次数最多的10个单词的文章就介绍到这了,更多相关Python找出文件出现次数最多单词内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!
--结束END--
本文标题: Python入门案例之找出文件中出现次数最多的10个单词
本文链接: https://lsjlt.com/news/193775.html(转载时请注明来源链接)
有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341
2024-03-01
2024-03-01
2024-03-01
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
2024-02-29
回答
回答
回答
回答
回答
回答
回答
回答
回答
回答
0