首页 > 资讯 > 后端开发 > Python >Python中jieba库如何使用

732

分享到

Python中jieba库如何使用

2023-07-05 08:07:56 732人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要介绍“python中jieba库如何使用”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“Python中jieba库如何使用”文章能帮助大家解决问题。一、jieba库基本介绍(1)jieba

这篇文章主要介绍“python中jieba库如何使用”的相关知识，小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“Python中jieba库如何使用”文章能帮助大家解决问题。

一、jieba库基本介绍

(1)jieba库概述

① jieba是优秀的中文分词第三方库

②中文文本需要通过分词获得单个的词语③ jieba是优秀的中文分词第三方库，需要额外安装

④jieba库提供三种分词模式，最简单只需掌握一个函数

(2)jieba分词的原理

①分词依靠中文词库

② 利用一个中文词库，确定汉字之间的关联概率

③ 汉字间概率大的组成词组，形成分词结果

④ 除了分词，用户还可以添加自定义的词组

二、jieba库使用说明

(1)jieba分词的三种模式

精确模式、全模式、搜索引擎模式

① jieba.cut(s) 精确模式：把文本精确的切分开，不存在冗余单词:

Python中jieba库如何使用

② jieba.lcut(s,cut_all=True) 全模式：把文本中所有可能的词语都扫描出来，有冗余:

Python中jieba库如何使用

③jieba.lcut_for_search(s) 搜索引擎模式：在精确模式基础上，对长词再次切分:

Python中jieba库如何使用

三：jieba库的安装

因为 jieba 是一个第三方库，所有需要我们在本地进行安装：

ⅠIDLE中jieba库的安装：

windows 下使用命令安装：在联网状态下，在命令行下输入 pip

install jieba 进行安装，安装完成后会提示安装成功。具体过程如图：

① Win + r 打开运行框并输入cmd打开指令框：

Python中jieba库如何使用

②在指令框输入“pip install jieba”并按下回车等待下载：

Python中jieba库如何使用

③ 当出现“Successfully instll”，则表示安装成功！

Ⅱ PyCharm中jieba库的安装：

打开 settings，搜索 Project Interpreter，在右边的窗口选择 + 号，点击后在搜索框搜索 jieba，点击安装即可。具体过程如图：

① 点击左上角Files中的Settings：

Python中jieba库如何使用

② [endif]找到“Project”中的“python interpreter”，并点击其中的“+”：

Python中jieba库如何使用

③在搜索栏中搜索“jieba”，并点击左下角Install Package：

Python中jieba库如何使用

④ 当出现“Successfully instll

jieba”，则表示jieba库安装成功！

四：实例-文本词频统计

Jieba库最强大的功能之一就是对文章出现的词汇进行计数统计，即计算词频，对于一篇文章或者一部著作，我们可以通过以下步骤对出现的单词进行统计：

Python中jieba库如何使用

源代码：

Python中jieba库如何使用

注：

① encoding=’ANSI’:将打开的文本格式设为ANSI形式

② read(size):方法从文件当前位置起读取size个字节，若无参数size，则表示读取至文件结束为止，它范围为字符串对象。

③items

= list（counts.items）:将counts中的元素存入items表格中。

④ key = lambda x:x[1]:等价于 def func(x):

return x[1]

⑤ reverse = True：列表反转排序，不写reverse = True 就是列表升序排列，括号里面加上reverse =True 就是降序排列！

⑥ {0:<10}{1:>5}:<表示左对齐，>表示右对齐，数字表示宽度,<10表示左对齐，并占10个位置，>5表示右对齐，占5个位置。

运行结果：

Python中jieba库如何使用

如上运行结果有两个不足之处，一是词汇中出现了“却说”、“丞相”、“二人”等人名以外的单词，我们需要把这些单词去除；二是“孔明”与“孔明说”、“曹操”与“丞相”等的是同一人，我们需要把它们合并同类项，将代码进行优化后，我们得到：

运行结果：

Python中jieba库如何使用

相对于第一个程序，这个程序更为严谨与完整，已经得到了大致得到所需结果，但它还没有完全解决排除非人名这一问题，所以在该基础之上继续使用排除人名的方法去完善这一程序。

关于“Python中jieba库如何使用”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识，可以关注编程网Python频道，小编每天都会为大家更新不同的知识点。

您可能感兴趣的文档:

--结束END--

本文标题: Python中jieba库如何使用

本文链接: https://lsjlt.com/news/350540.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Python中jieba库如何使用

一、jieba库基本介绍

(1)jieba库概述

(2)jieba分词的原理

二、jieba库使用说明

(1)jieba分词的三种模式

三：jieba库的安装

ⅠIDLE中jieba库的安装：

Ⅱ PyCharm中jieba库的安装：

四：实例-文本词频统计

Python中jieba库如何使用

如何在python中使用jieba库

Python中jieba库的使用方法

关于Python中jieba库的使用

python如何安装jieba库

Python中jieba库的介绍与使用

python之jieba分词库使用

python中jieba库(中文分词库)使用安装教程

python 中的jieba分词库

python中jieba模块怎么使用

Python中文分词库jieba(结巴分词)详细使用介绍

jieba库的使用方法是什么

jieba安装库后无法调用如何解决

使用jieba库要注意哪些事项

Python中如何使用Itertools库

Python中如何使用ChatOps库

Python中如何使用NumPy库？

python中如何使用numpy库

python中如何使用Matplotlib库

Python第三方库jieba库与中文分词全面详解

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义