返回顶部
首页 > 资讯 > 后端开发 > Python >Python中jieba库如何使用
  • 732
分享到

Python中jieba库如何使用

2023-07-05 08:07:56 732人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍“python中jieba库如何使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python中jieba库如何使用”文章能帮助大家解决问题。一、jieba库基本介绍(1)jieba

这篇文章主要介绍“python中jieba库如何使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python中jieba库如何使用”文章能帮助大家解决问题。

    一、jieba库基本介绍

    (1)jieba库概述

    ① jieba是优秀的中文分词第三方库

    ②中文文本需要通过分词获得单个的词语③ jieba是优秀的中文分词第三方库,需要额外安装           

    ④jieba库提供三种分词模式,最简单只需掌握一个函数

     (2)jieba分词的原理

    ①分词依靠中文词库

    ②  利用一个中文词库,确定汉字之间的关联概率

    ③ 汉字间概率大的组成词组,形成分词结果

    ④ 除了分词,用户还可以添加自定义的词组

    二、jieba库使用说明

     (1)jieba分词的三种模式

    精确模式、全模式、搜索引擎模式

    ①  jieba.cut(s) 精确模式:把文本精确的切分开,不存在冗余单词:

    Python中jieba库如何使用

    Python中jieba库如何使用

    ② jieba.lcut(s,cut_all=True) 全模式:把文本中所有可能的词语都扫描出来,有冗余:

    Python中jieba库如何使用

    Python中jieba库如何使用

    ③jieba.lcut_for_search(s) 搜索引擎模式:在精确模式基础上,对长词再次切分:

    Python中jieba库如何使用

    Python中jieba库如何使用

    三:jieba库的安装

    因为 jieba 是一个第三方库,所有需要我们在本地进行安装:

    ⅠIDLE中jieba库的安装:

    windows 下使用命令安装:在联网状态下,在命令行下输入 pip

    install jieba 进行安装,安装完成后会提示安装成功。具体过程如图:

    ①  Win + r 打开运行框并输入cmd打开指令框:

    Python中jieba库如何使用

    ②在指令框输入“pip install jieba”并按下回车等待下载:

    Python中jieba库如何使用

    Python中jieba库如何使用

    ③ 当出现“Successfully instll”,则表示安装成功!

    PyCharm中jieba库的安装:

    打开 settings,搜索 Project Interpreter,在右边的窗口选择 + 号,点击后在搜索框搜索 jieba,点击安装即可。具体过程如图:

    ①  点击左上角Files中的Settings:

    Python中jieba库如何使用

    ②  [endif]找到“Project”中的“python interpreter”,并点击其中的“+”:

    Python中jieba库如何使用

    ③在搜索栏中搜索“jieba”,并点击左下角Install Package:

    Python中jieba库如何使用

    ④ 当出现“Successfully instll

    jieba”,则表示jieba库安装成功!

    四:实例-文本词频统计

    Jieba库最强大的功能之一就是对文章出现的词汇进行计数统计,即计算词频,对于一篇文章或者一部著作,我们可以通过以下步骤对出现的单词进行统计:

    Python中jieba库如何使用

    源代码:

    Python中jieba库如何使用

    注:

    ①  encoding=’ANSI’:将打开的文本格式设为ANSI形式

    ②  read(size):方法从文件当前位置起读取size个字节,若无参数size,则表示读取至文件结束为止,它范围为字符串对象。

    ③items

    = list(counts.items):将counts中的元素存入items表格中。

    ④  key = lambda x:x[1]:等价于 def func(x):

     return x[1]

    ⑤ reverse = True:列表反转排序,不写reverse = True 就是列表升序排列,括号里面加上reverse =True 就是降序排列!

    ⑥  {0:<10}{1:>5}:<表示左对齐,>表示右对齐,数字表示宽度,<10表示左对齐,并占10个位置,>5表示右对齐,占5个位置。

    运行结果:

    Python中jieba库如何使用

    如上运行结果有两个不足之处,一是词汇中出现了“却说”、“丞相”、“二人”等人名以外的单词,我们需要把这些单词去除;二是“孔明”与“孔明说”、“曹操”与“丞相”等的是同一人,我们需要把它们合并同类项,将代码进行优化后,我们得到:

    运行结果:

    Python中jieba库如何使用

    Python中jieba库如何使用

    相对于第一个程序,这个程序更为严谨与完整,已经得到了大致得到所需结果,但它还没有完全解决排除非人名这一问题,所以在该基础之上继续使用排除人名的方法去完善这一程序。

    关于“Python中jieba库如何使用”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网Python频道,小编每天都会为大家更新不同的知识点。

    --结束END--

    本文标题: Python中jieba库如何使用

    本文链接: https://lsjlt.com/news/350540.html(转载时请注明来源链接)

    有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

    猜你喜欢
    • Python中jieba库如何使用
      这篇文章主要介绍“Python中jieba库如何使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python中jieba库如何使用”文章能帮助大家解决问题。一、jieba库基本介绍(1)jieba...
      99+
      2023-07-05
    • 如何在python中使用jieba库
      这篇文章将为大家详细讲解有关如何在python中使用jieba库,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。python可以做什么Python是一种编程语言,内置了许多有效的工具,Pyth...
      99+
      2023-06-07
    • Python中jieba库的使用方法
      目录一、jieba库的安装二、jieba三种模式的使用三、jieba 分词简单应用四、扩展:英文单词统计jieba库是一款优秀的 Python 第三方中文分词库,jieba 支持三种分词模式:精确模式、全模式和搜索引...
      99+
      2022-06-02
      Python jieba库
    • 关于Python中jieba库的使用
      目录jieba库概述jieba 库演示在 PyCharm 中添加 jieba 库使用jieba 库第三方库jieba库概述 jieba 库演示 对于一段英文文本, 例如 &ldquo...
      99+
      2023-05-15
      Python jieba jieba库
    • python如何安装jieba库
      python安装jieba库的方法:1、打开运行窗口输入“cmd”进入命令行窗口;2、输入“pip install jieba”命令来安装jieba库;3、安装成功后,在python编辑器中输入“import jieba”命令判断jieba...
      99+
      2024-04-02
    • Python中jieba库的介绍与使用
      目录前言:目录:一、jieba库基本介绍(1)jieba库概述 (2)jieba分词的原理二、jieba库使用说明 (1)jieba分词的三种模式三:jieba库...
      99+
      2023-03-02
      Python中jieba库使用 Python中jieba库
    • python之jieba分词库使用
      目录 一. 介绍A. 什么是jieba库B. jieba库的特点和优势C. 安装jieba库 二. 分词基础A. 字典加载B. 分词模式C. 使用示例 三. 自定义词典A. 添...
      99+
      2023-10-11
      python jieba
    • python中jieba库(中文分词库)使用安装教程
      目录python中jieba库(中文分词库)使用安装教程介绍安装功能分词自定义词典关键词提取词性标注补充:Python中文分词库——jieba的用法.使用说明...
      99+
      2023-05-17
      python中jieba库使用 Python中文分词库jieba jieba库用法
    • python 中的jieba分词库
      目录1、jieba库安装2、jieba库功能介绍3、案例3.1、精确模式3.2、全模式3.3、搜索引擎模式3.4、修改词典3.5、词性标注3.6、统计三国演义中人物出场的次数jieb...
      99+
      2024-04-02
    • python中jieba模块怎么使用
      这篇文章主要介绍“python中jieba模块怎么使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“python中jieba模块怎么使用”文章能帮助大家解决问题。一、前言    ...
      99+
      2023-07-02
    • Python中文分词库jieba(结巴分词)详细使用介绍
      一,jieba的介绍 jieba 是目前表现较为不错的 Python 中文分词组件,它主要有以下特性: 支持四种分词模式: 精确模式全模式搜索引擎模式paddle模式支持繁体分词支持...
      99+
      2024-04-02
    • jieba库的使用方法是什么
      jieba库是一个中文分词库,可以用于对中文文本进行分词。使用jieba库的方法如下: 安装jieba库:在命令行中使用pip安...
      99+
      2024-04-02
    • jieba安装库后无法调用如何解决
      如果安装了jieba库后无法调用,可能是因为没有正确安装或者环境变量设置不正确。以下是一些可能的解决方法: 确保已经正确安装了ji...
      99+
      2024-04-02
    • 使用jieba库要注意哪些事项
      确保安装了jieba库:首先要确保已经安装了jieba库,可以使用pip install jieba命令进行安装。 导入ji...
      99+
      2024-04-02
    • Python中如何使用Itertools库
      这篇文章将为大家详细讲解有关Python中如何使用Itertools库,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。一、概念简介1. 什么是迭代器迭代器是由__next__方法组成的对象。它...
      99+
      2023-06-16
    • Python中如何使用ChatOps库
      Python中如何使用ChatOps库,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。ChatOps 是基于会话导向而进行的开发。其思路是你可以编写能够对聊天窗口中的某些输入...
      99+
      2023-06-16
    • Python中如何使用NumPy库?
      NumPy是Python中最流行的科学计算库之一。它提供了一种高效的处理大型数组和矩阵的方法,同时也包含了许多用于数学、科学和工程计算的常用函数。本文将介绍NumPy库的基础知识以及如何使用它来进行数组和矩阵操作。 安装NumPy 在...
      99+
      2023-09-26
      api numpy spring
    • python中如何使用numpy库
      这篇文章主要介绍“python中如何使用numpy库”,在日常操作中,相信很多人在python中如何使用numpy库问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python中如何使用numpy库”的疑惑有所...
      99+
      2023-06-27
    • python中如何使用Matplotlib库
      这篇文章将为大家详细讲解有关python中如何使用Matplotlib库,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。Matplotlib是一个Python 2D绘图库,可以生成各种硬拷贝格式和跨平台交互...
      99+
      2023-06-02
    • Python第三方库jieba库与中文分词全面详解
      目录一、什么是jieba库二、jieba分词原理三、jieba库支持的三种分词模式1.精确模式2.全模式3.搜索引擎模式四、jieba库常用函数五、jieba实操练习一(jieba....
      99+
      2024-04-02
    软考高级职称资格查询
    编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
    • 官方手机版

    • 微信公众号

    • 商务合作