基于pycharm的beautifulsoup4库使用方法教程

2024-04-02 19:04:59 141人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

1.beautifulsoup4库安装第一步：在控制台输入如下命令，安装beautifulsoup4库。 pip install beautifulsoup4 第三步：在Py

1.beautifulsoup4库安装

第一步：在控制台输入如下命令，安装beautifulsoup4库。

pip install beautifulsoup4

第三步：在PyCharm中，点击file——settings——project——python interpreter——点击+号——搜索beautifulsoup4——install package！

这样就可以在.py文件中导入模块了！

2.beautifulsoup4库使用

import requests
# 虽然库名叫做beautiful4 但是在导入时 使用的是其缩写bs4 其中BeautifulSoup是一个类名
from bs4 import BeautifulSoup

url = 'https://www.baidu.com/s?'
# 由于一般网站都是供用户访问 如果检测到User-Agent是黑客或者其他可能拒绝访问 故此处模拟浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/97.0.4692.71 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
# 以防乱码 此处将其编码设置为utf-8 因为有中文
response.encoding = 'utf-8'
# print(response.text)
# 使用的解析器是html.parser 注意是.奥
soup = BeautifulSoup(response.text, 'html.parser')
# 打印解析后的结果
print(soup.prettify())

需要讲解的都在代码注释中了奥！

3.beautifulsoup4库基本元素

beautifulsoup4库是解析、遍历、维护“标签树”的功能库。

首先来看BeautifulSoup库解析器，前两个比较常用！

在上述代码的基础上，增加如下几行，结合基本元素的使用，可得到如图所示。

需要注意的是，.string可以跨标签，所以很有可能结果也为注释，为了区分是标签内的字符串还是注释，可以通过打印类型来判断。

接下来，看一下BeautifulSoup库的遍历，其中画红框的迭代遍历，可以用于for in循环中。

4.beautifulsoup4库的HTML查找方法

find_all( name , attrs , recursive , string , **kwargs )

find_all() 方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件。

name 参数可以对名字为 name 的标签进行检索。

attrs参数可以对标签属性值为attrs的标签进行检索。

recursive参数表示是否对子孙全部检索，默认是TRUE，如果只想搜索当前节点的儿子信息，可以置其为FALSE。

string 参数可以标签中的字符串内容进行检索。

5.补充JSON（javascript Object Notation）

我们学过js的或者java的，应该对Json不陌生吧！

Json是一种有类型的键值对！

需要注意的是，键和值都需要用"“括起来，如果值是整数，则可以不用”"！

如果值是多值，则可以用[,]；如果值是键值对，则可以用{:,:,}，可以嵌套使用。

JSON一般用于接口，而YAML是无类型键值对，一般用于配置文件。

到此这篇关于基于pycharm的beautifulsoup4库使用方法教程的文章就介绍到这了,更多相关pycharm的beautifulsoup4库使用内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

--结束END--

本文标题: 基于pycharm的beautifulsoup4库使用方法教程

本文链接: https://lsjlt.com/news/162573.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

基于pycharm的beautifulsoup4库使用方法教程

1.beautifulsoup4库安装第一步：在控制台输入如下命令，安装beautifulsoup4库。 pip install beautifulsoup4 第三步：在py...

99+

2024-04-02
基于pycharm的beautifulsoup4库怎么用

这篇文章主要为大家展示了“基于pycharm的beautifulsoup4库怎么用”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让小编带领大家一起研究并学习一下“基于pycharm的beautifulsoup4库怎么用”这篇文章...

99+

2023-06-26
详解基于pycharm的requests库使用教程

目录requests库安装和导入requests库的get请求requests库的post请求requests库的代理requests库的cookie自动识别验证码requests库...

99+

2024-04-02
如何进行基于pycharm的requests库使用

本篇文章为大家展示了如何进行基于pycharm的requests库使用，内容简明扼要并且容易理解，绝对能使你眼前一亮，通过这篇文章的详细介绍希望你能有所收获。requests库安装和导入cmd打开命令行，使用如下命令安装requests库。...

99+

2023-06-26
基于Spring(Boot)下策略模式的使用方法教程

这篇文章主要讲解了“基于Spring(Boot)下策略模式的使用方法教程”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“基于Spring(Boot)下策略模式...

99+

2024-04-02
教你Pycharm安装使用requests第三方库的详细教程

request库是python的第三方库，它也是目前公认的爬取网页最好的第三方库，其特点是：简单、简洁，甚至用一行代码就能从网页上获取相关资源。安装python：首先进入网站下载...

99+

2024-04-02
Pycharm安装使用requests第三方库的详细教程

本篇内容主要讲解“Pycharm安装使用requests第三方库的详细教程”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“Pycharm安装使用requests第三方库的详细教程”吧!reques...

99+

2023-06-20
教你在pycharm中使用tensorflow的方法

需求：需要在pycharm中跑一个深度学习的项目但是tensorflow包导不入问题分析：当前使用的是anaconda的3.8版本，无法正常下载tensorflow包，需...

99+

2024-04-02
OpenLayer基于vue的封装使用教程

目录前言基本结构 _createView _createBaselayer_createMap _initMapEvt _initMapCon...

99+

2022-11-13

vue OpenLayer vue OpenLayer封装
Python中的sort()方法使用基础教程

一、基本形式 sorted(iterable[, cmp[, key[, reverse]]]) iterable.sort(cmp[, key[, reverse]]) 参数解释：（1）ite...

99+

2022-06-04

基础教程方法 Python
基于SqlSessionFactory的openSession方法使用

目录SqlSessionFactory的openSession方法创建Sqlsession的地方只有一个我们可以看到实际创建SqlSession的地方Executor的创建Mappe...

99+

2024-04-02
python基础教程之Filter使用方法

python Filter Python中的内置函数filter()主要用于过滤序列。和map类似，filter()也接收一个函数和序列，和map()不同的是，filter()把传入的函数依次作用于每个...

99+

2022-06-04

使用方法基础教程 python
python 基础教程之Map使用方法

Python Map Map会将一个函数映射到一个输入列表的所有元素上。Map的规范为：map(function_to_apply, list_of_inputs) 大多数时候，我们需要将列表中的所有元素...

99+

2022-06-04

使用方法基础教程 python
pbootcms基本使用方法，搭建教程

上传到自己的主机，输入域名打开，会出现授权的页面，直接到pbootcms的官网进行授权（免费）。点击pbootcms官网进入网站 2、登录后台，登录方式：你的域名/admin.php 账号：admin 密码：admin 3、...

99+

2023-09-09

php
Redis 基础教程之事务的使用方法

Redis 基础教程之事务的使用方法 Redis 事务可以一次执行多个命令，并且带有以下两个重要的保证：事务是一个单独的隔离操作：事务中的所有命令都会序列化、按顺序地执行。事务在执行的过程中，不会...

99+

2022-06-04

使用方法基础教程事务
基于Ubuntu 18.04配置固定IP的方法教程

前言 Ubuntu 18.04不再使用ifupdown配置网络，而改用netplan。在/etc/network/interfaces配置固定IP是无效的，重启网络的命令services network restrart...

99+

2022-06-04

ubuntu配置固定ip ubuntu如何配置固定ip地址 ubuntu修改IP
node.js基于express使用websocket的方法

本文实例讲述了node.js基于express使用websocket的方法。分享给大家供大家参考，具体如下：这个效果我也是翻了好长时间的资料，测试才成功的，反正成功，大家看看吧首先你需要安装socket...

99+

2022-06-04

方法 js node
基于RestTemplate的使用方法(详解)

1.postForObject ：传入一个业务对象，返回是一个String调用方：BaseUser baseUser=new BaseUser();baseUser.setUserid(userid);baseUser.setPass(pa...

99+

2023-05-31

resttemplate emp 用
使用 Golang 探讨基于方法的编程思维

面向方法的编程思维是一种将程序设计从对象的角度转向方法的使用的编程范式。在这种编程思维下，重点不再是对象的属性和数据，而是对象的方法和行为。这种方法可以使代码更加模块化、可复用和可维护...

99+

2024-02-26
基于数组或链表实现Map的方法教程

本篇内容介绍了“基于数组或链表实现Map的方法教程”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！前言JAVA中的Map主要就是将一个键和一个...

99+

2023-06-15