首页 > 资讯 > 后端开发 > Python >python 使用requests爬取百度图片并显示

598

分享到

python 使用requests爬取百度图片并显示

python 爬虫百度图片 requests 2023-10-04 08:10:31 598人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

爬取百度图片并显示引言一、图片显示二、代码详解2.1 得到网页内容2.2 提取图片url2.3 图片显示三、完整代码引言爬虫（Spider），又称网络爬虫（WEB Crawle

爬取百度图片并显示

引言
一、图片显示
二、代码详解
三、完整代码

引言

爬虫（Spider），又称网络爬虫（WEB Crawler），是一种自动化程序，可以自动地浏览互联网上的网站，并从中抓取数据。它主要通过 Http / https 协议访问网页，并将访问到的网页内容进行解析和分析，从而提取有用的数据，例如新闻、评论、图片、视频等。爬虫在搜索引擎、大数据采集、信息监测和分析等领域都有广泛的应用。

Pyhon有很多库可以实现爬虫功能，如python中的requests库是一个第三方HTTP客户端库，它提供了一种更简单、更人性化的方式来发送HTTP/1.1请求。它允许我们发送HTTP/1.1请求以及各种HTTP方法，如GET、POST、PUT、DELETE、PATCH等。使用requests库，我们可以轻松地向外部api发送HTTP请求，并获取请求的响应。requests库提供了很多高级功能，比如会话管理、SSL证书验证、HTTP代理支持、文件上传等等。

一、图片显示

在这里插入图片描述
本文旨在介绍使用Python中的requests库爬取百度图片并显示的操作方法。该操作较为简单，适合初学者入门。
使用pip可以很容易地安装requests库：pip install requests

二、代码详解

需要导入的库：

import requestsfrom PIL import Imagefrom io import BytesIO

requests库用于获取网络数据，PIL库用于处理图像数据，BytesIO用于将二进制数据转换为图像数据。

2.1 得到网页内容

主要步骤：

设定好headers，防止网页拒绝被访问

headers = {'user-agent': 'Mozilla/5.0 (windows NT 10.0; WOW64) AppleWebKit/537.36 (Khtml, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400'}

在url中设定好queryWord和word，即百度图片查询的关键词，本文以tupian为例 (亦可设置为汉子)

url = ('https://image.baidu.com/search/acJSON?'       'tn=resultjson_com&logid=9047316633247341826&ipn=rj&ct=201326592&is=&fp=result&'       'queryWord=tupian&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&hd=&latest=©right=&'       'word=tupian&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=1&fr=&expermode=&force=&'       'pn=30&rn=30&gsm=1e&1616935040863=')

使用requests或其它库获取网页内容即可，这里使用requests库发送GET请求并传递请求头和参数，获取响应的网页数据。

import requestsresponse = requests.get(url=url, headers=headers)response.encoding = 'utf-8'

2.2 提取图片url

根据网页图片链接格式，提取图片的链接，网页内容中的图片链接以"thumbURL"开始：
在这里插入图片描述

使用正则表达式提取 可参考正则表达式（详解）

import reimgs =[]reg = re.compile('"thumbURL":"(.+?\.jpg)"')imgs.extend(reg.findall(response))print(imgs)

2.3 图片显示

获取图片链接里的内容，并显示
获取到的img是二进制字符，先试用BytesIO读取后显示

img = requests.get(url=imgs[0], headers=headers).contentfrom PIL import Imagefrom io import BytesIObytes_stream = BytesIO(img)img = Image.open(bytes_stream)img.show()

至此，成功地使用requests库爬取了百度图片，并将其显示出来。需要注意的是，此处仅为简单的入门示例，对于复杂的网站爬取和数据解析，需要使用更为专业的工具和技术。

三、完整代码

# 1.得到网页内容headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3861.400 QQBrowser/10.7.4313.400'}url = ('https://image.baidu.com/search/acjson?'       'tn=resultjson_com&logid=9047316633247341826&ipn=rj&ct=201326592&is=&fp=result&'       'queryWord=tupian&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=&z=&ic=&hd=&latest=©right=&'       'word=tupian&s=&se=&tab=&width=&height=&face=&istype=&qc=&nc=1&fr=&expermode=&force=&'       'pn=30&rn=30&gsm=1e&1616935040863=')import requestsresponse = requests.get(url=url, headers=headers)response.encoding = 'utf-8'response = response.text#print(response)# 2.提取图片urlimport reimgs =[]reg = re.compile('"thumbURL":"(.+?\.jpg)"')imgs.extend(reg.findall(response))print(imgs)# 3.显示图片img = requests.get(url=imgs[0], headers=headers).contentfrom PIL import Imagefrom io import BytesIObytes_stream = BytesIO(img)img = Image.open(bytes_stream)img.show()

来源地址：https://blog.csdn.net/qq_38204686/article/details/132793788

您可能感兴趣的文档:

--结束END--

本文标题: python 使用requests爬取百度图片并显示

本文链接: https://lsjlt.com/news/423306.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

python 使用requests爬取百度图片并显示

爬取百度图片并显示

引言

一、图片显示

二、代码详解

2.1 得到网页内容

2.2 提取图片url

2.3 图片显示

三、完整代码

python 使用requests爬取百度图片并显示

python爬取百度图片代码

python爬虫怎么批量爬取百度图片

Python爬虫：通过关键字爬取百度图片

使用python如何随心所欲地爬取百度图片

使用python怎么读取图片并显示

java多线程爬虫爬取百度图片的方法

使用Python爬虫爬取妹子图图片

python调用百度AI提取图片文字

使用Python怎么爬取网站图片并保存

如何使用Python自动爬取图片并保存

Python爬虫自动爬取图片并保存

Python基于百度API识别并提取图片中文字

python 读取并显示图片的两种方法

如何用Python爬取百度搜索结果并保存

如何使用html5定位获取当前位置并在百度地图上显示

python使用requests模块下载文件并获取进度提示

如何使用python百行代码实现汉服圈图片爬取

Android使用AsyncTask下载图片并显示进度条功能

如何使用Python爬虫爬取网站图片

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义