返回顶部
首页 > 资讯 > 后端开发 > Python >Python3 伪装浏览器的方法示例
  • 410
分享到

Python3 伪装浏览器的方法示例

示例浏览器方法 2022-06-04 19:06:38 410人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

一、伪装浏览器 对于一些需要登录的网站,如果不是从浏览器发出的请求,则得不到响应。所以,我们需要将爬虫程序发出的请求伪装成浏览器正规军。 具体实现:自定义网页请求报头。 二、使用Fiddler查看请求和响

一、伪装浏览器

对于一些需要登录的网站,如果不是从浏览器发出的请求,则得不到响应。所以,我们需要将爬虫程序发出的请求伪装成浏览器正规军。

具体实现:自定义网页请求报头。

二、使用Fiddler查看请求和响应报头

打开工具Fiddler,然后再浏览器访问“https://www.douban.com/”,在Fiddler左侧访问记录中,找到“200 HttpS www.douban.com”这一条,点击查看其对应的请求和响应报头具体内容:

查看图片

三、访问豆瓣

我们自定义请求报头与上图Request Headers相同内容:


''''' 
伪装浏览器 
 
对于一些需要登录的网站,如果不是从浏览器发出的请求,则得不到响应。 
所以,我们需要将爬虫程序发出的请求伪装成浏览器正规军。 
具体实现:自定义网页请求报头。 
''' 
 
#实例二:依然爬取豆瓣,采用伪装浏览器的方式 
 
import urllib.request 
 
#定义保存函数 
def saveFile(data): 
 path = "E:\projects\Spider\02_douban.out" 
 f = open(path,'wb') 
 f.write(data) 
 f.close() 
 
#网址 
url = "https://www.douban.com/" 
headers = {'User-Agent':'Mozilla/5.0 (windows NT 10.0; WOW64) AppleWEBKit/537.36 (Khtml, like Gecko) ' 
      'Chrome/51.0.2704.63 Safari/537.36'} 
req = urllib.request.Request(url=url,headers=headers) 
 
res = urllib.request.urlopen(req) 
 
data = res.read() 
 
#也可以把爬取的内容保存到文件中 
saveFile(data) 
 
data = data.decode('utf-8') 
#打印抓取的内容 
print(data) 
 
 
#打印爬取网页的各类信息 
print(type(res)) 
print(res.geturl()) 
print(res.info()) 
print(res.getcode()) 

四、输出的结果结果(截取部分)

查看图片

结果文件内容

查看图片

GitHub代码链接

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持编程网。

--结束END--

本文标题: Python3 伪装浏览器的方法示例

本文链接: https://lsjlt.com/news/15927.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python3 伪装浏览器的方法示例
    一、伪装浏览器 对于一些需要登录的网站,如果不是从浏览器发出的请求,则得不到响应。所以,我们需要将爬虫程序发出的请求伪装成浏览器正规军。 具体实现:自定义网页请求报头。 二、使用Fiddler查看请求和响...
    99+
    2022-06-04
    示例 浏览器 方法
  • 用python2和python3伪装浏览
    python网页抓取功能非常强大,使用urllib或者urllib2可以很轻松的抓取网页内容。但是很多时候我们要注意,可能很多网站都设置了防采集功能,不是那么轻松就能抓取到想要的内容。今天我来分享下载python2和python3中都是如何...
    99+
    2023-01-31
  • 01_爬虫伪装成浏览器的四种方法
    好多网站对于爬虫中没有进行浏览器伪装的会进行反爬, 以糗事百科网站为例 下面提供了三种方法添加headers,使爬虫能够伪装成浏览器访问。 备注: 方法二和方法三中省略了 import urllib.request url = 'http...
    99+
    2023-01-30
    爬虫 四种 伪装成
  • python如何实现浏览器伪装
    小编给大家分享一下python如何实现浏览器伪装,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!浏览器伪装因为网站服务器能够很轻易...
    99+
    2024-04-02
  • CentOS 7 安装Chrome浏览器的方法
    本文介绍了CentOS 7 安装Chrome浏览器的方法,分享给大家,具体如下: 配置yum下载源: 在目录 /etc/yum.repos.d/ 下新建文件 google-chrome.repo [root@loca...
    99+
    2022-06-04
    CentOS7 安装Chrome CentOS 安装Chrome浏览器
  • 浏览器渲染的示例分析
    这篇文章将为大家详细讲解有关浏览器渲染的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。浏览器渲染1.浏览器渲染图解浏览器渲染页面主要经历了下面的步骤:处理 HTML 标记并构建 DOM 树。处理 ...
    99+
    2023-06-15
  • 浏览器User-Agent的示例分析
    浏览器User-Agent的示例分析,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。一、基础知识篇:Http Header之User-AgentUser Agent中文名为用...
    99+
    2023-06-08
  • win7系统安装edge浏览器的方法
    在大家日常应用win7系统电脑上时,应当有很多客户要想安装全新的edge浏览器,那麼win7如何安装edge新版本浏览器呢下边笔者就为大伙儿产生win7系统安装edge浏览器的方法,有兴趣的小伙伴们快伴随着笔者一起来瞧瞧吧。win7系统安装...
    99+
    2023-07-10
  • CSS3浏览器兼容的示例分析
    这篇文章给大家分享的是有关CSS3浏览器兼容的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。一、浏览器兼容1.1、概要世界上没有任何一个浏览器是一样的,同样的代码在不一样...
    99+
    2024-04-02
  • Android实现图片浏览器示例
    本文所述为一个基础的Android图片浏览器代码,是仿写Google原版实现的,代码中实现了主要的实现过程和方法,具体的完善还需要自己添加,代码中有很多注释,可帮助新手们快速理...
    99+
    2022-06-06
    浏览器 示例 图片 Android
  • 浏览器中兼容性的示例分析
    小编给大家分享一下浏览器中兼容性的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!浏览器就是2大派系,一个是其他浏览器,一...
    99+
    2024-04-02
  • CSS多浏览器兼容的示例分析
    本篇文章给大家分享的是有关CSS多浏览器兼容的示例分析,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。 1、DOC...
    99+
    2024-04-02
  • ubuntu安装谷歌浏览器的方法是什么
    这篇文章主要介绍了ubuntu安装谷歌浏览器的方法是什么的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇ubuntu安装谷歌浏览器的方法是什么文章都会有所收获,下面我们一起来看看吧。1.打开终端命令行模式。2.输...
    99+
    2023-07-04
  • HTML5浏览器支持的方法
    这篇文章主要介绍了HTML5浏览器支持的方法的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇HTML5浏览器支持的方法文章都会有所收获,下面我们一起来看看吧。   &...
    99+
    2024-04-02
  • Win8安装chrome浏览器提示错误代码0x80070057的解决方法
      Win8安装chrome浏览器提示错误代码0x80070057怎么办?Google Chrome是一款快速、简单且安全的网络浏览器,能很好地满足新型网站对浏览器的要求,因此深受用户们的喜欢。一位用户在Win...
    99+
    2023-05-21
    Win8 chrome浏览器 0x80070057
  • CSS浏览器兼容性Hack的示例分析
    这篇文章给大家分享的是有关CSS浏览器兼容性Hack的示例分析的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。IE6/7实现display:inline-block有两种方法,第一...
    99+
    2024-04-02
  • CSS浏览器兼容问题的示例分析
    这篇文章主要介绍了CSS浏览器兼容问题的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。 CSS对阅读器的兼容性偶然让人很头疼,大约...
    99+
    2024-04-02
  • 浏览器中缓存机制的示例分析
    这篇文章主要介绍了浏览器中缓存机制的示例分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。浏览器的缓存机制?认识浏览器缓存当浏览器请求一个网...
    99+
    2024-04-02
  • JS浏览器事件模型的示例分析
    小编给大家分享一下JS浏览器事件模型的示例分析,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!JavaScript的特点1.JavaScript主要用来向HTML页...
    99+
    2023-06-15
  • Ubuntu Opera默认浏览器的安装与设置方法
    这篇文章主要讲解了“Ubuntu Opera默认浏览器的安装与设置方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Ubuntu Opera默认浏览器的安装与设置方法”吧!目前 Opera ...
    99+
    2023-06-13
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作