首页 > 资讯 > 后端开发 > Python >python下的爬虫简介

814

分享到

python下的爬虫简介

爬虫简介 python 2023-01-31 00:01:45 814人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

今天看了一本书的介绍《python网络爬虫实战》，里面介绍了四种框架（or模块），我做了小结如下：scrapy 基本常用的框架，只要根据固定模版，编写即可，自己主要编写解析的选择器，和解析出来的数据处理。特别适合静态页面的，比如新闻

今天看了一本书的介绍《python网络爬虫实战》，里面介绍了四种框架（or模块），我做了小结如下：

scrapy 基本常用的框架，只要根据固定模版，编写即可，自己主要编写解析的选择器，和解析出来的数据处理。特别适合静态页面的，比如新闻资讯等
beautiful soup 不是框架，是一个模块，不能像scrapy只是配置，scrapy侧重解析返回的html文件和处理解析出来的数据。bs需要完全从头到位自己编写，但是灵活度更高。
mechanize 模拟浏览器，可以实现交互，比如验证码输入等。
selenium 上面的功能对于js不能很好的支持，这个模块可以支持js，我个人喜欢用这个模块，因为它的使用方法跟我以前使用的微软平台下的WEBbrowser控件很相似。

对selenium，主要适用里面的selenium.Webdriver模块，它支持多种浏览器，比如chrome，i.e.，firefox，opera等，但是如果不用界面，则使用plantomjs，plantomjs是没有界面的，速度比chrome快，根据介绍，它用于页面自动化、网络监测、网页截屏、以及×××面测试等，所以在服务器模式下，没有界面，用plantomjs是最好的选择。现在plantomjs有Mac版本的，可以去网站下载。记得用迅雷下载。下载好了，直接解压，将里面bin目录下的文件： cp phantomjs /usr/local/bin/ 。就可以在Python使用了，只要import selenium就可以使用。使用selenium非常简单，基本上就是将你如何操作浏览器浏览网页的步骤代码化。

您可能感兴趣的文档:

--结束END--

本文标题: python下的爬虫简介

本文链接: https://lsjlt.com/news/182798.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

python下的爬虫简介

python下的爬虫简介

python - 爬虫简介

Python爬虫框架Scrapy简介

python爬虫框架feapder的使用简介

Python爬虫教程-01-爬虫介绍

Python简单爬虫

python爬虫-简单使用xpath下载

python爬虫xpath模块简介示例代码

Python爬虫教程-34-分布式爬虫介

Python 简单业务爬虫

python简单爬虫笔记

Python爬虫必备之Xpath简介及实例讲解

python实现简单爬虫--爬图片

一个简单的python爬虫,爬取知乎

python 简单的股票基金爬虫

Python制作简单的网页爬虫

简单实现python爬虫功能

python爬虫入门教程(非常详细),超级简单的Python爬虫教程

用Python编写简单的微博爬虫

Python爬虫之requests库基本介绍

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义