返回顶部
首页 > 资讯 > 精选 >如何用免费代理IP爬数据
  • 865
分享到

如何用免费代理IP爬数据

2023-06-16 14:06:36 865人浏览 独家记忆
摘要

如何用免费代理IP爬数据,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。一.前言玩爬虫的都避免不了各大网站的反爬措施限制,比较常见的是通过固定时间检测某ip地址访问量来判断该用户

如何用免费代理IP爬数据,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。

一.前言

爬虫的都避免不了各大网站的反爬措施限制,比较常见的是通过固定时间检测某ip地址访问量来判断该用户是否为  “网络机器人”,也就是所谓的爬虫,如果被识别到,就面临被封ip的风险,那样你就不能访问该网址了。

如何用免费代理IP爬数据

通用的解决办法是用代理ip进行爬取,但是收费的代理ip一般都是比较贵的,网上倒是有很多免费的代理ip网站,但是受时效性影响,大部分地址都不能用,有很多维护代理ip池的教程,即把爬取并检测后能用代理ip放到“代理池里”,等以后要用的时候再从里面提取,在我看来,这种效率比较低,因为这类IP地址很快就失效,我们要做的是边检测边使用,充分保证免费IP的时效性。

二.抓取IP地址

下面就开始实战操作。

首先我们随便找一个免费代理ip网站,如下图所示。

如何用免费代理IP爬数据

打开网页查看器,分析其网页元素结构,如下图所示。

如何用免费代理IP爬数据

就是一个简单的静态网页,我们用requests和bs4将ip地址和对应端口爬下,如下图所示。

如何用免费代理IP爬数据

每一行ip地址都由5个标签组成,而我们需要的是第一个标签(对应IP地址)和第2个标签(对应端口),所以从第一个开始,每隔5个取出ip地址(item[::5]),从第二个开始,每隔5个取出对应端口(item[1::5]),参数n为页码,每次只在1页取1个有用的ip地址,最终效果如下图所示:

如何用免费代理IP爬数据

三.验证IP有效性

这里把百度百科作为目标网站,这个看似很普通的网站,反爬措施却极为严格,爬不了几条内容就开始请求失败了,下面我以在百度百科查询全国火车站归属地信息为例演示如何使用免费代理ip。

首先我在12306上把所有的火车站名都爬下来了,但是没有归属地信息。

如何用免费代理IP爬数据

然后以站名构造百度百科url信息,分析网页元素,把爬取爬取火车站地址信息,网页元素如下图所示:

如何用免费代理IP爬数据

所以,我们只需在class_='basicInfo-item'的标签内容里查找有无“省”或者“市”的字符,然后输出就行了,最后加一个while  True循环,当该ip能正常爬数据时,则break该循环;若该ip被禁,则马上重新请求一个新ip进行爬取。直接上代码如下图所示:

如何用免费代理IP爬数据

其中for循环是遍历所有火车站,try是用于检测该ip还能不能用,若不能,则在except里请求1个新ip,爬取效果如下图所示:

如何用免费代理IP爬数据

下次再遇到爬虫被禁的情况就可以用此办法解决了。

主要介绍了去IP代理网站上抓取可用IP,并且python脚本实现验证IP地址的时效性,如遇到爬虫被禁的情况就可以用本文的办法进行解决。

看完上述内容,你们掌握如何用免费代理IP爬数据的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注编程网精选频道,感谢各位的阅读!

--结束END--

本文标题: 如何用免费代理IP爬数据

本文链接: https://lsjlt.com/news/283970.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 如何用免费代理IP爬数据
    如何用免费代理IP爬数据,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。一.前言玩爬虫的都避免不了各大网站的反爬措施限制,比较常见的是通过固定时间检测某ip地址访问量来判断该用户...
    99+
    2023-06-16
  • Python爬虫中免费代理IP和付费代理IP的区别有哪些
    这篇文章给大家分享的是有关Python爬虫中免费代理IP和付费代理IP的区别有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。1、免费代理IP和付费代理IP的区别免费代理IP是免费的,没有人维护,资源本身质量不...
    99+
    2023-06-15
  • 如何避免使用免费代理ip被追踪
    这篇文章主要介绍“如何避免使用免费代理ip被追踪”,在日常操作中,相信很多人在如何避免使用免费代理ip被追踪问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何避免使用免费代理ip被追踪”的疑惑有所帮助!接下来...
    99+
    2023-06-25
  • 如何获取免费的代理ip
    本篇内容介绍了“如何获取免费的代理ip”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1.自编程序到Internet捕捉和收集,到网上收集一些...
    99+
    2023-06-20
  • 如何在python中使用proxybroker构建一个爬虫免费IP代理池
    今天就跟大家聊聊有关如何在python中使用proxybroker构建一个爬虫免费IP代理池,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。python可以做什么Python是一种编程...
    99+
    2023-06-06
  • 如何获取ip代理免费版的
    如何获取ip代理免费版的,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。很多人想要使用ip,有很多方式,比如我们去找免费的,当然这种方式获取的ip基本上很多人都在使用,效果并...
    99+
    2023-06-25
  • python如何爬取免费代理并验证代理是否可用
    python如何爬取免费代理并验证代理是否可用,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。分享一个python脚本,使用代理ip来访问网页,方便抓取数据什么的~并自动验证...
    99+
    2023-06-26
  • 免费代理ip可以用吗
    本篇内容介绍了“免费代理ip可以用吗”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!现在市面上的免费代理IP软件基本上无法使用,现在的厂商都不...
    99+
    2023-06-20
  • 怎么免费使用代理ip
    本篇内容介绍了“怎么免费使用代理ip”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!如今,随着网络的快速发展,很多的人对代理IP都已经有了很深...
    99+
    2023-06-20
  • 如何使用爬虫代理IP
    这篇文章给大家介绍如何使用爬虫代理IP,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。进入网站-品易云http代理-点击api提取。选择自己需求内容,点击【提取代理IP】然后根据需要选择提取数量、代理协议、格式等,然后点...
    99+
    2023-06-14
  • python: 抓取免费代理ip
    通过抓取西刺网免费代理ip实现代理爬虫: from bs4 import BeautifulSoup import requests import random import telnetlib requests = requests.se...
    99+
    2023-01-31
    python ip
  • 使用免费http代理ip好吗
    这篇文章主要为大家展示了“使用免费http代理ip好吗”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“使用免费http代理ip好吗”这篇文章吧。如今是信息时代,许多互联网场景如爬虫信息收集、电商效...
    99+
    2023-06-20
  • 免费在线ip代理的用法
    小编给大家分享一下免费在线ip代理的用法,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!现在有很多代理IP资源,但是使用的方式是不断变化的。第一,通过使用理IP、代理IP、http代理等关键字,可以找到可用的IP资源,验证计...
    99+
    2023-06-20
  • python 爬虫如何使用代理IP
    作为一名数据采集者,我们都是知道,一个网站要是频繁访问都会被封IP,那要怎么解决这个问题呢?不可能一直频繁的更换设备,不光数据不能同步,这些设备的成本也是无法预计的,所以这个时候就需要代理IP了。以亿牛云(https://www.16yun...
    99+
    2023-06-02
  • 免费在线代理ip好不好用
    这篇文章给大家分享的是有关免费在线代理ip好不好用的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。1、IP质量差的免费代理,用户群大。所有使用免费代理IP的人都知道,使用免费代理IP很难。用完之后,我就有了不再使用...
    99+
    2023-06-20
  • 国内免费代理IP怎么使用
    本篇内容介绍了“国内免费代理IP怎么使用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!随着网络产业的迅速发展和网络爬虫行业的兴起,越来越多的...
    99+
    2023-06-20
  • 免费代理ip服务器好用吗
    本篇内容介绍了“免费代理ip服务器好用吗”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1、免费代理服务器,通常是透明代理,安全性较低,信息容...
    99+
    2023-06-25
  • 有ip代理免费软件吗
    本篇内容主要讲解“有ip代理免费软件吗”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“有ip代理免费软件吗”吧!1、稳定期限。例如,代理IP的有效期是10分钟,在稳定连接后突然中断6分钟,几秒钟后...
    99+
    2023-06-25
  • 爬虫要如何使用ip代理池
    这篇文章主要介绍“爬虫要如何使用ip代理池”,在日常操作中,相信很多人在爬虫要如何使用ip代理池问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”爬虫要如何使用ip代理池”的疑惑有所帮助!接下来,请跟着小编一起来...
    99+
    2023-06-20
  • 如何用Python爬虫抓取代理IP
    本篇文章为大家展示了如何用Python爬虫抓取代理IP,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。不知道大家在访问网站的时候有没有遇到过这样的状况就是被访问的网站会给出一个提示,提示的显示是“访问...
    99+
    2023-06-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作