首页 > 资讯 > 后端开发 > Python >Python异步爬虫requests和aiohttp中代理IP的使用

196

分享到

Python异步爬虫requests和aiohttp中代理IP的使用

2024-04-02 19:04:59 196人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

爬虫要想爬的好，IP代理少不了。。现在网站基本都有些反爬措施，访问速度稍微快点，就会发现IP被封，不然就是提交验证。下面就两种常用的模块来讲一下代理IP的使用方式。话不多说，直接开始

爬虫要想爬的好，IP代理少不了。。现在网站基本都有些反爬措施，访问速度稍微快点，就会发现IP被封，不然就是提交验证。下面就两种常用的模块来讲一下代理IP的使用方式。话不多说，直接开始。

requests中代理IP的使用：

requests中使用代理IP只需要添加一个proxies参数即可。proxies的参数值是一个字典，key是代理协议（Http/https），value就是ip和端口号，具体格式如下。

try:
    response = requests.get('https://httpbin.org/ip', headers=headers, 
    	proxies={'https':'https://221.122.91.74:9401'}, timeout=6)
    print('success')
    # 检测代理IP是否使用成功
    # 第一种方式，返回发送请求的IP地址，使用时要在 get() 添加 stream = True
    # print(response.raw._connection.sock.getpeername()[0])
    # 第二种方式,直接返回测试网站的响应数据的内容
    print(response.text)
except Exception as e:
    print('error',e)

在这里插入图片描述

注意： peoxies的key值（http/https）要和url一致，不然会直接使用本机IP直接访问。

aiohttp中代理IP的使用：

由于requests模块不支持异步，迫不得已使用aiohttp，掉了不少坑。
它的使用方式和requests相似，也是在get()方法中添加一个参数，但此时的参数名为proxy，参数值是字符串，且字符串中的代理协议，只支持http，写成https会报错。
这里记录一下我的纠错历程。。
首先根据网上的使用方式，我先试了一下下面的代码。

async def func():
    async with aiohttp.ClientSession() as session:
        try:
            async with session.get("https://httpbin.org/ip", headers=headers, 
            			proxy='http://183.220.145.3:80', timeout=6) as response:
                page_text = await response.text()
                print('success')
                print(page_text)
        except Exception as e:
            print(e)
            print('error')

if __name__=='__main__':
    asyncio.run(func())

在这里插入图片描述

修改后，再来

async def func():
    con = aiohttp.tcpConnector(verify_ssl=False)
    async with aiohttp.ClientSession(connector=aiohttp.TCPConnector(verify_ssl=False)) as session:
        try:
            async with session.get("https://httpbin.org/ip", headers=headers, 
            proxy='http://183.220.145.3:80', timeout=6) as response:
                # print(response.raw._connection.sock.getpeername()[0])
                page_text = await response.text()
                print(page_text)
                print('success')
        except Exception as e:
            print(e)
            print('error')

在这里插入图片描述

非但没有解决反倒多了一个警告，好在改一下就好。额~懒得粘了，直接来最终版本吧。。

# 修改事件循环的策略，不能放在协程函数内部，这条语句要先执行
asyncio.set_event_loop_policy(asyncio.windowsSelectorEventLoopPolicy())
async def func():
	# 添加trust_env=True
    async with aiohttp.ClientSession(connector=aiohttp.TCPConnector(ssl=False), trust_env=True) as session:
        try:
            async with session.get("https://httpbin.org/ip", headers=headers,
             proxy='http://183.220.145.3:80', timeout=10) as response:
                page_text = await response.text()
                print(page_text)
                print('success')
        except Exception as e:
            print(e)
            print('error')

在这里插入图片描述

虽然纠错过程有点长，但好在知道怎么用了。

到此这篇关于python异步爬虫requests和aiohttp中代理IP的使用的文章就介绍到这了,更多相关requests和aiohttp中代理IP内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

--结束END--

本文标题: Python异步爬虫requests和aiohttp中代理IP的使用

本文链接: https://lsjlt.com/news/140999.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Python异步爬虫requests和aiohttp中代理IP的使用

requests中代理IP的使用：

aiohttp中代理IP的使用：

Python异步爬虫requests和aiohttp中代理IP的使用

python 基于aiohttp的异步爬虫实战详解

python爬虫之requests库使用代理方式

python 爬虫如何使用代理IP

Python实现的异步代理爬虫及代理池

Python爬虫中使用代理IP有什么作用

如何使用爬虫代理IP

怎么使用爬虫代理IP

Python 爬虫使用代理 IP 的正确方法

Python爬虫Requests库的使用详情

Python 网页爬虫原理及代理 IP 使用

在Python爬虫过程中怎么使用代理IP

python异步爬虫机制的原理

Python爬虫所需要的爬虫代理ip是什么

爬虫怎么使用ip代理池

python爬虫之代理ip怎么正确使用

python爬虫之requests库的使用详解

Python 爬虫IP代理池的实现

python爬虫怎么利用requests制作代理池s

Python爬虫中免费代理IP和付费代理IP的区别有哪些

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义