首页 > 资讯 > 后端开发 > Python >python爬虫简单的添加代理以及编写进行访问的实现代码

349

分享到

python爬虫简单的添加代理以及编写进行访问的实现代码

2023-06-02 03:06:15 349人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

python爬虫简单的添加代理以及编写进行访问的实现代码，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务

python爬虫简单的添加代理以及编写进行访问的实现代码，针对这个问题，这篇文章详细介绍了相对应的分析和解答，希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

在使用python对网页进行多次快速爬取的时候,访问次数过于频繁,服务器不会考虑User-Agent的信息,会直接把你视为爬虫,从而过滤掉,拒绝你的访问,在这种时候就需要设置代理,我们可以给proxies属性设置一个代理的IP地址,代码如下:

<?PHP // 要访问的目标页面 $url = "Http://httpbin.org/ip"; $urls = "https://httpbin.org/ip";  // 代理服务器 define("PROXY_SERVER", "tcp://t.16yun.cn:31111");  // 隧道身份信息 define("PROXY_USER", "16YUN123"); define("PROXY_PASS", "123456");  $proxyAuth = base64_encode(PROXY_USER . ":" . PROXY_PASS);  // 设置 Proxy tunnel $tunnel = rand(1,10000);  $headers = implode("\r\n", [ "Proxy-Authorization: Basic {$proxyAuth}", "Proxy-Tunnel: ${tunnel}", ]); $sniServer = parse_url($urls, php_URL_HOST); $options = [ "http" => [ "proxy" => PROXY_SERVER, "header" => $headers, "method" => "GET", 'request_fulluri' => true, ], 'ssl' => array( 'SNI_enabled' => true, // Disable SNI for https over http proxies 'SNI_server_name' => $sniServer ) ]; print($url); $context = stream_context_create($options); $result = file_get_contents($url, false, $context); var_dump($result);  // 访问 HTTPS 页面 print($urls); $context = stream_context_create($options); $result = file_get_contents($urls, false, $context); var_dump($result);?>

在代码中的目标网站是检测代理是否访问成功，如果访问成功就会返回代理ip，如果代理返回

异常有可能是代理的配置没有正确，那就需要对配置的代理信息进行检查。

关于Python爬虫简单的添加代理以及编写进行访问的实现代码问题的解答就分享到这里了，希望以上内容可以对大家有一定的帮助，如果你还有很多疑惑没有解开，可以关注编程网Python频道了解更多相关知识。

您可能感兴趣的文档:

--结束END--

本文标题: python爬虫简单的添加代理以及编写进行访问的实现代码

本文链接: https://lsjlt.com/news/228589.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

python爬虫简单的添加代理以及编写进行访问的实现代码

python爬虫简单的添加代理以及编写进行访问的实现代码

python爬虫简单的添加代理进行访问

php爬虫怎么添加代理进行访问

Python实现的异步代理爬虫及代理池

java实现一个简单的网络爬虫代码示例

GBDT算法原理以及实例理解（含Python代码简单实现版）

Python三十行代码实现简单人脸识别的示例代码

【用Vscode实现简单的python爬虫】从安装到配置环境变量到简单爬虫以及python中pip和request，bs4安装

Python环境的实际应用方案以及代码怎么编写

Java实现简单的银行管理系统的示例代码

Opencv图像添加椒盐噪声、高斯滤波去除噪声原理以及手写Python代码实现方法

怎么用Python代码实现一个简单的凯撒加密算法

Python如何换行】：使用换行符来实现多行代码的编写和阅读

如何编写Shell脚本实现对文件中的行、单词、字符进行迭代输出

python之文件的读写和文件目录以及文件夹的操作实现代码

Python实现一个简单三层神经网络的搭建及测试代码解析

蓝牙聊天App设计3：Android Studio制作蓝牙聊天通讯软件（完结，蓝牙连接聊天，结合生活情景进行蓝牙通信的通俗讲解，以及代码功能实现，内容详细，讲解通俗易懂）

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义