返回顶部
首页 > 资讯 > 后端开发 > Python >python—requests模块详解
  • 453
分享到

python—requests模块详解

python开发语言requests网络爬虫 2023-09-04 21:09:36 453人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

一、前言 1、requests简介 requests是一个很实用的python Http客户端库,爬虫和测试服务器响应数据时经常会用到,它是Python语言的第三方的库,专门用于发送HTTP请求,使用

一、前言

1、requests简介

requests是一个很实用的python Http客户端库,爬虫测试服务器响应数据时经常会用到,它是Python语言的第三方的库,专门用于发送HTTP请求,使用起来比urllib更简洁也更强大。

2、requests库的安装

方法1:命令行安装

方法2:源码安装

  • 下载 requests源码 http://mirrors.aliyun.com/pypi/simple/requests/
  • 下载文件到本地之后,解压到Python安装目录,之后打开解压文件
  • 运行命令行输入python setup.py install 即可安装

二、常用方法

序号方法描述
1requests.request(url)构造一个请求,支持以下各种方法
2requests.get()发送一个Get请求
3requests.post()发送一个Post请求
4requests.head()获取html的头部信息
5requests.put()发送Put请求
6requests.patch()提交局部修改的请求
7requests.delete()提交删除请求

其中最常用的方法为get()和post(),分别用于发送Get请求和Post请求。

三、常用属性

序号属性或方法描述
1response.status_code响应状态码
2response.content把response对象转换为二进制数据
3response.text把response对象转换为字符串数据
4response.encoding定义response对象的编码
5response.cookie获取请求后的cookie
6response.url获取请求网址
7response.JSON()内置的jsON解码器
8Response.headers以字典对象存储服务器响应头,字典键不区分大小写

四、发送请求

1、发送GET请求

1) 不带参数的请求

import requests#定义百度URL,获取百度首页url = "http://www.baidu.com"#使用GET发起请求res = requests.get(url)#将返回对象的2进制数据进行解码并输出(根据响应解过中的HTML头判断编码类型)print(res.content.decode("UTF-8"))

2) 带参数的请求

将参数放在URL中进行请求:

import requests#将参数name和age拼接到URL中进行请求res = requests.get(http://httpbin.org/get?name=gemey&age=22)#输出返回对象的文本结果print(res.text)

将参数写在字典中进行请求:

import requests#将参数name和age定义到字典params中params={"name":"tony","age":20}url="http://httpbin.org/get"#发送请求参数res = requests.get(url=url,params=params)#输出返回对象的文本结果print(res.text)

自定义HTTP头信息进行请求:

import requests# 将参数name和age定义到字典params中params = {"name": "tony","age": 20}url = 'http://httpbin.org/get'# 定义HTTP头信息,cookie,UA和refererheaders = {    "User-agent": "Mozilla/5.0 (Linux; Android 8.1.0; SM-P585Y) AppleWEBKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36",    "referer": "https://www.abidu.com",    "Cookies": "1234565678"}# 发送请求参数res = requests.get(url = url,params = params,headers = headers)# 输出返回对象的文本结果print(res.text)

2、发送POST请求

POST请求一般用于提交参数,所以直接进行有参数的POST请求测试。

import requests# 将参数name和age定义到字典params中params = {"name": "tony","age": 20}url = 'http://httpbin.org/post'# 定义HTTP头信息headers = {    "User-agent": "Mozilla/5.0 (Linux; Android 8.1.0; SM-P585Y) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36",    "referer": "https://www.abidu.com",    "Cookies": "username=user1&passwd=passwd"}# 发送请求参数res = requests.post(url = url,params = params,headers = headers)# 输出返回对象的文本结果print(res.text)

五、读取内容

requests对象的get和post方法都会返回一个Response对象,这个对象里面存的是服务器返回的所有信息,包括响应头,响应码等。

上面提到了,对于request,常用的属性有content、text、json、cookie等。content和text两者区别在于,content中间存的是字节码,而text中存的是Beautifulsoup模块根据猜测的编码方式将content内容编码成字符串后的结果。

直接输出content,会发现前面存在b’这样的标志,这是字节字符串的标志,而text是没有前面的b,对于纯ascii码,这两个可以说一模一样,对于其他的文字,需要正确编码才能正常显示。

大部分情况下,我们可以直接使用text,但是当有中文的时候,直接使用text会显示乱码,所以需要使用content对象来手动进行解码后才能正常显示。

而json属性则是利用内置的json解析模块解析json数据。

cookie属性则是直接获取响应头中的cookie。

1、以content方式读取

import requestsurl = "http://www.baidu.com"res = requests.get(url)#不进行解码,直接输出print(res.content)

输出结果:

在这里插入图片描述

进行解码后输出:

在这里插入图片描述

2、以text方式读取

import requestsurl = "http://www.baidu.com"res = requests.get(url)print(res.text)

输出结果: 中文存在乱码

在这里插入图片描述

3、读取json数据

import requestsparams = {"name": "tony","age": 20}url = 'http://httpbin.org/get'headers = {    "referer": "https://www.abidu.com",    "Cookies": "1234565678"}res = requests.get(url = url,params = params,headers = headers)print(res.cookies)

输出结果:将json数据转换为字典进行输出

在这里插入图片描述

4、获取cookies

import requestsurl = 'https://www.baidu.com' res = requests.get(url = url)print(res.cookies.extract_cookies)

读取cookie时,直接使用reponse.cookie会返回一个RequestsCookiejar对象,不会直接显示cookie的信息,所以需要再使用extract_cookies属性对该对象进行解析,结果如下:

在这里插入图片描述

六、其他方法

1、设置超时退出

可以通过timeout属性设置超时时间,一旦超过这个时间还没获得响应内容,就会提示错误。

import requestsurl = 'https://www.baidu.com'#设置超时时间上限为1sres = requests.get(url = url,timeout=1)print(res.content.decode("UTF-8"))

2、异常处理

import requestsurl = 'https://www.baidu.com'#设置超时时间上限为1s,并使用try语句处理异常try:res = requests.get(url = url,timeout=1)    print(res.content.decode("UTF-8"))except exceptions.Timeout as e:    print(e)except exceptions.HTTPError as e:    print(e)

3、设置代理

代理格式: proxies = { ‘协议’:‘协议://IP:端口号’}

提示: 当我们抓取的地址为http时,使用http代理,反之使用https代理

示例:

import requestsurl = 'https://www.baidu.com'#使用字典定义代理proxies={'http':'http://123.45.67.76:8888''https':'http://123.45.67.76:4433'}#设置超时时间上限为1s,并使用try语句处理异常try:res = requests.get(url = url,timeout=1,proxies=proxies)    print(res.content.decode("UTF-8"))except exceptions.Timeout as e:    print(e)except exceptions.HTTPError as e:    print(e)

4、使用Session进行会话管理

直接 requests.get() 或者 requests.post() 发送GET请求或POST请求;当然也是可以带上 cookies 和 headers 的,但这都是一次性请求,你这次带着cookies信息,后面的请求还得带。如果使用sessionl来发起请求,session实例在请求了一个网站后,对方服务器设置在本地的cookie会保存在session中,下一次再使用session请求对方服务器的时候,会带上前一次的cookie,从而实现回话保持。

import requests#使用session,需要先实例化一个session对象。session = requests.session()headers = {        'User-Agent': "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.114 Safari/537.36",        'Referer': "https://creator.douyin.com/"}url = "https://sso.******.com/get_qrcode/?next=https:%2F%2Fcreator.douyin.com%2Fcreator-micro%2Fhome&aid=2906&service=https:%2F%2Fcreator.douyin.com&is_vcd=1&fp=ktv0uumo_gD7FPCuy_MfX7_44zL_9T1C_6i8sUgr4bDT6"data1 = {    "name" : "test",    "passwd" : "passwd"}data2 = {    "name" : "test",    "age" : 20}#使用session对象发起请求,进行登录。try:res = session.get(url = url,timeout=1,headers = headers,data=data1)    print(res.json())    #使用的登录后的session对需要登录的操作再次发起请求。    res2 = session.post(url,data=date2)except exceptions.Timeout as e:    print(e)except exceptions.HTTPError as e:    print(e)

来源地址:https://blog.csdn.net/qq_45590334/article/details/128964941

--结束END--

本文标题: python—requests模块详解

本文链接: https://lsjlt.com/news/394392.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 详解Python requests模块
    前言 虽然Python的标准库中 urllib2 模块已经包含了平常我们使用的大多数功能,但是它的 API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更简洁方便。...
    99+
    2022-06-02
    Python requests模块 Python模块
  • python—requests模块详解
    一、前言 1、requests简介 requests是一个很实用的Python HTTP客户端库,爬虫和测试服务器响应数据时经常会用到,它是python语言的第三方的库,专门用于发送HTTP请求,使用...
    99+
    2023-09-04
    python 开发语言 requests 网络爬虫
  • python requests模块详解
    requests是python的一个HTTP客户端库,跟urllib,urllib2类似,那为什么要用requests而不用urllib2呢?官方文档中是这样说明的: python的标准库urllib2提供了大部分需要的HTTP功能,但是A...
    99+
    2023-01-31
    详解 模块 python
  • 27 Python的requests模块
    概述         在上一节,我们介绍了Python的logging模块,包括:logging的基本使用、logging的选项设置、日志旋转、logging.Filter类等内容。在这一节,我们将介绍Python的requests模块。r...
    99+
    2023-10-20
    python requests模块 GET POST 请求头 会话管理
  • python模块requests的安装
    1.到requests的官网下载包, 2.取包名为requests-2.12.4.tar.gz下载并解压到本地 3.cmd,切换到其目录下,python setup.py install 4.cmd,python,import requ...
    99+
    2023-01-31
    模块 python requests
  • python中requests模块怎么用
    这篇文章将为大家详细讲解有关python中requests模块怎么用,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。Requests模块是一个用于网络请求的模块,主要用来模拟浏览器发请求。其实类似的模块有很...
    99+
    2023-06-29
  • Python requests模块怎么使用
    本文小编为大家详细介绍“Python requests模块怎么使用”,内容详细,步骤清晰,细节处理妥当,希望这篇“Python requests模块怎么使用”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习...
    99+
    2023-07-05
  • python的requests模块实现登
    51cto用python的requests模块实现登陆示例代码如下: -- coding:utf-8 --import requestsimport re client = requests.session()agent = "Mozill...
    99+
    2023-01-31
    模块 python requests
  • requests模块使用
    安装 requests# 在命令行工具中使用pip install requests# 使用前需要导入import requests下面我们来看一下requests库的几种常用高级用法会话对象会话对象可以跨请求保持某些参数,在同一个 Ses...
    99+
    2023-06-02
  • python requests模块的使用示例
    目录为什么使用requests:模拟get请求:模拟请求头部信息模拟post请求requests上传文件requests设置代理time模块设置请求超时retrying模块设置刷新c...
    99+
    2024-04-02
  • Python+Requests模块获取响应内容
    Requests模块获取响应内容 响应包括响应行、响应头、响应正文内容,这些返回的响应信息都可以通过Requests模块获取。这些 获取到的响应内容也是接口测试执行得到的实际结果。 获取响应行 获取响应头 获取其它响应信息 代码示例: # ...
    99+
    2023-09-03
    python 爬虫 开发语言
  • Python之Requests模块简介与安装
    Requests模块简介   在python的标准库中,虽然提供了urllib,utllib2,httplib,但是做接口测试,requests使用更加方便快捷,正如官方说的,“让HTTP服务人类”。   Requests是用python语...
    99+
    2023-09-04
    python pycharm 开发语言 接口自动化测试 自动化测试
  • python datetime模块详解
    目录1. 获取当前时间2. 时间间隔 timedelta3. datetime 转 字符串 strftime()4. 字符串 转 datetime对象 datetime.strpti...
    99+
    2024-04-02
  • python—xlwt模块详解
    一、前言 xlwt模块是python中专门用于写入Excel的拓展模块,可以实现创建表单、写入指定单元格、指定单元格样式等人工实现的功能,一句话就是人使用excel实现的功能,这个扩展包都可以实现。 ...
    99+
    2023-09-04
    python excel 自动化办公 xlwt
  • Python re模块详解
    今天学习测试了一下Python中的正则表达式的模块用法。初学 Python ,对 Python 的文字处理能力有很深的印象,除了 str 对象自带的一些方法外,就是正则表达式这个强大的模块了。但是对于初学者来说,要用好这个功能还是有点难度,...
    99+
    2023-01-31
    详解 模块 Python
  • python sys模块详解
      sys.argv           命令行参数List,第一个元素是程序本身路径 sys.modules.keys() 返回所有已经导入的模块列表 sys.exc_info()     获取当前正在处理的异...
    99+
    2023-01-31
    详解 模块 python
  • python使用requests模块请求http接口
    目录 Python requests 模块requests常用参数及响应内容安装及导入requests模块HTTP 请求方法GET 请求POST 请求HTTP状态码postman生成pytho...
    99+
    2023-09-20
    python http
  • Python3使用requests模块显
    1. 相关资料 请求关键参数:stream=True。默认情况下,当你进行网络请求后,响应体会立即被下载。你可以通过 stream 参数覆盖这个行为,推迟下载响应体直到访问 Response.content 属性。 tarbal...
    99+
    2023-01-31
    模块 requests
  • Python中模块string.py详解
    一、用法 字符串常量: import string print(string.ascii_lowercase) print(string.ascii_uppercase) print(string....
    99+
    2022-06-04
    详解 模块 Python
  • python中os模块详解
    os模块提供了对目录或者文件的新建/删除/查看文件属性,还提供了对文件以及目录的路径操作。比如说:绝对路径,父目录…… os.sep可以取代操作系统特定的路径分隔符。windows下为 “\”,Linux下...
    99+
    2022-06-04
    详解 模块 python
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作