首页 > 资讯 > 后端开发 > Python >Python采集某评论区内容的实现示例

750

分享到

Python采集某评论区内容的实现示例

Python采集评论 Python采集内容 2023-05-17 11:05:16 750人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

目录前言发送请求解析数据总结前言我们知道在这个互联网时代，评论已经在我们的生活到处可见，评论区里面的信息是一个非常有趣和有争议的地方。我们今天，就来获取某技术平台的评论，和大家分享

前言

我们知道在这个互联网时代，评论已经在我们的生活到处可见，评论区里面的信息是一个非常有趣和有争议的地方。我们今天，就来获取某技术平台的评论，和大家分享一下，我获取数据的过程，也是一个尝试的过程。

发送请求

我们首先，确定我们要获取哪一个文章下面的评论区。我们先使用开发者工具，定位到我们要的数据。

QQ图片20230422182804.png

我们通过数据抓取，我们发现，这个平台的评论区数据，放在了一个叫getlist数据包里面了。

QQ图片20230422183157.png

我们就不难明白，我们只要请求这个url，在传一个关于文章的参数，我们就能获取到我们想要的数据。而且，我们发现，这个是post请求。我们先按正常思路写代码。

import requests

url = 'https://xie.infoq.cn/public/v1/comment/getList'

headers = {
    'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/111.0.0.0 Safari/537.36',
}
res = requests.post(url,headers=headers)

print(res)

我们发现返回了一个<Response [451]>的值，我们可能就是少穿了参数，我们接下来，把参数加上试试。

data = {
    'id': "594899140323389440",
    'score': '1682043841339',# 1681968121323
    'size': '100',
}

我们发现还是不行，所以，我们想到了，这个要加一个防盗链。我们把相应的参数传进去，我们再来看看效果。

headers ={
    'Host': 'xie.infoq.cn',
    'Origin': 'Https://xie.infoq.cn',
    'Referer': 'https://xie.infoq.cn/article/a5f16dffb45139cba72691c29',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/111.0.0.0 Safari/537.36',
}
res = requests.post(url,data = data,headers=headers)

我们发现虽然返回了<Response [200]>,但是，我们还是拿不到数据，我们看看服务器给我们返回了什么样子的数值。

{"code":-1,"data":{},"error":{"code":-2005,"msg":"ID不能为空"},"extra":{"cost":0.000170465,"request-id":"7c1dc236c95aceb9e56da271b056be88@2@infoq"}}

它提示我们"msg":"ID不能为空"，说明我们data传入传错了。

不难看出，就是我们的文章id没有传进去，可能是我们传递的参数方式错了，我们这里要注意，要用JSON格式传参。正确的请求方式如下：

res = requests.post(url,json = data,headers=headers)

我们发现，就可以获取到了数据，在这个过程，我们不断的尝试，最后，也拿到了我们想要的数据，我们会不会有一些成就感。我们看看获取到了什么样子的数据吧。

QQ图片20230422184646.png

拿到了，这样的数据，大家就不难拿到我们要的数据，直接字典取值就好了，今天，我们用了大篇幅的段落，来解释我们是如何获取数据的。

解析数据

我们接下来就可以解析数据了，代码很简单。我这里直接获取评论了，不获取评论者了，原理是一样的，大家感兴趣的可以自己去试试。

datas = res.json()['data']['list']

for contents in datas:
    content = contents['content']
    print(content)

这段代码将从 res.json()['data']['list'] 中获取数据，并将其存储在 datas 变量中。然后，它使用一个 for 循环遍历 datas 中的每个元素，并将每个元素的 content 属性存储在 content 变量中。最后，它打印出每个元素的 content 属性。

我们直接看效果，这个很简单的。

QQ图片20230422185330.png

总结

到此这篇关于python采集某评论区内容的实现示例的文章就介绍到这了,更多相关Python采集某评论区内容内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

您可能感兴趣的文档:

--结束END--

本文标题: Python采集某评论区内容的实现示例

本文链接: https://lsjlt.com/news/211089.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

Python采集某评论区内容的实现示例

目录

前言

发送请求

解析数据

总结

Python采集某评论区内容的实现示例

Python采集电影评论实战示例

Python采集某度贴吧排行榜实战示例

Python采集情感音频的实现示例

Python采集图片数据的实现示例

Python实现IP代理批量采集的示例代码

WordPress实现评论后可显示内容中附件下载地址的方法

Python实现批量采集商品数据的示例详解

drupal实现在node节点的评论下面添加内容的方法

Go实现替换(覆盖)文件某一行内容的示例代码

帝国CMS实现提交评论后自动重新生成内容页的方法

Python编程实现下载器自动爬取采集B站弹幕示例

Python实现搜索GoogleScholar论文信息的示例代码

Vue3实现刷新页面局部内容的示例代码

vue element表格某一列内容过多,超出省略号显示的实现

Python实现内存泄露排查的示例详解

AJAX+JSP实现读取XML内容并按排列显示输出的方法示例

Linux内存监控虚拟内存实现机制及容量设定的示例分析

Spring Boot配置内容加密实现敏感信息保护的示例分析

JAVA过滤标签实现将html内容转换为文本的方法示例

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义