返回顶部
首页 > 资讯 > 后端开发 > Python >怎样让用python爬取龙岭迷窟评论
  • 429
分享到

怎样让用python爬取龙岭迷窟评论

2023-06-02 04:06:47 429人浏览 安东尼

Python 官方文档:入门教程 => 点击学习

摘要

本篇文章给大家分享的是有关怎样让用python爬取龙岭迷窟评论,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。最近不知道大家发现没有,新出了几部国产好剧,其中小五比较喜欢的就是鬼

本篇文章给大家分享的是有关怎样让用python爬取龙岭迷窟评论,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。


最近不知道大家发现没有,新出了几部国产好剧,其中小五比较喜欢的就是鬼吹灯系列的《龙岭迷窟》。

自从开播以来,获得好评无数,豆瓣评分开播8.4分,目前有所回落,维持在8.2分,无论是原著粉还是路人观众,都对这部新网剧赞誉有加。在《鬼吹灯》系列的众多影视化作品中名列前茅。

《鬼吹灯》之所以作品这么多,是由于小说的版权非常分散。这也导致制作团队不同,水平更是良莠不齐,正所谓是《一个“鬼吹灯”,八个胡八一;八部《鬼吹灯》,版权花落多少家?》(当然对比盗墓笔记系列的影视化作品来讲,还是要略胜一筹的。)

今天不说一些,只聊一聊大家对《龙岭迷窟》的评价,并和同系列其他网剧以及《盗墓笔记》网剧做个小对比。

豆瓣评分与观众

对于一部国产网剧,如果想分析它的评分与评价,那么似乎只有豆瓣这一个网站可以选择了。

而每一个学Python的人,应该写过豆瓣,拉勾,网易云“三剑客”的爬虫吧?

那么爬虫部分就不一一赘述了。

for comment in comments:
    # 获取用户名
    user = comment.xpath('.//h4/span[2]/a/text()')[0]
    # 获取评星
    star = comment.xpath('.//h4/span[2]/span[2]/@class')[0][7:8]
    # 获取时间
    date_time = comment.xpath('.//h4/span[2]/span[3]/@title')
    # 获取评论文字
    comment = comment.xpath('.//p/span/text()')[0].strip()

目前无论采用哪种方法,豆瓣的爬虫都只能爬到500条评论。

首先在评分分布上,有70.6%的人都给出了5星好评,给1星的最少仅为3.2%,百分百的好剧评分分布。

怎样让用python爬取龙岭迷窟评论

不过我们是数据可视化了500条短评,所以最终据结果与豆瓣评分对比肯定差异较大。

关于评论时间的走势图呢,发现分布非常不均匀。

怎样让用python爬取龙岭迷窟评论

为什么呢?仔细一看两个极值点分别是4月2日和4月9日,正好相差一周。

如果看过这部剧的同学相信一下就知道原因了。

《龙岭迷窟》网剧是每周三晚8点更新,那么当晚和第二天对该剧的评分以及新剧情的讨论肯定是最高峰啊。

怎样让用python爬取龙岭迷窟评论

我们在爬取豆瓣的评分评论时,顺便还爬到了评论用户的个人主页url。

那么我们也可以根据url对他的个人主页进行访问,顺便获取他的个人信息。

再利用pyecharts制作《龙岭迷窟》豆瓣短评用户的地域分布图。

怎样让用python爬取龙岭迷窟评论

其中评论人群北京最多,其次是上海、广东。

(这个最好跟豆瓣的用户群体对比一下)

龙岭迷窟 x 精绝古城

在凹凸数据做的统计中,《龙岭迷窟》、《精绝古城》 是目前评分最高的两部《鬼吹灯》系列影视化作品。

怎样让用python爬取龙岭迷窟评论

那么就看看大家分别对他们的评价如何吧。

怎样让用python爬取龙岭迷窟评论
怎样让用python爬取龙岭迷窟评论

两个词云图中的词语基本都是正向的。

不过《龙岭迷窟》中主要围绕潘粤明饰演的胡八一、高伟光饰演的鹧鸪哨以及王胖子,而张雨绮饰演的雪莉杨讨论度却不高。

《精绝古城》则正好相反,陈乔恩的关注度非常高。

看过很多分析豆瓣的文章,这次我们玩点新的。

看看哪些观众看过这两部网剧,又是分别打多少分的?分别怎么评价的?

分别爬取两部剧的评论各500条,利用 merge() 方法将两个表横向,并指定评论用户url为内连接的连接键。

df3 = pd.merge(df1,df2,on='user_url',how = 'inner')

看看其中给龙岭迷窟打分> 精绝古城的评分与评论:

df3[df3['star_x'] > df3['star_y']][['name_x','star_x','comment_x','star_y','comment_y']]```
怎样让用python爬取龙岭迷窟评论

给龙岭迷窟打分> 精绝古城的评论似乎也没有什么强有力的理由,唯一一个就是给精绝古城打1分的,是认为陈乔恩不适合这个角色。

其中给龙岭迷窟打分< 精绝古城的评分与评论:

df3[df3['star_x'] < df3['star_y']][['name_x','star_x','comment_x','star_y','comment_y']]
怎样让用python爬取龙岭迷窟评论

吐槽胡八一太胖可还行怎样让用python爬取龙岭迷窟评论

龙岭迷窟 x 黄皮子坟

这两部剧对比更像是中青年的胡胖搭档的对比。

上一节做了词云,此处就来个词频吧。

怎样让用python爬取龙岭迷窟评论
怎样让用python爬取龙岭迷窟评论

《黄皮子坟》相比《龙岭迷窟》,阮经天的台湾省口音还是提到的比较多的词语。

看看哪些观众看过这两部网剧,又是分别打多少分的?分别怎么评价的?

看看其中给龙岭迷窟打分> 黄皮子坟的评分与评论:

怎样让用python爬取龙岭迷窟评论

其中打低分的理由很多,相对于演员选角,剧本改编的问题似乎更受质疑。

其中给龙岭迷窟打分< 黄皮子坟的评分与评论:

龙岭迷窟 x 盗墓笔记

《鬼吹灯》和《盗墓笔记》作为国内最出名的两部盗墓题材小说,非常相似,都是铁三角组合。

大家经常拿他们俩对比,影视化作品自然也不会少了相互对比。

其实我是想做一个用户人群的画像,但是豆瓣无法获取更多的评论用户个人信息。

所以我选择了百度指数,看看分别搜索这两部小说的人群有什么不同点?

怎样让用python爬取龙岭迷窟评论
怎样让用python爬取龙岭迷窟评论

非常明显,《盗墓笔记》的粉丝群体中女性比例远高于《鬼吹灯》。

个人认为主要是受到小说内容,以及后期影视化过程中演员选角的影响。

看《盗墓笔记》的年龄段相对于《鬼吹灯》来说,也较低一些。

那么改编成网剧后,大家又是如何评价的呢?

看看其中给龙岭迷窟打分> 盗墓笔记的评分与评论:

怎样让用python爬取龙岭迷窟评论

真的是满屏的1分啊,不多说自己看吧。

现在我回忆起来也只记得“上交国家”和随处可见的“红牛”了。

其中给龙岭迷窟打分< 盗墓笔记的评分与评论:

小结

很高兴国产网剧能又出现一部好剧,同时演员又都在线。

潘粤明在《怒晴湘西》演过陈玉楼,在本剧又演胡八一,再次体验一人饰演两个角色。“李大嘴”姜超饰演的王凯旋,终于像王胖子了。身为一个厨子,拿个工兵铲炒炒菜怎么了。

看的出来《龙岭迷窟》剧组从主角到配角他们都在用心地在挑选、在打磨。

这样的剧确实配得上观众给出的高分。

以上就是怎样让用python爬取龙岭迷窟评论,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注编程网Python频道。

--结束END--

本文标题: 怎样让用python爬取龙岭迷窟评论

本文链接: https://lsjlt.com/news/228845.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 怎样让用python爬取龙岭迷窟评论
    本篇文章给大家分享的是有关怎样让用python爬取龙岭迷窟评论,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。最近不知道大家发现没有,新出了几部国产好剧,其中小五比较喜欢的就是鬼...
    99+
    2023-06-02
  • 怎样用Python爬取淘宝评论数据
    今天就跟大家聊聊有关怎样用Python爬取淘宝评论数据,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。【项目准备工作】 准备Pycharm,下载安装等,不会安装的,可以回复:pytho...
    99+
    2023-06-01
  • 使用python怎么爬取微博评论
    今天就跟大家聊聊有关使用python怎么爬取微博评论,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。python主要应用领域有哪些1、云计算,典型应用OpenStack。2、WEB前端...
    99+
    2023-06-14
  • python 爬取华为应用市场评论
    目录代码分享一、安装并创建Scrapy项目二、爬取应用市场评论过程1. Scrapy爬虫运行流程2. 页面分析页面分析过程一页面分析过程二页面分析过程三3. 爬虫实现解析json并构造请求将数据保存在items中构造...
    99+
    2022-06-02
    python 爬取应用市场评论 python 爬取华为应用市场
  • 【Python】使用Python做简易爬虫爬取B站评论
    目录 一、前言 二、分析网页 三、代码 1.头 2.获取根评论 3.获取子评论 四、总代码 五、总结 一、前言         B站评论没有查找功能,就随手写了一个爬虫爬取B站评论存储到本地txt中         首先需要安装pyth...
    99+
    2023-08-31
    python 爬虫 开发语言
  • python如何爬取华为应用市场评论
    小编给大家分享一下python如何爬取华为应用市场评论,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!代码分享分别爬取的一些应用信息以及应用的评论信息,数据结构如下...
    99+
    2023-06-15
  • Python怎么爬取豆瓣复联4精彩评论
    这篇文章将为大家详细讲解有关Python怎么爬取豆瓣复联4精彩评论,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。如果你们漫威迷的话,应该知道复仇者联盟4:终极之战,很快就要开始了,4月24号...
    99+
    2023-06-02
  • 利用Python网络爬虫爬取各大音乐评论的代码
    目录 python爬虫--爬取网易云音乐评论1.简易看出评论是动态加载的,一定是ajax方式。3.去查看post请求所上传的数据4.首先去查看请求是经过那些js到达服务器的...
    99+
    2024-04-02
  • Python怎么爬取京东商品信息评论存并进MySQL
    这篇文章主要介绍“Python怎么爬取京东商品信息评论存并进MySQL”,在日常操作中,相信很多人在Python怎么爬取京东商品信息评论存并进MySQL问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Pytho...
    99+
    2023-06-30
  • 怎么使用Python爬取网易云歌曲评论实现词云图
    这篇文章主要讲解了“怎么使用Python爬取网易云歌曲评论实现词云图”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python爬取网易云歌曲评论实现词云图”吧!环境使用Python ...
    99+
    2023-06-30
  • 详解用python实现爬取CSDN热门评论URL并存入redis
    一、配置webdriver 下载谷歌浏览器驱动,并配置好 import time import random from PIL import Image from seleniu...
    99+
    2024-04-02
  • 怎么使用Python定时抓取微博评论
    这篇文章主要讲解了“怎么使用Python定时抓取微博评论”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python定时抓取微博评论”吧!【Part1&mdash;&m...
    99+
    2023-06-15
  • 【Python】爬虫练习-爬取豆瓣网电影评论用户的观影习惯数据
    目录 前言 一、配置环境 1.1、 安装Python 1.2、 安装Requests库和BeautifulSoup库 1.3.、安装Matplotlib 二、登录豆瓣网(重点) 2.1、获取代理 2.2、测试代理ip是否可用 2.3、设置...
    99+
    2023-10-25
    windows python 开发语言 爬虫
  • 怎么利用Python带领你爬取流浪地球评论并写入数据库
    这期内容当中小编将会给大家带来有关怎么利用Python带领你爬取流浪地球评论并写入数据库,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。前言要春节档最热门的电影,就数今年的《新喜剧之王》《流浪地球》、《疯狂...
    99+
    2023-06-02
  • 怎么用python爬虫获取豆瓣的书评
    小编给大家分享一下怎么用python爬虫获取豆瓣的书评,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!python的五大特点是什么python的五大特点:1.简单易...
    99+
    2023-06-14
  • 怎样用Python爬取疯狂外星人
    今天就跟大家聊聊有关怎样用Python爬取疯狂外星人,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。前言相信大家在春节的时候都去看了很多值得期待的电影了吧?据说今年的春节档电影,是以往...
    99+
    2023-06-02
  • 如何用Python网络爬虫抓取百度贴吧评论区图片和视频
    如何用Python网络爬虫抓取百度贴吧评论区图片和视频,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。百度贴吧是全球最大的中文交流平台,你是否跟我一样,有时候看到评论区的图片...
    99+
    2023-06-01
  • Python爬虫之用Xpath获取关键标签实现自动评论盖楼抽奖(二)
    目录一、分析链接二、切分提取tid三、随机提取评论的内容四、盖楼刷抽奖一、分析链接 上一篇文章指路 一般来说,我们参加某个网站的盖楼抽奖活动,并不是仅仅只参加一个,而是多个盖楼活动一...
    99+
    2024-04-02
  • 用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波
    说起这个暑期档的动画片,非《哪吒之魔童降世》莫属了!上映第 1 天:89分钟,中国动画最快破 1亿纪录上映第 2 天:中国影史首部单日票房破 2亿的动画电影上映第 4 天:中国影史第66部破 10亿影片上映第 8 天:正式登顶!破 16亿,...
    99+
    2023-06-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作