返回顶部
首页 > 资讯 > 后端开发 > Python >Python 增加博客园阅读量
  • 672
分享到

Python 增加博客园阅读量

博客园Python 2023-01-30 23:01:15 672人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

          最近偶然到博客园看了一下,距离上次的博客已经过去很多天了,阅读量却少得可怜,对于博客园小白来说感觉不是很友好(主要是心理不平衡),而且有些博客被其他网站不带出处的转载了,它的阅读量却很多。于是灵光一闪,决定写个程序增

       

  最近偶然到博客园看了一下,距离上次的博客已经过去很多天了,阅读量却少得可怜,对于博客园小白来说感觉不是很友好(主要是心理不平衡),而且有些博客被其他网站不带出处的转载了,它的阅读量却很多。于是灵光一闪,决定写个程序增加一下阅读量。(仅用于学术交流,实际上我就试了一下,没有真正刷过)

 

一、原理

  一般来说,阅读量是通过 ip 识别的,如果一个 ip 已经请求过了,下一次就不再增加阅读量。因此,想要增加阅读量,就需要不同的 ip 进行请求。大致清楚了之后,就可以开始写代码了。

 

二、获取代理 ip

  国内有很多代理 ip 的网站,这里我就推荐 Http://31f.cn/http-proxy/ ,我们直接通过爬虫对 ip 和端口号进行获取,用 requests 和 BeautifulSoup ,由于这个网站的结构比较简单,就直接上代码了(记得导包)。

def getIPList(url="http://31f.cn/http-proxy/"):
    proxies = []
    headers = {
        'User_Agent': 'Mozilla/5.0 (windows NT 6.1; WOW64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/60.0.3112.101 Safari/537.36',
    }

    res = requests.get(url, headers=headers)

    soup = BeautifulSoup(res.text, 'lxml')

    ip_list = soup.select("body > div > table.table.table-striped > tr > td:nth-of-type(2)")
    port_list = soup.select("body > div > table.table.table-striped > tr > td:nth-of-type(3)")

    for i in range(len(port_list)):
        proxies.append(ip_list[i].text + ":" + port_list[i].text)

    return proxies

  如果想要获取更多的 ip 可以让这个方法不带参数,直接通过循环对多个页面进行抓取,毕竟大部分代理 ip 的有效期都很短。

 

三、发出请求

  其实在一开始,我是直接对 https://www.cnblogs.com/lyuzt/p/10381107.html 进行请求的,但是我发现用 requests 请求这个网址并不能增加阅读量。因为其他的文件并没有像平时打开网站那样加载,而且增加阅读量应该是由另外的网址进行,所以要好好分析一下,到底是通过什么增加阅读量的。

   从控制台可以看到有一个 put 请求的,域名的开头为 count,这个才是阅读量增加的关键。所以改一下 url 再请求。

  代码如下:

IPs = getIPList_2()
#print(IPs)
for i in range(len(IPs)):
    print("开始请求")
    user_agent = random.choice(user_agents)
    proxy = IPs[i]
    res = requests.get(blog_url, headers={'user_agent': user_agent}, proxies={'http': proxy})
    print(user_agent + '\t' + proxy, end='\t')
    print(res)
    print("请求结束,准备下一次请求......")
    time.sleep(10)

  ps:" user_agents " 这个变量是一个列表,相当于一个 user_agent 池,它的每个元素都是一个 user_agent 。这个就不展示了,可以上网复制。

 

四、总结

  经过测试,博客的阅读量有所增加,但由于大部分代理 ip 的有效期短,基本上只能增加一点点。有些网站可以通过直接请求网址增加阅读量,有一些网站则是通过请求其他的文件增加的,如果觉得去分析有点麻烦可以直接用 selenium 让浏览器自动请求,至于这个方法就不尝试了。

  虽然阅读量少,但我只试了一次,毕竟不能被这个数字左右,要端正心态。只要有技术,这些东西真的无所谓(不带出处转载这个就不能忍了,毕竟侵权了)。最后强调一下,这篇博客重在交流!

  

--结束END--

本文标题: Python 增加博客园阅读量

本文链接: https://lsjlt.com/news/181257.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python 增加博客园阅读量
              最近偶然到博客园看了一下,距离上次的博客已经过去很多天了,阅读量却少得可怜,对于博客园小白来说感觉不是很友好(主要是心理不平衡),而且有些博客被其他网站不带出处的转载了,它的阅读量却很多。于是灵光一闪,决定写个程序增...
    99+
    2023-01-30
    博客园 Python
  • 通过Python爬虫代理IP快速增加博客阅读量
    写在前面 题目所说的并不是目的,主要是为了更详细的了解网站的反爬机制,如果真的想要提高博客的阅读量,优质的内容必不可少。 了解网站的反爬机制 一般网站从以下几个方面反爬虫: 1. 通过Headers反爬虫 ...
    99+
    2022-06-04
    爬虫 快速 博客
  • 通过爬虫代理IP快速增加博客阅读量的示例分析
    通过爬虫代理IP快速增加博客阅读量的示例分析,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。首先题目所说的并不是目的,主要是为了更详细的了解网站的反爬机制。而真的想要更高的阅...
    99+
    2023-06-02
  • 怎么使用JavaScript和HTML创建博客阅读器
    这篇文章主要讲解了“怎么使用JavaScript和HTML创建博客阅读器”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用JavaScript和HTML...
    99+
    2024-04-02
  • 如何用ajax自动加载blogjava和博客园的rss
    这篇文章将为大家详细讲解有关如何用ajax自动加载blogjava和博客园的rss,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。 ...
    99+
    2024-04-02
  • 利用Python批量保存51CTO博客
    一、背景 最近在整理博客,近在51CTO官网存在文章,想将之前写的全部保存到本地,发现用markdown写的可以导出,富文本的则不行,就想利用Python批量保存自己的博客到本地。 二、代码 git地址 #!/bin/env python ...
    99+
    2023-01-31
    批量 博客 Python
  • python利用文件读写编写一个博客
    本文实例为大家分享了python利用文件读写编写一个博客的具体代码,供大家参考,具体内容如下 代码展示 import random import json import time import os de...
    99+
    2022-06-02
    python 博客
  • 如何使用python爬取csdn博客访问量
    最近学习了python和爬虫,想写一个程序练练手,所以我就想到了大家都比较关心的自己的博客访问量,使用python来获取自己博客的访问量,这也是后边我将要进行的项目的一部分,后边我会对博客的访问量进行分析,...
    99+
    2022-06-04
    如何使用 访问量 博客
  • python对大文件的增量读取
    欢迎关注我的豆瓣http://www.douban.com/note/484517776/  对于很多大文件的增量读取,如果遍历每一行比对历史记录的输钱或者全都加载到内存通过历史记录的索引查找,是非常浪费资源的,网上有很多人的技术博客都是写...
    99+
    2023-01-31
    增量 大文件 python
  • Python实现统计文章阅读量的方法详解
    目录前言实现代码效果图前言 写这次博客其实事出有因,前几天呢,一个非常优秀的学姐在QQ空间里晒了自己的CSDN博客的总阅读量,达到了7万+,很厉害了,而且确实她的博文都是精髓,我就也...
    99+
    2023-02-14
    Python统计文章阅读量 Python文章阅读量 Python 文章 阅读量
  • JS一分钟在github+Jekyll的博客中添加访问量功能的实现
    目录一分钟在github+Jekyll博客中添加访问量功能前言一、Jekll是什么1. Jekll是软件简介二、不蒜子1. 不蒜子简介:2. 官网入口3. 使用方法4. 个性化总结一...
    99+
    2024-04-02
  • Python如何实现实时增量数据加载工具
    这篇文章主要介绍Python如何实现实时增量数据加载工具,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!结合单例模式实际应用案例:实现实时增量数据加载工具的解决方案。最关键的是实现一个可进行添加、修改、删除等操作的增量...
    99+
    2023-06-29
  • Python实现实时增量数据加载工具的解决方案
    目录创建增量ID记录表数据库连接类增量数据服务客户端结果测试本次主要分享结合单例模式实际应用案例:实现实时增量数据加载工具的解决方案。最关键的是实现一个可进行添加、修改、删除等操作的...
    99+
    2024-04-02
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作