首页 > 资讯 > 后端开发 > Python >3 个适合新人上手的Python项目

714

分享到

3 个适合新人上手的Python项目

上手新人适合 2023-01-31 07:01:25 714人浏览薄情痞子

Python 官方文档：入门教程 => 点击学习

摘要

今天给大家分享三个极实用的python爬虫案例。1、爬取网站美图爬取图片是最常见的爬虫入门项目，不复杂却能很好地熟悉python语法、掌握爬虫思路。当然有两个点要注意：一、不要侵犯版权，二、要注意营养。思路流程第一步：获取网址的respon

今天给大家分享三个极实用的python爬虫案例。

1、爬取网站美图

爬取图片是最常见的爬虫入门项目，不复杂却能很好地熟悉python语法、掌握爬虫思路。当然有两个点要注意：一、不要侵犯版权，二、要注意营养。

思路流程

第一步：获取网址的response，分页内容，解析后提取图集的地址。

第二步：获取网址的response，图集分页，解析后提取图片的下载地址。

第三步：下载图片（也就是获取二进制内容，然后在本地复刻一份）。

部分代码

1240

运行结果

1240

2、爬取微博数据

爬虫的最大功能之一就是整合数据，能弄到更全面的信息，真正做好大数据的分析，在这个数据说话的年代，影响是决定性的。（注意别侵权）

思路流程

1、利用chrome浏览器，获取自己的cookie。

2、获取你要爬取的用户的微博User_id

3、将获得的两项内容填入到weibo.py中，替换代码中的YOUR_USER_ID和#YOUR_COOKIE，运行代码。

部分代码

1240

用Wordcloud等软件生成词云，它会根据信息的频率、权重按比列显示关键字的字体大小。

1240

3、爬取王者荣耀全套皮肤

怎么获取全套皮肤？用钱买，或者用爬虫爬取下来~虽然后者不能穿。这个案例稍微复杂一点，但是一个非常值得学习的项目。

思路流程

首先进入所有英雄列表，你会看到下图

1240

在这个网页中包含了所有的英雄名称。点击其中一个英雄例如“百里守约”，进去后如下图：

△网址为https://pvp.qq.com/WEB201605/herodetail/196.shtml

1240

网址中196.shtml以前的字符都是不变的，变化的只是196.shtml。而196是“百里守约”所对应的数字，要想爬取图片就应该进入每个英雄图片所在的网址，而网址的关键就是对应的数字。那么这些数字怎么找呢？

在所有英雄列表中，打开浏览器的开发者工具，刷新，找到一个JSON格式的文件，如图所示：

1240

这时就会看到所有英雄对应的数字了。在上图所示的Headers中可以找到该json文件对应的网址形式。将其导入Python，把这些数字提取出来，然后模拟出所有英雄的网址即可

小节代码：

1240

下载图片

现在可以进入所有英雄的网址并爬取网址下的图片了。进入一个英雄的网址，打开开发者工具，在NetWork下刷新并找到英雄的皮肤图片。如图所示：

1240

然后在Headers中查看该图片的网址。会发现皮肤图片是有规律的。我们可以用这样的方式来模拟图片网址

Http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/'+str(v)+'/'+str(v)+'-bigskin-'+str(u)+'.jpg ，

在该网址中只有str(v)与str(u)是改变的（str( )是Python中的一个函数），str(v)是英雄对应的数字，str(u)只是图片编号，例如第一个图片就是1，第二个就是2，第三个……而一个英雄的皮肤应该不会超过12个（可以将这个值调到20等）。接着就是下载了。

下载代码：

1240

执行完上面的代码后只需要执行main函数就行了

1240

爬取下来的图片是这样，每个文件夹里面是该英雄对应的图片，如下图：

1240

人生苦短，Python当歌！学习，其实是一个坚持、分享、交流、提高的过程。学会交流，不懂就问，与更多优秀的人一起成长，学习效果也会更加显著。

您可能感兴趣的文档:

--结束END--

本文标题: 3 个适合新人上手的Python项目

本文链接: https://lsjlt.com/news/192079.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

3 个适合新人上手的Python项目

3 个适合新人上手的Python项目

适合Python 新手的5大练手项目，你

3个适合新手练习的python小游戏

项目实战，蛮适合新手小白的案例

C++和Python，哪个更适合编程新手？

苍穹外卖（一）最适合新手的Java练手项目Springboot+SSM项目《苍穹外卖》项目实战、笔记（超详细、新手）[持续更新]

Python pandas读取CSV文件的注意事项（适合新手）

Python超简单容易上手的画图工具库（适合新手）

「Go」和「JavaScript」哪个更适合你的项目？

Python 日志框架和 Spring：哪个更适合你的项目？

Python 框架打包文件，哪个更适合你的项目？

JavaScript 框架 vs. Python 数组：哪个更适合你的项目？

Java和JavaScript：哪个更适合LeetCode的新手？

有哪些适合新手的Python工具

适合Python项目的五大SQL连接器

在Pycharm中将自己的本地项目上传到github仓库——适合有一定经验的“新手”

“Go语言和NPM：哪个更适合你的项目？”

最适合入门的100个深度学习项目

JavaScript Angular与Vue.js：哪一个更适合您的项目？

Python Spring 函数同步与异步：哪个更适合你的项目？

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义