首页 > 资讯 > 后端开发 > Python >怎么用Python实现岗位分析报告

188

分享到

怎么用Python实现岗位分析报告

2023-07-05 14:07:14 188人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

本篇内容介绍了“怎么用python实现岗位分析报告”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！一、本文目标获取 ajax 请求,解析 JS

本篇内容介绍了“怎么用python实现岗位分析报告”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

一、本文目标

获取 ajax 请求,解析 JSON 中所需字段

数据保存到 excel 中

数据保存到 MySQL, 方便分析

二、分析结果

1.引入库

五个城市 Python 岗位平均薪资水平

2.页面结构

我们输入查询条件以 Python 为例，其他条件默认不选，点击查询，就能看到所有 Python 的岗位了，然后我们打开控制台，点击网络标签可以看到如下请求：

怎么用Python实现岗位分析报告

从响应结果来看，这个请求正是我们需要的内容。后面我们直接请求这个地址就好了。从图中可以看出 result 下面就是各个岗位信息。

到这里我们知道了从哪里请求数据，从哪里获取结果。但是 result 列表中只有第一页 15 条数据，其他页面数据怎么获取呢？

3.请求参数

我们点击参数选项卡，如下：

发现提交了三个表单数据，很明显看出来 kd 就是我们搜索的关键词，pn 就是当前页码。first 默认就行了，不用管它。剩下的事情就是构造请求，来下载 30 个页面的数据了。

4.构造请求解析数据

构造请求很简单，我们还是用 requests 库来搞定。首先我们构造出表单数据

data = {'first': 'true', 'pn': page, 'kd': lang_name}

之后用 requests 来请求url地址，解析得到的 jsON 数据就算大功告成了。由于拉勾对爬虫限制比较严格，我们需要把浏览器中 headers 字段全部加上，而且把爬虫间隔调大一点，我后面设置的为 10-20s，然后就能正常获取数据了。

import requestsdef get_json(url, page, lang_name):   headers = {       'Host': 'www.laGou.com',       'Connection': 'keep-alive',       'Content-Length': '23',       'Origin': 'https://www.lagou.com',       'X-Anit-Forge-Code': '0',       'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64; rv:61.0) Gecko/20100101 Firefox/61.0',       'Content-Type': 'application/x-www-fORM-urlencoded; charset=UTF-8',       'Accept': 'application/json, text/javascript, */*; q=0.01',       'X-Requested-With': 'XMLHttpRequest',       'X-Anit-Forge-Token': 'None',       'Referer': 'https://www.lagou.com/jobs/list_python?city=%E5%85%A8%E5%9B%BD&cl=false&fromSearch=true&labelWords=&suginput=',       'Accept-Encoding': 'gzip, deflate, br',       'Accept-Language': 'en-US,en;q=0.9,zh-CN;q=0.8,zh;q=0.7'   }   data = {'first': 'false', 'pn': page, 'kd': lang_name}   json = requests.post(url, data, headers=headers).json()   list_con = json['content']['positionResult']['result']   info_list = []   for i in list_con:       info = []       info.append(i.get('companyShortName', '无'))       info.append(i.get('companyFullName', '无'))       info.append(i.get('industryField', '无'))       info.append(i.get('companySize', '无'))       info.append(i.get('salary', '无'))       info.append(i.get('city', '无'))       info.append(i.get('education', '无'))       info_list.append(info)   return info_list

4.获取所有数据

了解了如何解析数据，剩下的就是连续请求所有页面了，我们构造一个函数来请求所有 30 页的数据。

def main():   lang_name = 'python'   wb = Workbook()   conn = get_conn()   for i in ['北京', '上海', '广州', '深圳', '杭州']:       page = 1       ws1 = wb.active       ws1.title = lang_name       url = 'https://www.lagou.com/jobs/positionAjax.json?city={}&needAddtionalResult=false'.format(i)       while page < 31:           info = get_json(url, page, lang_name)           page += 1           import time           a = random.randint(10, 20)           time.sleep(a)           for row in info:               insert(conn, tuple(row))               ws1.append(row)   conn.close()   wb.save('{}职位信息.xlsx'.format(lang_name))if __name__ == '__main__':   main()

“怎么用Python实现岗位分析报告”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站，小编将为大家输出更多高质量的实用文章！

您可能感兴趣的文档:

--结束END--

本文标题: 怎么用Python实现岗位分析报告

本文链接: https://lsjlt.com/news/352479.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

怎么用Python实现岗位分析报告

一、本文目标

二、分析结果

1.引入库

2.页面结构

3.请求参数

4.构造请求解析数据

4.获取所有数据

怎么用Python实现岗位分析报告

利用Python实现岗位的分析报告

python数据可视化自制职位分析生成岗位分析数据报表

阿里云数据库测试岗位薪资一份全面的分析报告

Python怎么实现爬取腾讯招聘网岗位信息

BLEEDINGBIT漏洞分析报告是怎么样的

Python利用reportlab实现制作pdf报告

怎么理解Oracle响应时间分析报告

云服务器需求分析报告怎么写

云服务器前景分析报告怎么写

云服务器成本分析报告怎么写

怎么在Node中构建一个轻量级的位置分析报告服务API

Python怎么实现位图分割的效果

轻量应用服务器缺点分析报告怎么写

基于Python实现个人手机定位分析

Python怎么实现RFM用户分析模型

云服务器利润分析报告怎么写的

云服务器利润分析报告怎么写好

云服务器前景分析报告怎么写好

云服务器成本分析报告怎么写好

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义

怎么用Python实现岗位分析报告

一、本文目标

二、分析结果

1.引入库

2.页面结构

3.请求参数

4.构造请求 解析数据

4.获取所有数据

4.构造请求解析数据