返回顶部
首页 > 资讯 > 后端开发 > Python >利用Python实现岗位的分析报告
  • 191
分享到

利用Python实现岗位的分析报告

Python实现岗位分析报告Python岗位分析Python岗位 2023-03-22 08:03:30 191人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

目录前言一、本文目标二、分析结果1.引入库2.页面结构3.请求参数4.构造请求 解析数据4.获取所有数据总结前言 前两篇我们分别爬取了糗事百科和妹子图网站,学习了 Requests,

前言

前两篇我们分别爬取了糗事百科和妹子图网站,学习了 Requests, Beautiful Soup 的基本使用。不过前两篇都是从静态 html 页面中来筛选出我们需要的信息。这一篇我们来学习下如何来获取 ajax 请求返回的结果。

本篇以拉勾网为例来说明一下如何获取 Ajax 请求内容

一、本文目标

获取 Ajax 请求,解析 JSON 中所需字段

数据保存到 excel

数据保存到 Mysql, 方便分析

二、分析结果

1.引入库

五个城市 python 岗位平均薪资水平

Python 岗位要求学历分布

Python 行业领域分布

Python 公司规模分布:

2.页面结构

我们输入查询条件以 Python 为例,其他条件默认不选,点击查询,就能看到所有 Python 的岗位了,然后我们打开控制台,点击网络标签可以看到如下请求:

从响应结果来看,这个请求正是我们需要的内容。后面我们直接请求这个地址就好了。从图中可以看出 result 下面就是各个岗位信息。

到这里我们知道了从哪里请求数据,从哪里获取结果。但是 result 列表中只有第一页 15 条数据,其他页面数据怎么获取呢?

3.请求参数

我们点击参数选项卡,如下:

发现提交了三个表单数据,很明显看出来 kd 就是我们搜索的关键词,pn 就是当前页码。first 默认就行了,不用管它。剩下的事情就是构造请求,来下载 30 个页面的数据了。

4.构造请求 解析数据

构造请求很简单,我们还是用 requests 库来搞定。首先我们构造出表单数据

data = {'first': 'true', 'pn': page, 'kd': lang_name}

之后用 requests 来请求url地址,解析得到的 jsON 数据就算大功告成了。由于拉勾对爬虫限制比较严格,我们需要把浏览器中 headers 字段全部加上,而且把爬虫间隔调大一点,我后面设置的为 10-20s,然后就能正常获取数据了。

import requests

def get_json(url, page, lang_name):
   headers = {
       'Host': 'www.laGou.com',
       'Connection': 'keep-alive',
       'Content-Length': '23',
       'Origin': 'https://www.lagou.com',
       'X-Anit-Forge-Code': '0',
       'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64; rv:61.0) Gecko/20100101 Firefox/61.0',
       'Content-Type': 'application/x-www-fORM-urlencoded; charset=UTF-8',
       'Accept': 'application/json, text/javascript, */*; q=0.01',
       'X-Requested-With': 'XMLHttpRequest',
       'X-Anit-Forge-Token': 'None',
       'Referer': 'https://www.lagou.com/jobs/list_python?city=%E5%85%A8%E5%9B%BD&cl=false&fromSearch=true&labelWords=&suginput=',
       'Accept-Encoding': 'gzip, deflate, br',
       'Accept-Language': 'en-US,en;q=0.9,zh-CN;q=0.8,zh;q=0.7'
   }
   data = {'first': 'false', 'pn': page, 'kd': lang_name}
   json = requests.post(url, data, headers=headers).json()
   list_con = json['content']['positionResult']['result']
   info_list = []
   for i in list_con:
       info = []
       info.append(i.get('companyShortName', '无'))
       info.append(i.get('companyFullName', '无'))
       info.append(i.get('industryField', '无'))
       info.append(i.get('companySize', '无'))
       info.append(i.get('salary', '无'))
       info.append(i.get('city', '无'))
       info.append(i.get('education', '无'))
       info_list.append(info)
   return info_list

4.获取所有数据

了解了如何解析数据,剩下的就是连续请求所有页面了,我们构造一个函数来请求所有 30 页的数据。

def main():
   lang_name = 'python'
   wb = Workbook()
   conn = get_conn()
   for i in ['北京', '上海', '广州', '深圳', '杭州']:
       page = 1
       ws1 = wb.active
       ws1.title = lang_name
       url = 'https://www.lagou.com/jobs/positionAjax.json?city={}&needAddtionalResult=false'.format(i)
       while page < 31:
           info = get_json(url, page, lang_name)
           page += 1
           import time
           a = random.randint(10, 20)
           time.sleep(a)
           for row in info:
               insert(conn, tuple(row))
               ws1.append(row)
   conn.close()
   wb.save('{}职位信息.xlsx'.format(lang_name))

if __name__ == '__main__':
   main()

总结

如果对数据库不熟悉的同学,直接注释掉 main 函数中的三行数据库代码就行了,我在注释中有说明是哪三行。

到此这篇关于利用Python实现岗位的分析报告的文章就介绍到这了,更多相关Python岗位分析内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: 利用Python实现岗位的分析报告

本文链接: https://lsjlt.com/news/200796.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 利用Python实现岗位的分析报告
    目录前言一、本文目标二、分析结果1.引入库2.页面结构3.请求参数4.构造请求 解析数据4.获取所有数据总结前言 前两篇我们分别爬取了糗事百科和妹子图网站,学习了 Requests,...
    99+
    2023-03-22
    Python实现岗位分析报告 Python岗位分析 Python岗位
  • 怎么用Python实现岗位分析报告
    本篇内容介绍了“怎么用Python实现岗位分析报告”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、本文目标获取 Ajax 请求,解析 JS...
    99+
    2023-07-05
  • python数据可视化自制职位分析生成岗位分析数据报表
    目录前言1. 核心功能设计可视化展示岗位表格数据分析岗位薪资情况分析岗位公司情况数据分析导出2. GUI设计与实现3. 功能实现3.1 职位数据爬虫3.2 数据预处理3.3 岗位数据...
    99+
    2024-04-02
  • 阿里云数据库测试岗位薪资一份全面的分析报告
    阿里云是全球领先的云计算服务提供商,其数据库测试岗位作为其技术团队的重要组成部分,一直备受关注。本文将详细分析阿里云数据库测试岗位的薪资水平,为有意申请此岗位的人提供参考。 一、阿里云数据库测试岗位的薪资待遇简单的薪资待遇:根据公开的招聘信...
    99+
    2023-12-11
    阿里 薪资 分析报告
  • Python利用reportlab实现制作pdf报告
    目录前言reportlab是什么安装和导入库将画图、画表格、编辑文字抽象为类pdf插入图片以文件路径写入pdf以流文件写入pdfpdf分页以生成pdf流文件为例前言 本博客重点内容:...
    99+
    2022-12-23
    Python reportlab制作pdf Python 制作pdf Python reportlab pdf
  • 利用python实现数据分析
    1:文件内容格式为json的数据如何解析 import json,os,sys current_dir=os.path.abspath(".") filename=[file for file in...
    99+
    2022-06-04
    数据 python
  • 企业云服务器的利弊分析报告
    企业云服务器是一种可以在互联网上运行的服务器,它可以帮助企业快速高效地部署服务器,并且具有较高的安全性和可靠性。企业云服务器拥有许多优点: 快速部署:企业云服务器通常是按需提供的,无需购买或安装新的服务器。用户可以将其部署为任何需要的规...
    99+
    2023-10-26
    利弊 分析报告 服务器
  • Python利用memory_profiler实现内存分析
    任何编程语言开发的项目代码都是需要考虑内存问题的,有时候当项目体量比较庞大以后若是出现内存泄漏等问题分析起来更是哦力不从心的。 因此,平时建议从开发的每个函数入手尽量编写的标准、规范...
    99+
    2024-04-02
  • 利用Python自制网页并实现一键自动生成探索性数据分析报告
    目录前言上传文件以及变量的筛选前言 今天小编带领大家用Python自制一个自动生成探索性数据分析报告这样的一个工具,大家只需要在浏览器中输入url便可以轻松的访问,如下所示: 第一...
    99+
    2024-04-02
  • 云服务器利润分析报告怎么写的
    云服务器利润分析报告通常会根据各项业务和服务的利润情况进行分析,以便更好地了解其当前的运营状况和未来的潜在增长空间。 一般来说,这些报告的内容包括以下几个方面: 营收概述:介绍云服务器的主要收入来源和业务模式。例如,包括销售额、成本等信...
    99+
    2023-10-26
    分析报告 利润 服务器
  • 企业云服务器的利弊分析报告总结
    成本效益:企业云服务器可以节约企业在云计算基础设施方面的投资成本。与购买本地硬件相比,使用企业云服务器可以节省大量的采购和维护成本,因为企业无需购买和维护自己的基础设施。 灵活性:企业可以根据需要动态扩展或缩减云服务器的容量,以适应业务需...
    99+
    2023-10-27
    利弊 分析报告 服务器
  • 云服务器利润分析报告怎么写的呀
    概述:简要介绍云服务器的基本情况和利润情况,以及该服务提供商在市场上的地位。 业务分析:分析云服务器的业务流程、成本结构和利润来源,例如: (1)云服务器的成本结构:云服务器的成本包括硬件成本、软件成本、带宽成本、维护成本等。其中硬件...
    99+
    2023-10-28
    分析报告 利润 服务器
  • 云服务器利润分析报告怎么写的啊
    一、市场背景 随着云计算技术的发展和普及,越来越多的企业开始使用云服务器来满足其业务需求。在这样的背景下,云服务器市场也呈现出快速发展的态势。据IDC发布的最新数据显示,2019年第一季度,中国云服务器市场规模达到了19.8亿元人民币,同...
    99+
    2023-10-28
    分析报告 利润 服务器
  • 如何利用python实现简单的情感分析
    今天小编给大家分享一下如何利用python实现简单的情感分析的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。1 数据导入及预处...
    99+
    2023-07-02
  • 如何利用报表工具实现排名分析
    排名分析是常见的分析方法,主要是通过排名让使用者了解当前业务维度下数据记录的次序,多用于业绩考核和对比分析。虽然排名的需求看着很简单,但实际操作时会发现有常常并不容易实现,这是因为排名的花样实在不少。今天我就来带大家玩转排名,开外挂分分钟搞...
    99+
    2023-06-05
  • 企业云服务器的利弊分析报告怎么写的
    一、利 提高了资源利用率:企业云服务器可以根据用户需求动态分配计算资源,避免了传统计算模式中的资源浪费现象,提高了计算资源的利用率,从而为企业节约了大量成本。 降低了IT成本:企业云服务器采用了虚拟化技术,使得服务器的硬件和软件资源都可...
    99+
    2023-10-28
    利弊 分析报告 服务器
  • 利用python实现简单的情感分析实例教程
    目录1 数据导入及预处理1.1 数据导入1.2 数据描述1.3 数据预处理2 情感分析2.1 情感分2.2 情感分直方图2.3 词云图2.4 关键词提取3 积极评论与消极评论3.1 ...
    99+
    2024-04-02
  • 企业云服务器的利弊分析报告怎么写好
    首先要介绍企业云服务器的基本概念和优势,包括云服务器的种类、性能、安全、价格等方面的信息。 技术特点:介绍企业云服务器的技术特点,包括云计算的架构、虚拟化技术、容器技术等。 应用场景:详细说明企业云服务器的应用场景,例如,企业可以使用企业...
    99+
    2023-10-27
    利弊 分析报告 写好
  • 利用Python实现自动工作汇报的脚本分享
    目录一、写在开头二、需要什么三、模型训练四、数据处理和传输五、金融模型六、代码七、MIME八、SMTP九、放在一起一、写在开头 哈喽兄弟们 之前经常编写Python脚本来进行数据处理...
    99+
    2024-04-02
  • Android 使用 ViewPager循环广告位的实现
    如何实现循环播放 现在网上实现循环播放都是在adapter的getCount()方法返回一个较大的值并且instantiateItem(ViewGroup container,...
    99+
    2022-06-06
    viewpager 广告 Android
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作