返回顶部
首页 > 资讯 > 精选 >使用Ajax请求怎么爬取今日头条
  • 363
分享到

使用Ajax请求怎么爬取今日头条

2023-06-08 06:06:37 363人浏览 泡泡鱼
摘要

本篇文章给大家分享的是有关使用ajax请求怎么爬取今日头条,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。代码如下:import requestsimport 

本篇文章给大家分享的是有关使用ajax请求怎么爬取今日头条,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

代码如下:

import requestsimport osfrom urllib.parse import urlencodefrom hashlib import md5from multiprocessing.pool import Poolfrom requests import codesdef get_page(offset):  params = {    "offset":offset,    "fORMat":"JSON",    "keyWord":"街拍",    "autoload":"true",    "count":"20",    "cur_tab":"1",    "from":"search_tab"  }  url = 'https://www.toutiao.com/search_content/?'+urlencode(params)  try:    response = requests.get(url)    if response.status_code == 200:      # print(url)      return response.json()  except requests.ConnectionError:    return None# get_page(0)def get_images(json):  if json.get('data'):    for item in json.get('data'):      if item.get('cell_type') is not None:        continue      title = item.get('title')      images = item.get('image_list')      for image in images:        yield {          'title':title,          'image':'Https:' + image.get('url'),        }def save_image(item):  #os.path.sep  路径分隔符‘//'  img_path = 'img' + os.path.sep + item.get('title')  if not os.path.exists(img_path):    os.makedirs(img_path)  try:    resp = requests.get(item.get('image'))    # print(type(resp))    if codes.ok == resp.status_code:      file_path = img_path + os.path.sep + '{file_name}.{file_suffix}'.format(        file_name=md5(resp.content).hexdigest(),#md5是一种加密算法获取图片的二进制数据,以二进制形式写入文件        file_suffix='jpg')      if not os.path.exists(file_path):        with open(file_path,'wb')as f:          f.write(resp.content)          print('Downladed image path is %s' % file_path)      else:        print('Already Downloaded',file_path)  except requests.ConnectionError:    print('Failed to Save Image,item %s' % item)def main(offset):  json = get_page(offset)  for item in get_images(json):    print(item)    save_image(item)GROUP = 0GROUP_END = 2if __name__ == '__main__':  pool = Pool()  groups = ([x*20 for x in range(GROUP,GROUP_END)])  pool.map(main,groups)  #将groups一个个调出来传给main函数  pool.close()  pool.join()   #保证子进程结束后再向下执行 pool.join(1) 等待一秒

以上就是使用Ajax请求怎么爬取今日头条,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注编程网精选频道。

--结束END--

本文标题: 使用Ajax请求怎么爬取今日头条

本文链接: https://lsjlt.com/news/252308.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 使用Ajax请求怎么爬取今日头条
    本篇文章给大家分享的是有关使用Ajax请求怎么爬取今日头条,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。代码如下:import requestsimport ...
    99+
    2023-06-08
  • python要怎么爬取今日头条街拍美图案
    python要怎么爬取今日头条街拍美图案,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。今天为大家介绍一个利用Python爬取今日头条街拍美图的案例,想到各位会喜...
    99+
    2023-06-02
  • python 简单爬取今日头条热点新闻(
    今日头条如今在自媒体领域算是比较强大的存在,今天就带大家利用python爬去今日头条的热点新闻,理论上是可以做到无限爬取的; 在浏览器中打开今日头条的链接,选中左侧的热点,在浏览器开发者模式network下很快能找到一个‘category...
    99+
    2023-01-30
    头条 热点新闻 简单
  • 用Python爬下今日头条所有美女,美滋
      有人可能会说:如果我学好了,我可以找一个高薪的工作。有人可能会说:我学习编程希望能够为社会做贡献(手动滑稽)有人可能会说:为了妹子!.....其实我们会发现妹子才是第一生产力呀!今天咱们就是爬取今日头条,你要问我为什...
    99+
    2023-01-30
    头条 爬下 今日
  • 如何使用Python抓取今日头条街拍图片数据
    这篇文章主要介绍了如何使用Python抓取今日头条街拍图片数据,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。(1)抓取今日头条街拍图片(2)分析今日头条街拍图片结构keywo...
    99+
    2023-06-22
  • 教你如何用Python爬虫获取今日头条上面三千美女图
    想问大家一个问题啊,大家学习Python爬虫的动力是什么呀?下面是我们有些同学的回答:1 .Python爬虫学好了,我可以找一个高薪的工作。2 .我学习编程希望能够为社会做贡献(手动滑稽)3 .为了姑娘!(很直白的回答哈!).....总结了...
    99+
    2023-06-02
  • java spring+mybatis整合如何实现今日头条搞笑动态图片的爬取
    java spring+mybatis整合如何实现今日头条搞笑动态图片的爬取,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。java spring+mybatis整合实现爬虫之今...
    99+
    2023-06-19
  • 怎么用python爬取今日说法每期数据
    今天小编给大家分享一下怎么用python爬取今日说法每期数据的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。代码import&...
    99+
    2023-06-29
  • jQuery中怎么使用ajax跨域请求获取数据
    本篇文章给大家分享的是有关jQuery中怎么使用ajax跨域请求获取数据,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。跨域是我在日常面试中经常...
    99+
    2024-04-02
  • java怎么获取请求头参数
    在Java中,可以通过HttpServletRequest对象的getHeader方法来获取请求头参数。具体代码如下: import...
    99+
    2023-10-28
    java
  • 怎么使用JQuery接收AJAX请求
    本文小编为大家详细介绍“怎么使用JQuery接收AJAX请求”,内容详细,步骤清晰,细节处理妥当,希望这篇“怎么使用JQuery接收AJAX请求”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。一、用法JQuery提...
    99+
    2023-07-06
  • vue怎么使用axios发送ajax请求
    在vue中使用axios发送ajax请求的方法:1.新建vue.js项目;2.使用npm命令下载axios;3.使用import方法导入axios;4.执行代码发送ajax请求;具体步骤如下:首先,在vue-cli中创建一个vue.js项目...
    99+
    2024-04-02
  • 怎么用Python爬虫搞定发送中文HTTP请求头
    本篇内容主要讲解“怎么用Python爬虫搞定发送中文HTTP请求头”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“怎么用Python爬虫搞定发送中文HTTP请求头”吧!有时需要将HTTP请求头的值...
    99+
    2023-06-15
  • vue项目中如何使用axios发送请求让ajax请求头部携带cookie
    这篇文章主要为大家展示了“vue项目中如何使用axios发送请求让ajax请求头部携带cookie”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“vue项目中如何...
    99+
    2024-04-02
  • AJAX跨域请求怎么获取JSON数据
    这篇文章主要介绍“AJAX跨域请求怎么获取JSON数据”,在日常操作中,相信很多人在AJAX跨域请求怎么获取JSON数据问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”AJAX...
    99+
    2024-04-02
  • SpringBoot2中使用@RequestHeader获取请求头的方法
    目录一、使用@RequestHeader获取请求头(一)获取某一个请求头(二)获取数值型请求头(三)一次性获取所有请求头二、@RequestHeader注解详解(一)name、val...
    99+
    2024-04-02
  • Android中怎么利用RecyclerView实现今日头条频道管理功能
    这篇文章将为大家详细讲解有关Android中怎么利用RecyclerView实现今日头条频道管理功能,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。实现思路:通过ItemTouchHelper...
    99+
    2023-05-30
    android recyclerview
  • vue怎么使用vue-resource发送ajax请求
    在vue中使用vue-resource发送ajax请求的方法:1.新建vue.js项目;2.使用npm命令下载vue-resource;3.使用import方法导入vue-resource;4.执行代码发送ajax请求;具体步骤如下:首先,...
    99+
    2024-04-02
  • 使用Fly怎么拦截全局Ajax请求
    本篇文章给大家分享的是有关使用Fly怎么拦截全局Ajax请求,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。原理无论你的应用是通过那个框架或库发起的 Ajax 请求,最终都会回归...
    99+
    2023-06-08
  • Jquery怎么使用AJAX方法请求数据
    本篇内容主要讲解“Jquery怎么使用AJAX方法请求数据”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Jquery怎么使用AJAX方法请求数据”吧!一、AJAX请求1、jQuery.ajax(...
    99+
    2023-06-30
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作