首页 > 资讯 > 后端开发 > Python >python怎么爬取天猫店铺商品链接

459

分享到

python怎么爬取天猫店铺商品链接

2023-06-14 16:06:11 459人浏览泡泡鱼

Python 官方文档：入门教程 => 点击学习

摘要

这篇文章主要介绍python怎么爬取天猫店铺商品链接，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！Python可以做什么Python是一种编程语言，内置了许多有效的工具，Python几乎无所不能，该语言通俗易懂、容易

这篇文章主要介绍python怎么爬取天猫店铺商品链接，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！

Python可以做什么

Python是一种编程语言，内置了许多有效的工具，Python几乎无所不能，该语言通俗易懂、容易入门、功能强大，在许多领域中都有广泛的应用，例如最热门的大数据分析，人工智能，web开发等。

在使用python爬虫爬取网页时会遇到很多含有特殊符号的情况，当把链接复制到浏览器打开，发现每个节点都多了个\，直接使用response.xpath()无法定位元素，为避免定位不到元素的问题，应先对响应内容做一下过滤，然后使用response.replace()将过滤后的html文档重新赋值给response，本文以爬取天猫店铺商品链接为例，向大家介绍爬取过程。

爬取思路

使用response.text获取html文本，去除其中的\；

使用response.replace() 重新将去除\后的html赋值给response；

使用response.xpath()定位元素，成功获取商品链接。

具体代码

# -*- coding: utf-8 -*-import reimport scrapyclass TmallSpider(scrapy.Spider):    name = 'tmall'    allowed_domains = ['tmall.com']    start_urls = [        'https://wogeliou.tmall.com/i/asynSearch.htm?_ksTS=1611910763284_313&callback=        JSONp314&mid=w-22633333039-0&wid=22633333039&path=/search.htm&search=y&spm=a220o.1000855.0.0.7fcc367fsdZyLF'    ]    custom_settings = {        'ITEM_PIPELINES': {            'tn_scrapy.pipelines.TnScrapyPipeline': 300,        },        'DEFAULT_REQUEST_HEADERS': {            "user-agent": 'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (KHTML, like Gecko)             Chrome/78.0.3904.70 Safari/537.36',            'cookie': '登录后的cookie'        }    }    def parse(self, response):        html = re.findall(r'jsonp\d+\("(.*?)"\)', response.text)[0]        # 替换掉 \        html = re.sub(r'\\', '', html)        # print('html:', html)        response = response.replace(body=html)        link = response.xpath('//div[@class="item5line1"]/dl/dd[@class="detail"]/a/@href').extract()        print('link: ', link)

以上是“python怎么爬取天猫店铺商品链接”这篇文章的所有内容，感谢各位的阅读！希望分享的内容对大家有帮助，更多相关知识，欢迎关注编程网Python频道！

您可能感兴趣的文档:

--结束END--

本文标题: python怎么爬取天猫店铺商品链接

本文链接: https://lsjlt.com/news/272678.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

python怎么爬取天猫店铺商品链接

Python可以做什么

python怎么爬取天猫店铺商品链接

php如何爬取天猫和淘宝商品数据

Python爬虫学习教程：天猫商品数据爬虫

亚马逊怎么开服务器店铺的商品链接

Python爬取京东的商品分类与链接

Python爬虫爬取商品失败怎么办

使用Python怎么爬取淘宝的商品信息

怎么用云服务器访问亚马逊店铺商品

三丰云服务器怎么访问亚马逊店铺商品

python怎么爬取网站所有链接内容

python怎么爬取天气数据

亚马逊多店铺怎么挂服务器的链接呢

Python怎么爬取京东商品信息评论存并进MySQL

怎么使用python爬取网站所有链接内容

用Python爬取618当天某东热门商品销量数据,看看大家喜欢什么!

怎么用Python获取亚马逊商品信息

怎么用Python爬取天气并且语言播报

怎么用Python爬虫公众号文章和链接

python怎么爬取气象台每日天气图代码

python爬虫时提取数据后跟踪到下一个链接报错怎么办

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义