python3 网页爬虫图片下载无效链

爬虫图片下载网页 2023-01-31 07:01:07 462人浏览安东尼

Python 官方文档：入门教程 => 点击学习

摘要

代码比较粗糙，主要是备忘容易出错的地方。供自己以后查阅。#图片下载import reimport urllib.request #python3中模块名和2.x（urllib）的不一样site='https://world.taoba

代码比较粗糙，主要是备忘容易出错的地方。供自己以后查阅。

#图片下载

import re

import urllib.request #python3中模块名和2.x（urllib）的不一样

site='https://world.taobao.com/item/530762904536.htm?spm=a21bp.7806943.topsale_XX.4.jcjxZC'

page=urllib.request.urlopen(site)

html=page.read()

html=html.decode('utf-8') #读取下来的网页源码需要转换成utf-8格式

reg=r'src="//(gd.*?jpg)'

imgre=re.compile(reg)

imglist=re.findall(imgre,html)

trueurls=[]

for i in imglist:

trueurls.append(i.replace('gd','Http://gd'))

trueurls[2]='/file/imgs/upload/202301/31/2y5b5vypata.jpg'

print (trueurls)

x=200

for j in trueurls:

try:

urllib.request.urlretrieve(j,'%s.jpg' %x)

except Exception : #except Exception as e:

pass # print (e)

# print ('有无效链接')

x=x+1

在except子句可以打印出一些提示信息

下载图片的时候，如果有无效的链接，可以用try except跳过无效链接继续下一个图片的下载

您可能感兴趣的文档:

--结束END--

本文标题: python3 网页爬虫图片下载无效链

本文链接: https://lsjlt.com/news/192217.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

猜你喜欢

python3 网页爬虫图片下载无效链

代码比较粗糙，主要是备忘容易出错的地方。供自己以后查阅。#图片下载import reimport urllib.request #python3中模块名和2.x（urllib）的不一样site='https://world.taoba...

99+

2023-01-31

爬虫图片下载网页
Python3实现Web网页图片下载

先来介绍一些python web编程基础知识 1. GET与POST区别 1)POST是被设计用来向web服务器上放东西的，而GET是被设计用来从服务器取东西的，GET也能够向服务器传送较少的数据，而Get...

99+

2022-06-04

图片下载网页 Web
【Python3爬虫】网易云音乐歌单下载

　　下载网易云音乐热门歌单　　requests，multiprocessing，re。　　（1）页面分析：首先打开网易云音乐，选择热门歌单，可以看到以下歌单列表，然后打开开发者工具　　因此我们需要请求的url就是...

99+

2023-01-30

爬虫网易音乐
python3爬虫-下载网易云音乐，评论

# -*- coding: utf-8 -*- ''' 16位随机字符的字符串参数一获取歌曲下载地址 "{"ids":"[1361348080]","level":"standard","encodeType":"aac...

99+

2023-01-31

爬虫下载网音乐
python3爬虫（4）各种网站视频下载

理论上来讲只要是网上（浏览器）能看到图片，音频，视频，都能够下载下来，然而实际操作的时候也是有一定难度和技术的，这篇文章主要讲述各个网站视频资源如何下载。 B站视频页面链接： https://www.bilibili.com/ban...

99+

2023-01-31

爬虫视频下载网站
java 下载网页，图片

java根据图片的url地址下载图片到本地，已知图片的url地址，通过java代码下载到本地，直接上代码。 public static void downloadImgByNet(String imgSrc,String filePath...

99+

2020-02-24

java教程 java
python爬虫入门实战之爬取网页图片

本篇文章给大家带来了关于Python的相关知识，其中主要整理了爬取网页图片的相关问题，要想高效的获取数据，爬虫是非常好用的，而用python做爬虫也十分简单方便，下面通过一个简单的小爬虫程序来看一看写爬虫的基本过程，下面一起来看一下，希望对...

99+

2022-07-11

python
nodejs制作爬虫实现批量下载图片

今天想获取一大批猫的图片，然后就在360流浪器搜索框中输入猫，然后点击图片。就看到了一大波猫的图片： http://image.so.com/i?q=%E7%8... ，我在想啊，要是审查元素，...

99+

2022-06-04

爬虫批量下载图片
爬虫：输入网页之后爬取当前页面的图片和背

环境：py3.6 核心库：selenium(考虑到通用性，js加载的网页)、pyinstaller 颜色显示：colors.py colors.py 用于在命令行输出文字时，带有颜色，可有可无。 # -*- coding:utf-8 ...

99+

2023-01-30

爬虫页面网页
nodejs如何制作爬虫实现批量下载图片

小编给大家分享一下nodejs如何制作爬虫实现批量下载图片，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！今天想获取一大批猫的图片，然后就在360流浪器搜索框中输入猫，然后点击图片。就看...

99+

2024-04-02
如何使用Python爬虫实现自动下载图片

小编给大家分享一下如何使用Python爬虫实现自动下载图片，希望大家阅读完这篇文章之后都有所收获，下面让我们一起去探讨吧！python的数据类型有哪些python的数据类型：1. 数字类型，包括int（整型）、long（长整型）和float...

99+

2023-06-14
python 批量下载网页里的图片

import requestsimport sys,re#设置提取图片url 的正则表达式imgre = re.compile(r"<img id=\"imgis\" src='(.*)'")#存放找到的图片url的列表all_i...

99+

2023-01-31

批量下载网页图片
一个下载网页图片的shell脚本

记得去年找工作面试时，听到一位同学说自己非常喜欢linux，我相信他说的是真的，我觉得喜欢linux的人很大的快乐来自shell脚本，因为它能够整合linux上的各种资源干大事。下面和大家分享下一个shel...

99+

2022-06-04

脚本下载网页图片
win10如何批量下载网页中图片

本篇内容介绍了“win10如何批量下载网页中图片”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！首先要在电脑上安装迅雷打开电脑，打开自带的Ed...

99+

2023-07-01
Python：使用爬虫抓取网页中的视频并下载（完整源码）

Python：使用爬虫抓取网页中的视频并下载（完整源码）在今天的程序开发世界中，网站是不可或缺的一部分。人们使用网站来获取有用的信息、购买商品和娱乐自己。这些网站的内容通常包含了各种类型的文件，其中...

99+

2023-08-31

python 爬虫音视频
Java读取网页内容并下载图片的实例

Java读取网页内容并下载图片的实例很多人在第一次了解数据采集的时候，可能无从下手，尤其是作为一个新手，更是感觉很是茫然，所以，在这里分享一下自己的心得，希望和大家一起分享技术，如...

99+

2023-05-31

java 读取网页 ava
如何编写一个下载网页图片的shell脚本

这篇文章主要介绍“如何编写一个下载网页图片的shell脚本”，在日常操作中，相信很多人在如何编写一个下载网页图片的shell脚本问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”如何编写一个下载网页图片的shel...

99+

2023-06-09
小程序怎么实现下载图片并且显示进度的页面效果

本篇内容介绍了“小程序怎么实现下载图片并且显示进度的页面效果”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！图片效果wxmljs1...

99+

2023-06-26
Android下保存简单网页到本地(包括简单图片链接转换)实现代码

最近在做一个项目涉及到将包含图片的简单网页下载到本地，方便离线时观看，在这里分享一下，大家做下简单修改就可以用到自己的项目中了。（这里用到了AQuery库）代码如下:pa...

99+

2022-06-06

图片图片链接 Android