返回顶部
首页 > 资讯 > 后端开发 > Python >Python爬虫怎么全网搜索并下载音乐
  • 754
分享到

Python爬虫怎么全网搜索并下载音乐

2023-06-15 14:06:07 754人浏览 独家记忆

Python 官方文档:入门教程 => 点击学习

摘要

本篇内容主要讲解“python爬虫怎么全网搜索并下载音乐”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python爬虫怎么全网搜索并下载音乐”吧!现在写一篇博客总是喜欢先谈需求或者本内容的应用场

本篇内容主要讲解“python爬虫怎么全网搜索并下载音乐”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习python爬虫怎么全网搜索并下载音乐”吧!

现在写一篇博客总是喜欢先谈需求或者本内容的应用场景,是的,如果写出来的东西没有任何应用价值,确实也没有实际意义。今天的最早的需求是来自于  如何免费[白嫖]下载全网优质音乐 ,我去b站上面搜索到了一个大牛做过的一个歌曲搜索神器,界面是这样的:

Python爬虫怎么全网搜索并下载音乐

确实很好用的,而且涵盖了互联网上面大多数主流的音乐网站,涉及到的版本也很多,可谓大而全,但是一个技术人的追求远远不会如此,于是我就想去了解其中背后的原理,因为做过网络爬虫的人都知道,爬虫只能爬取某一页或者某些页的网站资源,所以我很好奇它背后是怎么实现的?

笔者一直以来都是做的基于python3.7版本的网络爬虫,所以本文也是基于此来学习记录的。首先爬取的网站不是对应的音乐网站,而是一个 音乐直链搜索  ,那里汇聚了大多数音频音乐的解析功能,界面如下:

Python爬虫怎么全网搜索并下载音乐

所以自制一个搜索引擎的思想也很直观了,那就是利用第三方的接口,直接对该服务器发起请求即可,然后将获取的数据进行解析保存。这里以最近比较火的歌曲“白月光与朱砂痣”下载为例:

Python爬虫怎么全网搜索并下载音乐

解析的结果如上,获取的数据格式是 JSON 类型,并且除了要有歌名以外,还要有音乐平台。

源代码实现如下:

import requests import jsonpath import os """     1.url     2.模拟浏览器请求     3.解析网页源代码     4.保存数据 """ def song_download(url,title,author):     # 创建文件夹     os.makedirs("music",exist_ok=True)     path = 'music\{}.mp3'.fORMat(title)     print('歌曲:{0}-{1},正在下载...'.format(title,author))     # 下载(这种读写文件的下载方式适合少量文件的下载)     content = requests.get(url).content     with open(file = title + author + '.mp3',mode='wb') as f:         f.write(content)     print('下载完毕,{0}-{1},请试听'.format(title,author))  def get_music_name():     """     搜索歌曲名称     :return:     """     name = input("请输入歌曲名称:")     print("1.网易云:netease\n2.QQ:qq\n3.酷狗:kuGou\n4.酷我:kuwo\n5.百度:baidu\n6.喜马拉雅:ximalaya")     platfrom = input("输入音乐平台类型:")     print("-------------------------------------------------------")     url = 'https://music.liuzhijin.cn/'     headers = {         "user-agent":"Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/87.0.4280.141 Safari/537.36",         # 判断请求是异步还是同步         "x-requested-with":"XMLHttpRequest",     }     param = {         "input":name,         "filter":"name",         "type":platfrom,         "page": 1,     }     res = requests.post(url=url,data=param,headers=headers)     json_text = res.json()      title = jsonpath.jsonpath(json_text,'$..title')     author = jsonpath.jsonpath(json_text,'$..author')     url = jsonpath.jsonpath(json_text, '$..url')     if title:         songs = list(zip(title,author,url))         for s in songs:             print(s[0],s[1],s[2])         print("-------------------------------------------------------")         index = int(input("请输入您想下载的歌曲版本:"))         song_download(url[index],title[index],author[index])     else:         print("对不起,暂无搜索结果!")  if __name__ == "__main__":     get_music_name()

演示一下运行效果:

Python爬虫怎么全网搜索并下载音乐

然后文件下就会出现对应的歌曲 .mp3 文件

Python爬虫怎么全网搜索并下载音乐

并且每次的歌曲检索都是在PyCharm专业版的控制台中进行的,这样的用户体验就非常糟糕,所以针对以上两个问题,我对源代码进行了改进。

# 导入模块 from tkinter import * import requests import jsonpath import os from urllib.request import urlretrieve  # 2.功能实现 """     1.url     2.模拟浏览器请求     3.解析网页源代码     4.保存数据 """ def song_download(url,title,author):     # 创建文件夹     os.makedirs("music",exist_ok=True)     path = 'music\{}.mp3'.format(title)     text.insert(END,'歌曲:{0}-{1},正在下载...'.format(title,author))     # 文本框滑动     text.see(END)     # 更新     text.update()     # 下载     urlretrieve(url,path)     text.insert(END,'下载完毕,{0}-{1},请试听'.format(title,author))     # 文本框滑动     text.see(END)     # 更新     text.update()  def get_music_name():     """     搜索歌曲名称     :return:     """     name = entry.get()     platfrom = var.get()     # name = '白月光与朱砂痣'     url = 'https://music.liuzhijin.cn/'     headers = {         "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36",         # 判断请求是异步还是同步         "x-requested-with":"XMLHttpRequest",     }     param = {         "input":name,         "filter":"name",         "type":platfrom,         "page": 1,     }     res = requests.post(url=url,data=param,headers=headers)     json_text = res.json()      title = jsonpath.jsonpath(json_text,'$..title')     author = jsonpath.jsonpath(json_text,'$..author')     url = jsonpath.jsonpath(json_text, '$..url')     print(title,author,url)     song_download(url[0],title[0],author[0])   # 1.用户界面 # 创建画板 root = Tk() # 设置窗口标题 root.title('全网音乐下载器') # 设置窗口大小以及出现的位置 root.geometry('560x450+400+200') # 标签组件 label = Label(root,text="请输入下载的歌曲:",font=('楷体',20)) # 定位与布局 label.grid(row=0) # 输入框组件 entry = Entry(root,font=('宋体',20)) entry.grid(row=0,column=1) # 单选按钮 var = StringVar() r1 = Radiobutton(root,text='网易云',variable=var,value='netease') r1.grid(row=1,column=0) r2 = Radiobutton(root,text='QQ',variable=var,value='qq') r2.grid(row=1,column=1) # 列表框 text = Listbox(root,font=('楷体',16),width=50,height=15) text.grid(row=2,columnspan=2) # 下载按钮 button1 = Button(root,text='开始下载',font=('楷体',15),command=get_music_name) button1.grid(row=3,column=0) button2 = Button(root,text='退出程序',font=('楷体',15),command=root.quit) button2.grid(row=3,column=1) # 显示界面 root.mainloop()  # 如何将.py代码打包成.exe文件

我们再来看看效果吧

Python爬虫怎么全网搜索并下载音乐

这样加上了UI界面和部分代码优化之后,就可以通过 .py代码打包成.exe文件 发布给用户使用了。

到此,相信大家对“Python爬虫怎么全网搜索并下载音乐”有了更深的了解,不妨来实际操作一番吧!这里是编程网网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

--结束END--

本文标题: Python爬虫怎么全网搜索并下载音乐

本文链接: https://lsjlt.com/news/280578.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python爬虫怎么全网搜索并下载音乐
    本篇内容主要讲解“Python爬虫怎么全网搜索并下载音乐”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python爬虫怎么全网搜索并下载音乐”吧!现在写一篇博客总是喜欢先谈需求或者本内容的应用场...
    99+
    2023-06-15
  • 【Python3爬虫】网易云音乐歌单下载
      下载网易云音乐热门歌单     requests,multiprocessing,re。     (1)页面分析:首先打开网易云音乐,选择热门歌单,可以看到以下歌单列表,然后打开开发者工具    因此我们需要请求的url就是...
    99+
    2023-01-30
    爬虫 网易 音乐
  • python3爬虫-下载网易云音乐,评论
    # -*- coding: utf-8 -*- ''' 16位随机字符的字符串 参数一 获取歌曲下载地址 "{"ids":"[1361348080]","level":"standard","encodeType":"aac...
    99+
    2023-01-31
    爬虫 下载网 音乐
  • python语言怎么爬取网易云音乐
    小编给大家分享一下python语言怎么爬取网易云音乐,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!正式进入主题首先还是去找目标网页并开始分析网页结构,如下上面的三...
    99+
    2023-06-02
  • python怎么爬取搜索后的网页
    要爬取搜索后的网页,可以使用Python中的爬虫库(如Requests、BeautifulSoup、Scrapy等)来发送HTTP请...
    99+
    2023-09-15
    python
  • Python:使用爬虫抓取网页中的视频并下载(完整源码)
    Python:使用爬虫抓取网页中的视频并下载(完整源码) 在今天的程序开发世界中,网站是不可或缺的一部分。人们使用网站来获取有用的信息、购买商品和娱乐自己。这些网站的内容通常包含了各种类型的文件,其中...
    99+
    2023-08-31
    python 爬虫 音视频
  • python爬虫怎么使用内置的scrapy内置下载文件
    这篇文章主要介绍python爬虫怎么使用内置的scrapy内置下载文件,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!python是什么意思Python是一种跨平台的、具有解释性、编译性、互动性和面向对象的脚本语言,其...
    99+
    2023-06-14
  • 怎么用python实现精准搜索并提取网页核心内容
    这篇文章主要讲解了“怎么用python实现精准搜索并提取网页核心内容”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么用python实现精准搜索并提取网页核心内容”吧!生成PDF开始想了一个...
    99+
    2023-06-25
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作