返回顶部
首页 > 资讯 > 后端开发 > Python >Python如何爬取某拍短视频
  • 925
分享到

Python如何爬取某拍短视频

2023-06-15 11:06:13 925人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍python如何爬取某拍短视频,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一、抓取目标目标网址:美拍视频二、工具使用开发环境:win10、python3.7开发工具:PyCharm、Chrome工具

这篇文章主要介绍python如何爬取某拍短视频,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

一、抓取目标

目标网址:美拍视频

Python如何爬取某拍短视频

二、工具使用

开发环境:win10、python3.7
开发工具PyCharm、Chrome
工具包:requests、xpath、base64

三、重点学习内容

爬虫采集数据的解析过程
js代码调试技巧
js逆向解析代码
Python代码的转换

四、项目思路解析

进入到网站的首页
挑选你感兴趣的分类
根据首页地址获取到进入详情页面的超链接的跳转地址

Python如何爬取某拍短视频

找到对应加密的视频播放地址数据

Python如何爬取某拍短视频

这个数据是静态的网页数据,通过js代码进行解码的
找到对应的解析代码
先找到视频的播放地址
找到解析视频地址的加密js文件
点击播放的时候会触发文件

Python如何爬取某拍短视频

大致能看出来这个是base64加密之后的数据
在对应的js文件里搜索关键字
找到js的加密方式

Python如何爬取某拍短视频

js函数的一些函数的用法

# eplace()方法用于在字符串中用一些字符替换另一些字符    # parseInt 数据转换成对应的整型    # base64.atob   对base64编码过的字符串进行解码    # substring 方法可在字符串中抽取从 start 下标开始的指定数目的字符

Python如何爬取某拍短视频

将js代码转换成Python代码

import base64def decode(data):    def getHex(a):        return {            'str': a[4:],            'hex': ''.join(list(a[:4])[::-1]),        }    def getDec(a):        b = str(int(a, 16))        return {            'pre': list(b[:2]),            'tail': list(b[2:]),        }    def substr(a, b):        c = a[0: int(b[0])]        d = a[int(b[0]): int(b[0]) + int(b[1])]        return c + a[int(b[0]):].replace(d, "")    def getPos(a, b):        b[0] = len(a) - int(b[0]) - int(b[1])        return b    b = getHex(data)    c = getDec(b['hex'])    d = substr(b['str'], c['pre'])    return base64.b64decode(substr(d, getPos(d, c['tail'])))print(decode("e121Ly9tBrI84RdnZpZGVvMTAubWVpdHVkYXRhLmNvbS82MGJjZDcwNTE3NGZieXBueG5udnRwMTA5N19IMjY0XzFfNWY3YThmM2U0MTEwNy5tc2JVjAu3EDQ="))

得出最终视频播放地址

Python如何爬取某拍短视频
Python如何爬取某拍短视频

五、简易源码分享

import requestsfrom lxml import etreeimport base64def decode_mp4(data):    def getHex(a):        return {            'str': a[4:],            'hex': ''.join(list(a[:4])[::-1]),        }    def getDec(a):        b = str(int(a, 16))        return {            'pre': list(b[:2]),            'tail': list(b[2:]),        }    def substr(a, b):        c = a[0: int(b[0])]        d = a[int(b[0]): int(b[0]) + int(b[1])]        return c + a[int(b[0]):].replace(d, "")    def getPos(a, b):        b[0] = len(a) - int(b[0]) - int(b[1])        return b    b = getHex(data)    c = getDec(b['hex'])    d = substr(b['str'], c['pre'])    return base64.b64decode(substr(d, getPos(d, c['tail'])))# 运行主函数def main():    url = 'https://www.meipai.com'    headers = {        'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWEBKit/537.36 (Khtml, like Gecko) Chrome/75.0.3770.142 Safari/537.36',    }    response = requests.get(url=url, headers=headers)    html_data = etree.HTML(response.text)    href_list = html_data.xpath('//div/a/@href')    # print(href_list)    for href in href_list:        res = requests.get('Https://www.meipai.com' + href, headers=headers)        html = etree.HTML(res.text)        name = html.xpath('//div[@id="detailVideo"]/img/@alt')[0]        mp4_data = html.xpath('//div[@id="detailVideo"]/@data-video')[0]        # print(name, mp4_data)        mp4_url = decode_mp4(mp4_data).decode('utf-8')        print(mp4_url)        result = requests.get("http:" + mp4_url)        with open(name + ".mp4", 'wb') as f:            f.write(result.content)            f.close()if __name__ == '__main__':    main()

以上是“Python如何爬取某拍短视频”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注编程网Python频道!

--结束END--

本文标题: Python如何爬取某拍短视频

本文链接: https://lsjlt.com/news/280049.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python如何爬取某拍短视频
    这篇文章主要介绍Python如何爬取某拍短视频,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!一、抓取目标目标网址:美拍视频二、工具使用开发环境:win10、python3.7开发工具:pycharm、Chrome工具...
    99+
    2023-06-15
  • Python爬取某拍短视频
    目录一、抓取目标二、工具使用三、重点学习内容四、项目思路解析五、简易源码分享一、抓取目标 目标网址:美拍视频 二、工具使用 开发环境:win10、python3.7 开发工具:py...
    99+
    2024-04-02
  • Python爬虫:爬取美拍小姐姐视频
      最近在写一个应用,需要收集微博上一些热门的视频,像这些小视频一般都来自秒拍,微拍,美拍和新浪视频,而且没有下载的选项,所以只能动脑想想办法了。 第一步   分析网页源码。 例如:http://video.weibo.com/show...
    99+
    2023-01-30
    爬虫 姐姐 视频
  • Python爬虫爬取各大热门短视频平台视频
    1、开发工具 Python3.9 requests库 其他一些Python内置库 pycharm 2、第三方库 安装第三方库 pip install requests 3、实现思路 利用tkinter库实例化一个GUI界面,包含提示框...
    99+
    2023-09-10
    python 爬虫
  • Python如何实现短视频爬虫
    这篇文章主要介绍了Python如何实现短视频爬虫,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。网站地址在代码里面,大家用心一下就能看到了。使用的软件python 3...
    99+
    2023-06-25
  • Python+Selenium实现短视频热点爬取
    目录涉及知识点目标分析1. 分析热榜目录2.分析视频播放页面3. 分析弹出框核心代码1. 遍历热点目录2. 获取真实短视频url3. 下载视频4. 关闭弹出的登录窗口5. 保存日志示...
    99+
    2024-04-02
  • Python短视频爬虫教程
    好难受,上次发了做游戏的居然没人看,每天为了给你们写啥,老夫心都操碎了~ 真的是,今天来给大家爬一波短视频网站吧,都是些很养眼的~ 网站地址在代码里面,大家用心一下就能看到了。 ...
    99+
    2024-04-02
  • Python+Selenium怎么实现短视频热点爬取
    本篇内容介绍了“Python+Selenium怎么实现短视频热点爬取”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!涉及知识点selenium...
    99+
    2023-06-30
  • python爬取小视频
    python爬取小视频记录 学习python简单爬虫小程序,记录代码和学习过程 环境信息 python 2.7.12 分析与步骤 要分析网站信息 http://www.budejie.com/video/ 查看网页不同页面的信息...
    99+
    2023-01-31
    小视频 python
  • python爬取视频网站m3u8视频,下
    最近发现一些网站,可以解析各大视频网站的vip。仔细想了想,这也算是爬虫呀,爬的是视频数据。  首先选取一个视频网站,我选的是 影视大全 ,然后选择上映不久的电影 “一出好戏” 。 分析页面 我用的是chrome浏览器,F12进入查看。选...
    99+
    2023-01-30
    视频 网站 python
  • python爬虫:爬取网站视频
    python爬取百思不得姐网站视频:http://www.budejie.com/video/新建一个py文件,代码如下:#!/usr/bin/python # -*- coding: UTF-8 -*- import urllib,re...
    99+
    2023-01-31
    爬虫 视频 网站
  • python怎么爬取视频
    本篇内容介绍了“python怎么爬取视频”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!题目解析的爬取思路1.将所以题目的解析链接爬取出去单独...
    99+
    2023-06-02
  • Python如何实现爬取某站视频弹幕并绘制词云图
    这篇文章主要为大家展示了“Python如何实现爬取某站视频弹幕并绘制词云图”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Python如何实现爬取某站视频弹幕并绘制词云图”这篇文章吧。前言[课 题...
    99+
    2023-06-22
  • Python爬虫教你爬取视频内容
            前面介绍了基本的数据爬取,图片爬取的相关案例前面文章也有涉及,关于有些案例网站不能登录的问题,可以再找些别的网站,因为道理既然明白了,其实什么网站都一样,它有反爬机制,自然有应对它的办...
    99+
    2023-09-16
    爬虫 音视频 python
  • Python怎样爬取西瓜视频
    Python怎样爬取西瓜视频,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。一、写在前面真的,为什么别人发游戏这么多人看,我发了两次了加起来才一百个。算了算了,不整游戏了,反...
    99+
    2023-06-21
  • Python 自动爬取B站视频
    文件名自定义(文件格式为.py),脚本内容: #!/usr/bin/env python #-*-coding:utf-8-*- import requests import random import time def get_js...
    99+
    2023-01-30
    视频 Python
  • python爬取梨视频生活板块最热视频
    完整代码如下: import requests from lxml import etree import random import os from multiprocess...
    99+
    2024-04-02
  • Python实现爬取某站视频弹幕并绘制词云图
    目录前言爬取弹幕爬虫基本思路流程导入模块代码制作词云图导入模块读取弹幕数据前言 [课 题]: Python爬取某站视频弹幕或者腾讯视频弹幕,绘制词云图 [知识点]: 1. 爬虫基本流...
    99+
    2024-04-02
  • Python爬虫实战之虎牙视频爬取附源码
    目录知识点开发环境分析目标url开始代码最开始还是线导入所需模块数据请求获取视频标题以及url地址获取视频id保存数据调用函数运行代码,得到数据知识点 爬虫基本流程 ...
    99+
    2024-04-02
  • 怎么使用Python爬取抖音APP视频
    这篇文章主要讲解了“怎么使用Python爬取抖音APP视频”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python爬取抖音APP视频”吧!记录一下如何用python爬取app数据,...
    99+
    2023-06-15
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作