返回顶部
首页 > 资讯 > 后端开发 > Python >Python字体反爬实战案例分享
  • 613
分享到

Python字体反爬实战案例分享

2024-04-02 19:04:59 613人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

目录实战场景 实战编码 实战场景  本篇博客学习字体反爬,涉及的站点是实习 x,目标站点地址直接百度搜索即可。 可以看到右侧源码中出现了很多&ldqu

实战场景 

本篇博客学习字体反爬,涉及的站点是实习 x,目标站点地址直接百度搜索即可。

可以看到右侧源码中出现了很多“乱码”,这其中就包含了关键信息。

接下来按照常规的套路,在开发工具中检索字体相关信息,但是筛选之后,并没有得到反爬的字体,只有一个 file? 有些许的可能性。

这里就是一种新鲜的场景了,如果判断不准,那只能用字体样式和字体标签名进行判断了。
在网页源码中检索 @font-face 和 myFont,得到下图内容,这里发现 file 字体又出现了,看来解决问题的关键已经出现了。

下载文件名之后发现无后缀名,我们可以补上一个 .ttf 的后缀,接下来拖拽到 FontCreator 中,然后进行查阅。

二次刷新页面之后,再次获取一个 file 文件,查看二者是否有编码变化问题。

结论:每次请求字体文件,得到的响应无变化。

既然没有变化,后续的字体反爬实战编码就变的简单了。

实战编码 

解析字体文件,获取编码与字符。

from fontTools.ttLib import TTFont
font1 = TTFont('./fonts/file.ttf')
keys,values = [],[]
for k, v in font1.getBestCmap().items():
    print(k,v)

得到的结果如下所示:

2 extra bytes in post.stringData array
120 x
57345 uni4E00
57360 uni77
57403 uni56
……

然后我们查看一下实习僧站点返回的数据。

&#xf626&#xf395&#xf395-&#xf043&#xf395&#xf395

这其中又涉及到了编码的转换。

我们拿到一段带编码的文字,如下所示:

&#xedb3&#xe4d0&#xe4d0&#xedb3&#xe12a&#xeb3D销售实习&#xe595

接下来查看一下页面呈现的文字

SaaS软件销售实习生

其中 &#xedb3 对应的是 S 字符,再看一下该字符在字体文件中的编码,如下所示。

但是从刚才的结果中,并未得到 edb3 相关值,但是把十进制的编码进行转换之后,得到下述结果。

到此这篇关于python字体反爬实战案例分享的文章就介绍到这了,更多相关Python字体反爬 内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网!

--结束END--

本文标题: Python字体反爬实战案例分享

本文链接: https://lsjlt.com/news/118512.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python字体反爬实战案例分享
    目录实战场景 实战编码 实战场景  本篇博客学习字体反爬,涉及的站点是实习 x,目标站点地址直接百度搜索即可。 可以看到右侧源码中出现了很多&ldqu...
    99+
    2024-04-02
  • python起点网月票榜字体反爬案例
    目录前言:1.解析过程2.开始敲代码前言: 字体反爬是什么个意思?就是网站把自己的重要数据不直接的在源代码中呈现出来,而是通过相应字体的编码,与一个字体文件(一般后缀为ttf或wof...
    99+
    2024-04-02
  • Python Ajax爬虫案例分享
    目录1. 抓取街拍图片2. 分析街拍图片结构3. 按功能不同编写不同方法组织代码3.1 获取网页json格式数据3.2 从json格式数据提取街拍图片3.3 将街拍图片以其md5码命...
    99+
    2024-04-02
  • python政策网字体反爬实例(附完整代码)
    目录1 字体反爬案例2 使用环境3 安装python第三方库4 查看woff文件5 woff文件解决字体反爬全过程5.1 调用第三方库5.2 请求woff链接下载woff文件到本地5...
    99+
    2024-04-02
  • python超详细实现字体反爬流程
    目录查策实战场景字体实战解码字体反爬编码时间查策实战场景 本次要采集的目标站点是查策,该测试站点如下所示。 目标站点网址如下 www.chacewang.com/chanye/ne...
    99+
    2024-04-02
  • Python网络爬虫实战案例之:7000
    一、前言 本文是《Python开发实战案例之网络爬虫》的第三部分:7000本电子书下载网络爬虫开发实战详解。配套视频课程详见51CTO学院请添加链接描述。 二、章节目录 3.1 业务流程3.2 页面结构分析:目录页3.3 页面结构分析:详情...
    99+
    2023-01-31
    爬虫 实战 案例
  • Python爬取城市租房信息实战分享
    目录一、单线程爬虫二、优化为多线程爬虫三、使用asyncio进一步优化四、存入Mysql数据库(一)建表(二)将数据存入数据库中 五、最终效果图 (已打码)思路:先单线程爬...
    99+
    2024-04-02
  • Python爬虫案例分析
    本篇内容介绍了“Python爬虫案例分析”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成! 一、论述这几个案例以前是给一些想进入Pyt...
    99+
    2023-06-17
  • Golang应用实践:实战经验与案例分享
    Golang应用实践:实战经验与案例分享 近年来,作为一门快速发展且备受关注的编程语言,Golang在各个领域的应用越来越广泛。其简洁高效的设计让开发者能够快速地构建稳健的应用程序,同...
    99+
    2024-03-05
    golang 实践经验 案例分享 go语言 golang开发 标准库
  • Python开发之迭代器&生成器的实战案例分享
    目录迭代器&生成器实战案例迭代器&生成器 在 Python 中,迭代器和生成器都是用来遍历数据集合的工具,可以按需逐个生成或返回数据,从而避免一次性加载整个数据集合所...
    99+
    2023-05-16
    Python迭代器 生成器开发 Python迭代器 生成器 Python迭代器 Python生成器
  • C++结构体案例练习分享
    先来说一下结构体的一些例子 包含创建结构体和初始化操作 #include<iostream> #include<string> using namespace...
    99+
    2024-04-02
  • Golang动态库实战:案例分享与实用技巧
    Golang动态库实战:案例分享与实用技巧 在Golang(Go语言)中,使用动态库可以实现模块化开发、代码重用以及动态加载等功能。本文将通过案例分享和实用技巧,介绍如何在Golang...
    99+
    2024-03-01
    动态库 golang 实战 go语言 内存占用
  • Python基础案例分享
    本篇内容介绍了“Python基础案例分享”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!一、超市买薯片# 用户输入薯片的单价danj...
    99+
    2023-06-02
  • PHP Linux脚本编程指南:实战案例分享
    【引言】在如今互联网飞速发展的时代,服务器端的脚本编程无疑扮演着至关重要的角色。而PHP作为一种开源的脚本语言,拥有广泛的应用范围和强大的自由性。本文将为您介绍如何在Linux环境中使用PHP进行脚本编程,并通过具体的实战案例分享,帮助您快...
    99+
    2023-10-21
    Linux PHP 实战
  • 分享Python7个爬虫小案例(附源码)
            本次的7个python爬虫小案例涉及到了re正则、xpath、beautiful soup、selenium等知识点,非常适合刚入门python爬虫的小伙伴参考学习。注:若涉及到版权或隐私问题,请及时联系我删除即可。 1....
    99+
    2023-08-31
    python 爬虫 数据分析
  • Python异步爬取知乎热榜实例分享
    目录一、错误代码:摘要和详细的url获取不到二、查看JS代码一、错误代码:摘要和详细的url获取不到 import asyncio from bs4 import Beautiful...
    99+
    2024-04-02
  • python中如何实现反爬2021猫眼票房字体加密
    这篇文章主要介绍python中如何实现反爬2021猫眼票房字体加密,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!python主要应用领域有哪些1、云计算,典型应用OpenStack。2、WEB前端开发,众多大型网站均...
    99+
    2023-06-14
  • 五分钟教你弄懂了字体反爬是个啥
    今天的文章内容主要是关于字体反爬。目前已知的几个字体反爬的网站是猫眼,汽车之家,天眼查,起点中文网等等。以前也看过这方面的文章,今天跟个老哥在交流的时候,终于实操了一把,弄懂了字体反爬是个啥玩意。下面听我慢慢道来。本文用到的第三方库font...
    99+
    2023-06-02
  • PHP对象转字符的实用案例分享
    PHP是一种广泛应用于Web开发的脚本语言,其面向对象的特性使得开发者可以更加高效地编写和管理代码。在实际开发中,经常会遇到需要将PHP对象转换为字符串的情况,本文将分享一些实用的案例...
    99+
    2024-03-06
    php编程 php对象转字符 实用案例分享 iphone
  • PHP gPRC 案例分享:从实战中学习 gPRC 的应用
    什么是 gPRC? gRPC (gRPC远程过程调用)是一种现代RPC框架,专为分布式系统间的高效通信而设计。它基于HTTP/2协议,支持双向流、流控制和头压缩,可提供低延迟、高吞吐量和低资源开销的通信。 PHP gRPC 应用场景 P...
    99+
    2024-02-19
    gPRC PHP 实战 案例 开发
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作