返回顶部
首页 > 资讯 > 后端开发 > Python >Python爬虫神器playwright怎么使用
  • 543
分享到

Python爬虫神器playwright怎么使用

2023-07-06 00:07:06 543人浏览 泡泡鱼

Python 官方文档:入门教程 => 点击学习

摘要

这篇文章主要介绍了python爬虫神器playwright怎么使用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python爬虫神器playwright怎么使用文章都会有所收获,下面我们一起来看看吧。前言今天把

这篇文章主要介绍了python爬虫神器playwright怎么使用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python爬虫神器playwright怎么使用文章都会有所收获,下面我们一起来看看吧。

前言

今天把最近的一个应用做好了,测试了一下运行没有问题,剩下的就是检验一下结果如何.从光谱到Lab值通常使用matlab中的roo2lab(),不过经过我最近的测试发现转换的结果并不理想,而且这个转化的代码也不是我写的所以另寻他法,找到了下面这个网页。

Python爬虫神器playwright怎么使用

动手

有了这个网页,很简单就想到去解析.然后很快找到了这个api,可以看到用post提交表单请求就可以返回结果。

Python爬虫神器playwright怎么使用

于是一番操作,修改fORM表单,构造传入的spectrum,但是最终请求得到的却是一个页面,并不是想要的JSON.然后许久没写爬虫的我直接恼火,想到自动化工具模拟操作.可是selenium很难用而且还得去找浏览器新版本的驱动,随后直接搜索一番,发现了这个神器—playwright。

首先老规矩去它的首页看看教程

Python爬虫神器playwright怎么使用

接着安装一下playwright以及浏览器的驱动。

pip install pytest-playwrightplaywright install

第二步的时候很慢,所以我只等他下载好了chrome和FFmpeg直接就ctrl+c停止了,毕竟我也用不着其他的浏览器驱动。

然后稍微浏览一下这个文档功能非常丰富,不过我用到的功能也不多,接下来的使用才是真正适合我们懒人的。

记住一行代码
Python -m playwright codegen xxx.com

其中xxx.com就是我们的目标网址,运行后会创建一个熟悉的自动化页面,然后我们就进行一些我们想要的操作,比如设置开始的最小波长为400nm,然后观察以及光源改为D65/10.一系列操作后会看到对应的代码已经生成好了。

Python爬虫神器playwright怎么使用

至今为止我还没有写一行代码,不过构造输入的光谱还是得自己来的。

把这一段代码复制下来,然后自己写构造输入的函数(就几行),然后通过选择器(直接左键元素复制xpath)得到lab值,这样目标就搞定了。

整体代码如下:

import timefrom playwright.sync_api import Playwright, sync_playwright, expectimport numpy as npdata_test=np.loadtxt('./dist/1_res.csv',delimiter=',')def get_str(arr):arr_str=""for i in arr:arr_str+=str(format(i,".2f"))+"rn"return arr_strlabs=[]def run(playwright: Playwright) -> None:browser = playwright.chromium.launch(headless=False)context = browser.new_context()# Open new pagepage = context.new_page()# Go to https://www.Qtccolor.com/secaiku/tool/spectrumpage.goto("Https://www.qtccolor.com/secaiku/tool/spectrum")# Click div[role="tab"]:has-text("光谱数据")page.locator("div[role="tab"]:has-text("光谱数据")").click(# Click text=最小波长:nmpage.locator("text=最小波长:nm").click()# Fill [placeholder="33 80"]page.locator("[placeholder="\33 80"]").fill("400")# Select 1964page.locator("select[name="obs"]").select_option("1964")# Select D65page.locator("select[name="ill"]").select_option("D65")# Fill textarea[name="spectrum"]for i in range(len(data_test)):inputs=get_str(data_test[i,:])# Click textarea[name="spectrum"]page.locator("textarea[name="spectrum"]").click()page.locator("textarea[name="spectrum"]").press("Control+a")page.locator("textarea[name="spectrum"]").fill(inputs)# Click button:has-text("转换颜色")page.locator("button:has-text("转换颜色")").click()time.sleep(1)# Click text=Lab0.000.000.00 >> td >> nth=1L=float(page.locator('xpath=//*[@]/div[1]/div/div[2]/table/tbody/tr[2]/td[2]').inner_text())# Click text=Lab0.000.000.00 >> td >> nth=2a=float(page.locator('xpath=//*[@]/div[1]/div/div[2]/table/tbody/tr[2]/td[3]').inner_text())# Click text=Lab0.000.000.00 >> td >> nth=3b=float(page.locator('xpath=//*[@]/div[1]/div/div[2]/table/tbody/tr[2]/td[4]').inner_text())print(L,a,b)labs.append([L,a,b])# ---------------------context.close()browser.close()with sync_playwright() as playwright:run(playwright)np.savetxt('./1_lab_res.csv',labs,delimiter=",")

可以说从安装到实现就几分钟,而且特别容易上手,我第一次用也一下就能实现效果。

Python爬虫神器playwright怎么使用

剩下的就是简单的写个函数计算色差啥的就没难度了。

关于“Python爬虫神器playwright怎么使用”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“Python爬虫神器playwright怎么使用”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注编程网Python频道。

--结束END--

本文标题: Python爬虫神器playwright怎么使用

本文链接: https://lsjlt.com/news/356956.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • Python爬虫神器playwright怎么使用
    这篇文章主要介绍了Python爬虫神器playwright怎么使用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Python爬虫神器playwright怎么使用文章都会有所收获,下面我们一起来看看吧。前言今天把...
    99+
    2023-07-06
  • 新一代爬虫利器Python Playwright详解
    目录安装方式特点使用方式代码生成选择器事件监听总结 Playwright是Microsoft在2020年初开源的新一代自动化测试工具,它的功能类似于Selenium、Pyppetee...
    99+
    2024-04-02
  • 怎么使用Python爬虫
    本篇内容介绍了“怎么使用Python爬虫”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!导入模块import re fro...
    99+
    2023-06-16
  • 怎么使用python爬虫爬取数据
    本篇内容介绍了“怎么使用python爬虫爬取数据”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!python爬出六部曲第一步:安装reques...
    99+
    2023-06-29
  • Python爬虫解析器BeautifulSoup4怎么使用
    这篇文章主要介绍“Python爬虫解析器BeautifulSoup4怎么使用”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python爬虫解析器BeautifulSoup4怎么使用”文章能帮助大家解...
    99+
    2023-07-02
  • python爬虫怎么使用BeautifulSoup库
    本篇内容介绍了“python爬虫怎么使用BeautifulSoup库”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!  BeautiSoup类...
    99+
    2023-06-02
  • python爬虫-execjs使用
    python爬虫-execjs使用 ecexjs的作用 通过python代码去执行JavaScript代码的库 execjs的安装 pip install PyExecJS execjs使用之前,得先安装node环境,去网上先去下载no...
    99+
    2023-01-31
    爬虫 python execjs
  • 一款懒人必备的Python爬虫神器
    前言今天把最近的一个应用做好了,测试了一下运行没有问题,剩下的就是检验一下结果如何.从光谱到Lab值通常使用matlab中的roo2lab(),不过经过我最近的测试发现转换的结果并不理想,而且这个转化的代码也不是我写的所以另寻他法,找到了下...
    99+
    2023-05-14
    Python 爬虫神器
  • Python爬虫XPath怎么用
    这篇文章主要为大家展示了“Python爬虫XPath怎么用”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Python爬虫XPath怎么用”这篇文章吧。一、问题描述1.什么是XPath?xpath...
    99+
    2023-06-25
  • 以视频爬取实例讲解Python爬虫神器Beautiful Soup用法
    1.安装BeautifulSoup4 easy_install安装方式,easy_install需要提前安装 easy_install beautifulsoup4 pip安装方式,pip也需要提前...
    99+
    2022-06-04
    爬虫 神器 实例
  • 使用Python多线程爬虫实现磁力链接搜索神器
    要实现一个磁力链接搜索神器,你可以使用Python的多线程爬虫来爬取磁力链接网站上的数据。以下是一个简单的示例代码:```pytho...
    99+
    2023-08-23
    python
  • 怎么使用python爬虫爬取二手房数据
    这篇文章主要介绍怎么使用python爬虫爬取二手房数据,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!python的数据类型有哪些python的数据类型:1. 数字类型,包括int(整型)、long(长整型)和floa...
    99+
    2023-06-14
  • 怎么使用Python进行爬虫技术
    这篇文章主要讲解了“怎么使用Python进行爬虫技术”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“怎么使用Python进行爬虫技术”吧!1.抓取py的url...
    99+
    2024-04-02
  • Python网络爬虫requests库怎么使用
    1. 什么是网络爬虫简单来说,就是构建一个程序,以自动化的方式从网络上下载、解析和组织数据。就像我们浏览网页的时候,对于我们感兴趣的内容我们会复制粘贴到自己的笔记本中,方便下次阅读浏览——网络爬虫帮我...
    99+
    2023-05-15
    Python Requests
  • 怎么使用Python的Scrapy爬虫框架
    本篇内容介绍了“怎么使用Python的Scrapy爬虫框架”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Scrapy是Python开发的一个...
    99+
    2023-06-02
  • python爬虫之selenium模块怎么使用
    这篇文章主要介绍了python爬虫之selenium模块怎么使用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇python爬虫之selenium模块怎么使用文章都会有所收获,下面我们一起来看看吧。一、什么是Se...
    99+
    2023-06-30
  • Python爬虫1-使用urlopen
    GitHub代码练习地址:https://github.com/Neo-ML/PythonPractice/blob/master/SpiderPrac01_urlopen.py 爬虫简介- 爬虫定义:网络爬虫(又被称为网页蜘蛛,网络机器...
    99+
    2023-01-30
    爬虫 Python urlopen
  • Playwright怎么使用
    这篇文章主要讲解了“Playwright怎么使用”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Playwright怎么使用”吧!Playwright是由微软公司2020年初发布的新一代自动化...
    99+
    2023-06-25
  • Python爬虫怎么突破反爬虫机制
    这篇文章主要介绍“Python爬虫怎么突破反爬虫机制”,在日常操作中,相信很多人在Python爬虫怎么突破反爬虫机制问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python爬虫怎么突破反爬虫机制”的疑惑有所...
    99+
    2023-06-25
  • Python 爬虫库RoboBrowser怎么用
    这篇文章主要介绍“Python 爬虫库RoboBrowser怎么用”,在日常操作中,相信很多人在Python 爬虫库RoboBrowser怎么用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python 爬虫...
    99+
    2023-06-13
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作