首页 > 资讯 > 后端开发 > Python >使用pyppteer+ddddocr通过极验滑块验证码（附源码）

652

分享到

使用pyppteer+ddddocr通过极验滑块验证码（附源码）

爬虫 python 2023-10-20 19:10:10 652人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

前言：验证码是大多数爬虫都需要克服的难题。pyppteer是目前市场主流的自动化工具之一，它的优势在于不易被浏览器检测到，DDDdocr也是目前主流的验证码识别的第三方模块。接下来就通过python自动化工具和ddddoc

前言：

验证码是大多数爬虫都需要克服的难题。pyppteer是目前市场主流的自动化工具之一，它的优势在于不易被浏览器检测到，DDDdocr也是目前主流的验证码识别的第三方模块。接下来就通过python自动化工具和ddddocr等第三方模块完成极验滑块。

一：使用自动化工具打开网站

目标网站：行为验证4.0-适应型验证码-滑动验证,点选验证,图片验证-极验GeeTest

    # 浏览器 启动参数    start_parm = {        # 关闭无头浏览器        "headless": False,        "args": [            '--disable-infobars',  # 关闭自动化提示框            '--no-sandbox',  # 关闭沙盒模式            '--start-maximized',  # 窗口最大化模式        ],    }    browser = await launch(**start_parm)    page = await browser.newPage()    # 设置网页 视图大小    await page.setViewport(viewport={'width': 1920, 'height': 1080})    await page.Goto('https://www.geetest.com/adaptive-captcha-demo')

二：控制鼠标定位到指定元素

   await page.waitForXPath('//div[@class="type-config"]')  # 等待元素加载    botton1 = await page.xpath('//div[@class="tab-item tab-item-1"]')  # 滑块拼图验证按钮    await botton1[0].click()    await page.click('#captcha', options={        'button': 'left',        'clickCount': 2,        'delay': 300,  # 延迟点击(ms)    })    botton2 = await page.xpath('//*[@aria-label="点击按钮开始验证"]')  # 开始验证按钮    await botton2[0].click()

三：提取滑块拼图照片url

elements_1 = await page.xpath(            '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[1]/div[1]/div[1]/@style')  # 滑块图片链接        elements_2 = await page.xpath(            '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[1]/div[2]/@style')  # 背景图片链接        for element in elements_1:            sc = await page.evaluate('(element) => element.textContent', element)            sc_url = sc.split('"')[1].split('"')[0]  # 提取滑块图片链接            with open('slice.png', 'wb')as f1:                f1.write(requests.get(sc_url).content)        for element in elements_2:            bg = await page.evaluate('(element) => element.textContent', element)            bg_url = bg.split('"')[1].split('"')[0]  # 提取背景图片链接            with open('bg.png', 'wb') as f2:                f2.write(requests.get(bg_url).content)

四：获取拼图坐标偏移量

async def get_xy():    det = ddddocr.DdddOcr(det=False, ocr=False)    with open('slice.png', 'rb') as f:        target_bytes = f.read()    with open('bg.png', 'rb') as f:        background_bytes = f.read()    try:        res = det.slide_match(target_bytes, background_bytes)        print(res)        return res.get('target')[0]    except:        return False

五：操作鼠标移动滑块

其中x，y需要根据自己电脑进行微调。

        if target:            # print(target)            botton3 = await page.xpath(                '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[2]/div/div[3]')            await botton3[0].hover()  # 鼠标悬停元素上            await page.mouse.down()  # 鼠标落下            await page.waitFor(500)            x = 1116 + target            y = 641            await page.mouse.move(x, y, {'steps': 2})  # 鼠标移动            await page.waitFor(500)            await page.mouse.up()  # 鼠标松开            time.sleep(2)            elements_3 = await page.xpath('//*[@id="captcha"]/div[2]/div[1]/div[3]/div[2]/div/div[2]/text()')            msg = ''            for element in elements_3:                msg = await page.evaluate('(element) => element.textContent', element)            if msg == '验证通过':                break            else:                print(msg)        else:  # 获取坐标失败时刷新验证            botton4 = await page.xpath('//*[@aria-label="刷新验证"]')            await botton4[0].click()

验证通过，欧耶~

六：完整代码

# coding:utf-8import ddddocr# coding:utf-8import asyncioimport timeimport requestsfrom pyppeteer.launcher import DEFAULT_ARGSDEFAULT_ARGS.remove("--enable-automation")from pyppeteer import launchasync def main():    # 浏览器 启动参数    start_parm = {        # 关闭无头浏览器        "headless": False,        "args": [            '--disable-infobars',  # 关闭自动化提示框            '--no-sandbox',  # 关闭沙盒模式            '--start-maximized',  # 窗口最大化模式        ],    }    browser = await launch(**start_parm)    page = await browser.newPage()    # 设置网页 视图大小    await page.setViewport(viewport={'width': 1920, 'height': 1080})    await page.goto('https://www.geetest.com/adaptive-captcha-demo')    time.sleep(2)    await page.waitForXPath('//div[@class="type-config"]')  # 等待元素加载    botton1 = await page.xpath('//div[@class="tab-item tab-item-1"]')  # 滑块拼图验证按钮    await botton1[0].click()    await page.click('#captcha', options={        'button': 'left',        'clickCount': 2,        'delay': 300,  # 延迟点击(ms)    })    botton2 = await page.xpath('//*[@aria-label="点击按钮开始验证"]')  # 开始验证按钮    await botton2[0].click()    while True:        time.sleep(5)        elements_1 = await page.xpath(            '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[1]/div[1]/div[1]/@style')  # 滑块图片链接        elements_2 = await page.xpath(            '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[1]/div[2]/@style')  # 背景图片链接        for element in elements_1:            sc = await page.evaluate('(element) => element.textContent', element)            sc_url = sc.split('"')[1].split('"')[0]  # 提取滑块图片链接            with open('slice.png', 'wb')as f1:                f1.write(requests.get(sc_url).content)        for element in elements_2:            bg = await page.evaluate('(element) => element.textContent', element)            bg_url = bg.split('"')[1].split('"')[0]  # 提取背景图片链接            with open('bg.png', 'wb') as f2:                f2.write(requests.get(bg_url).content)        target = await get_xy()  # 得到滑块x坐标偏移量        if target:            # print(target)            botton3 = await page.xpath(                '//*[@id="captcha"]/div[2]/div[1]/div[4]/div[1]/div[2]/div/div/div[2]/div/div[3]')            await botton3[0].hover()  # 鼠标悬停元素上            await page.mouse.down()  # 鼠标落下            await page.waitFor(500)            x = 1116 + target            y = 641            await page.mouse.move(x, y, {'steps': 2})  # 鼠标移动            await page.waitFor(500)            await page.mouse.up()  # 鼠标松开            time.sleep(2)            elements_3 = await page.xpath('//*[@id="captcha"]/div[2]/div[1]/div[3]/div[2]/div/div[2]/text()')            msg = ''            for element in elements_3:                msg = await page.evaluate('(element) => element.textContent', element)            if msg == '验证通过':                break            else:                print(msg)        else:  # 获取坐标失败时刷新验证            botton4 = await page.xpath('//*[@aria-label="刷新验证"]')            await botton4[0].click()    input('---验证通过---')    await browser.close()async def get_xy():    det = ddddocr.DdddOcr(det=False, ocr=False)    with open('slice.png', 'rb') as f:        target_bytes = f.read()    with open('bg.png', 'rb') as f:        background_bytes = f.read()    try:        res = det.slide_match(target_bytes, background_bytes)        print(res)        return res.get('target')[0]    except:        return Falseif __name__ == '__main__':    main()    asyncio.get_event_loop().run_until_complete(main())

来源地址：https://blog.csdn.net/weixin_61736939/article/details/130048614

您可能感兴趣的文档:

--结束END--

本文标题: 使用pyppteer+ddddocr通过极验滑块验证码（附源码）

本文链接: https://lsjlt.com/news/433171.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

回答

如何调试操作系统的错误？
操作系统

2023-11-15发布

回答

操作系统中的I/O系统是如何实现的？
操作系统

2023-11-15发布

回答

如何实现操作系统的内存管理？
操作系统

2023-11-15发布

回答

什么是虚拟内存，它对操作系统有什么影响？
操作系统

2023-11-15发布

回答

ASP中的MVC架构和WebForms架构有什么区别和使用场景？
ASP.NET

2023-11-15发布

回答

ASP中的数据验证和数据校验有什么不同？
ASP.NET

2023-11-15发布

回答

ASP中的ADO对象和DAO对象有什么区别和使用方法？
ASP.NET

2023-11-15发布

回答

Node.js中的包管理器NPM是什么？如何使用它进行依赖管理？
node.js

2023-11-15发布

回答

Vue.js中的动态组件是什么？如何使用它来动态渲染组件？
VUE

2023-11-15发布

回答

如何使用Vue.js实现懒加载和预加载？
VUE

2023-11-15发布

使用pyppteer+ddddocr通过极验滑块验证码（附源码）

前言：

一：使用自动化工具打开网站

二：控制鼠标定位到指定元素

三：提取滑块拼图照片url

四：获取拼图坐标偏移量

五：操作鼠标移动滑块

六：完整代码

使用pyppteer+ddddocr通过极验滑块验证码（附源码）

python 识别图片验证码/滑块验证码准确率极高的 ddddocr 库

如何使用php+js实现极验，拖动滑块验证码验证表单

Python通用验证码识别OCR库之ddddocr验证码识别

Python中怎么使用ddddocr库识别图片与滑块验证码

Python中识别图片/滑块验证码准确率极高的ddddocr库详解

【JavaScript 逆向】极验三代滑块验证码逆向分析

用selenium解决滑块验证码

如何使用Python实现极验验证码识别验证码

Python怎么通用验证码识别OCR库ddddocr

Python通用验证码识别OCR库ddddocr的安装使用

怎么用JavaScript实现滑块验证码

Python通用验证码识别OCR库ddddocr的安装使用教程

怎么使用python识别滑块验证码中的缺口

怎么使用selenium+opencv实现滑块验证码的登陆

用selenium解决滑块验证码的实现步骤

如何用python识别滑块验证码中的缺口

使用python 怎么实现一个滑块验证码识别功能

Vue3+Vue-cli4项目中使用腾讯滑块验证码的方法

如何使用random模块生成验证码

python分析数据的方法是什么

如何使用Python实现抽奖小程序

python copy函数的作用是什么

python ffmpeg模块怎么安装和使用

python进程池创建队列的方法是什么

python无法运行文件的原因有哪些

python can't open file报错怎么解决

python keyerror错误怎么解决

python字符串处理与应用的方法有哪些

python全局变量如何定义