首页 > 资讯 > 后端开发 > Python >python+playwright 学习-2.Selector 选择器定位元素

612

分享到

python+playwright 学习-2.Selector 选择器定位元素

python 学习 css 2023-08-31 10:08:34 612人浏览独家记忆

Python 官方文档：入门教程 => 点击学习

摘要

前言 Selector 选择器，也就是通常说的元素定位了，页面上点点点的操作，都是基于元素定位，所以这块是重点需要学的核心内容。 Selector 选择器说到元素定位，大家肯定会首先想到

前言

Selector 选择器，也就是通常说的元素定位了，页面上点点点的操作，都是基于元素定位，所以这块是重点需要学的核心内容。

Selector 选择器

说到元素定位，大家肯定会首先想到 selenium 的八大元素定位，其中xpath 和 CSS才是最主要的。
playwright 可以通过 CSS selector, XPath selector, html 属性（比如 id, data-test-id）或者是 text 文本内容定位元素。
除了xpath selector外，所有selector默认都是指向shadow DOM，如果要指向常规DOM，可使用*:light。不过通常不需要。

操作元素，可以先定位再操作

   # 先定位再操作    page.locator('#kw').fill("上海悠悠")    page.locator('#su').click()

也可以直接调用fill 和 click 方法，传Selector选择器

page.fill('#kw', "上海-悠悠博客")page.click('#su')

一般推荐下面的这种方式

CSS 或 XPath 选择器

可以使用xpath 和 css 元素

# CSS and XPathpage.fill('css=#kw', "上海-悠悠博客")page.click('xpath=//*[@id="su"]')

或者可以直接写xpath和css语法，不需要前面的前缀css= 和 xpath=, 它会自动判断你写的是css还是xpath语法，前提是你语法没有错误。

page.fill('#kw', "上海-悠悠博客")page.click('//*[@id="su"]')

XPath 和 CSS 选择器可以绑定到 DOM 结构或实现。
当 DOM 结构发生变化时，这些选择器可能会中断。下面的长 CSS 或 XPath 链是导致测试不稳定的不良做法的示例：

page.click("#tsf > div:nth-child(2) > div.A8SBwf > div.RNNXgb > div > div.a4bIc > input")page.click('//*[@id="tsf"]/div[2]/div[1]/div[1]/div/div[2]/input')

text 文本选择器

文本选择器是一个非常实用的定位方式，根据页面上看到的text文本就可以定位了，比如我们经常使用xpath 的文本选择器定位

完全匹配文本 //*[text()="上海悠悠"]
包含某个文本 //*[contains(text(),"上海悠悠")]

playwright 封装了text文本定位的方式，也可以支持2种文本定位方式

page.click("text=yo yo")page.click("text='YO YO'")

text=yo yo 和 text='YO YO' 的区别：

text=yo yo 没有加引号（单引号或者双引号），模糊匹配，对大小写不敏感
text=‘YO YO’ 有引号，精确匹配，对大小写敏感

使用示例,比如点击百度上的“新闻” 文本

from playwright.sync_api import sync_playwright# 上海悠悠 wx:283340479  # blog:https://www.cnblogs.com/yoyoketang/with sync_playwright() as p:    browser = p.chromium.launch(headless=False, slow_mo=1000)    page = browser.new_page()    page.Goto("Https://www.baidu.com")    print(page.title())    page.click('text=新闻')    page.wait_for_timeout(5000)    browser.close()

text 文本除了可以定位 a 标签，还可以定位 button 按钮

input 标签的button 按钮，有value="百度一下" 文本值

或者是button 标签的按钮

使用示例:定位百度的搜索按钮

from playwright.sync_api import sync_playwright# 上海悠悠 wx:283340479  # blog:https://www.cnblogs.com/yoyoketang/with sync_playwright() as p:    browser = p.chromium.launch(headless=False, slow_mo=1000)    page = browser.new_page()    page.goto("https://www.baidu.com")    print(page.title())    page.fill("#kw", "上海-悠悠")    page.click('text=百度一下')    page.wait_for_timeout(5000)    browser.close()

HTML 属性选择器, 根据html元素的id 定位

page.fill("id=kw", "上海-悠悠")

Selector 选择器组合定位

查找目标元素

不同的selector可组合使用，用>>连接

    # id 属性+ css    page.fill('form >> [name="username"]', "yoyo")    page.fill('form >> #passWord', "aa123456")    page.click("text=立即登录")

form >> [name="username"] 定位方式等价于

    # page.fill('form >> [name="username"]', "yoyo")    page.locator("fORM").locator('[name="username"]').fill("yoyo")

相当于是根据父元素找到子元素了

登录按钮的值是value="立即登录 > ",可以用text文本定位的方式，模糊匹配到，这个人性化的设计提高了定位的效率。

内置定位器

这些是 playwright 推荐的内置定位器。

page.get_by_role()通过显式和隐式可访问性属性进行定位。
page.get_by_text()通过文本内容定位。
page.get_by_label()通过关联标签的文本定位表单控件。
page.get_by_placeholder()按占位符定位输入。
page.get_by_alt_text()通过替代文本定位元素，通常是图像。
page.get_by_title()通过标题属性定位元素。
page.get_by_test_id()根据data-testid属性定位元素（可以配置其他属性）。

使用示例

page.get_by_label("User Name").fill("John")page.get_by_label("Password").fill("secret-password")page.get_by_role("button", name="Sign in").click()expect(page.get_by_text("Welcome, John!")).to_be_visible()

角色定位 page.get_by_role()

Playwright 带有多个内置定位器。为了使测试具有弹性，我们建议优先考虑面向用户的属性和显式契约，例如page.get_by_role()。
例如，考虑以下 DOM 结构。

button通过名称为“登录”的角色定位元素。

page.get_by_role("button", name="Sign in").click()

每次将定位器用于操作时，都会在页面中找到一个最新的 DOM 元素。在下面的代码片段中，底层 DOM 元素将被定位两次，一次在每个动作之前。这意味着如果 DOM 由于重新渲染而在调用之间发生变化，则将使用与定位器对应的新元素。

locator = page.get_by_role("button", name="Sign in")locator.hover()locator.click()

请注意，所有创建定位器的方法（例如page.get_by_label() ）也可用于Locator和FrameLocator类，因此您可以将它们链接起来并迭代地缩小定位器的范围。

locator = page.frame_locator("my-frame").get_by_role("button", name="Sign in")locator.click()

page.get_by_role ()定位器反映了用户和辅助技术如何感知页面，例如某个元素是按钮还是复选框。按角色定位时，通常还应传递可访问的名称，以便定位器准确定位元素。

例如，考虑以下 DOM 结构。

您可以通过其隐含角色定位每个元素：

expect(page.get_by_role("heading", name="Sign up")).to_be_visible()page.get_by_role("checkbox", name="Subscribe").check()page.get_by_role("button", name=re.compile("submit", re.IGNORECASE)).click()

角色定位器包括按钮、复选框、标题、链接、列表、表格等，并遵循ARIA 角色、ARIA 属性和可访问名称的 W3C 规范。
请注意，许多 html 元素