Warm tip: This article is reproduced from serverfault.com, please click

其他-如何使用Selenium Python在#shadow-root(open)中提取信息?

(其他 - How to extract info within a #shadow-root (open) using Selenium Python?)

发布于 2020-11-27 23:19:56

我得到了与在线商店https://www.tiendasjumbo.co/buscar?q=mani相关的下一个网址,但我无法在另一个字段中提取产品标签:

from selenium import webdriver
import time
from random import randint

driver = webdriver.Firefox(executable_path= "C:\Program Files (x86)\geckodriver.exe")
driver.implicitly_wait(10)
time.sleep(4)

url =  "https://www.tiendasjumbo.co/buscar?q=mani"
driver.maximize_window()
driver.get(url)
driver.find_element_by_xpath('//h1[@class="impulse-title"]')

我在做什么错,我也尝试过切换iframe,但是没有办法实现我的目标吗?欢迎任何帮助。在此处输入图片说明

Questioner
Alexis AG
Viewed
11
DebanjanB 2020-11-29 06:33:01

https://www.tiendasjumbo.co/buscar?q=mani网站上的产品位于#shadow-root (open)

冲动搜索


解决方案

要提取你必须使用的产品标签shadowRoot.querySelector(),可以使用以下定位策略

  • 代码块:

    driver.get('https://www.tiendasjumbo.co/buscar?q=mani')
    item = driver.execute_script("return document.querySelector('impulse-search').shadowRoot.querySelector('div.group-name-brand h1.impulse-title span.formatted-text')")
    print(item.text)
    
  • 控制台输出:

    La especial mezcla de nueces, maní, almendras y marañones x 450 g
    

参考

你可以在以下位置找到一些相关的讨论: