当前位置：移动技术网 > IT编程>开发语言>.net > selenium爬虫时常常会遇到stale element reference: element is not attached to the page document加了显式等待感觉没什么用

selenium爬虫时常常会遇到stale element reference: element is not attached to the page document加了显式等待感觉没什么用

2020年07月07日 | 移动技术网IT编程 | 我要评论

翻页输出东方财富利润表，有时候可以输出三份dataframe，有时候就两份甚至直接element is not attached to the page document，加了显式等待感觉好像没啥用，（另外是不是if中套test会好一点）求帮助谢谢

from selenium import webdriver
import pandas as pd
import numpy as np
from selenium.webdriver.common.by import By
from lxml import etree
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time

stock = 'SZ300278'
url='http://f10.eastmoney.com/f10_v2/FinanceAnalysis.aspx?code=%s' %stock
browser = webdriver.Chrome()
browser.get(url)
wait=WebDriverWait(browser, 10)
wait.until(EC.element_to_be_clickable((By.XPATH,'//div[@class="main"]/descendant::ul[@id="lrb_ul"]/li[2]')))
button=browser.find_element(By.XPATH,'//div[@class="main"]/descendant::ul[@id="lrb_ul"]/li[2]')
button.click()
wait.until(EC.element_to_be_clickable((By.ID,'lrb_next')))
next=browser.find_element_by_id('lrb_next')

content_wait=wait.until(EC.presence_of_element_located((By.ID,'report_lrb')))
element=browser.find_element_by_id('report_lrb')
th_content = element.find_elements_by_tag_name('th')
td_content = element.find_elements_by_tag_name('td')
list=[]
for th in th_content:
    list.append(th.text)
for td in td_content:
    list.append(td.text)
col = len(element.find_elements_by_css_selector('tr:nth-child(1) th'))
list = [list[i:i + col] for i in range(0, len(list), col)]
for x in range(list.count(['', '', '', '', '', ''])):
    list.remove(['', '', '', '', '', ''])
lrb_table = pd.DataFrame(list)
print(lrb_table)

while next.get_attribute('style')=='display: inline;':
    try:
        wait.until(EC.element_to_be_clickable((By.ID,'lrb_next')))
        time.sleep(1)
        next.click()
        next_wait=wait.until(EC.element_to_be_clickable((By.ID,'lrb_next')))
        content_wait=wait.until(EC.presence_of_element_located((By.ID,'report_lrb')))
        content_wait=wait.until(EC.presence_of_element_located((By.ID,'report_lrb')))
        element=browser.find_element_by_id('report_lrb')
        th_content = element.find_elements_by_tag_name('th')
        td_content = element.find_elements_by_tag_name('td')
        list=[]
        for th in th_content:
            list.append(th.text)
        for td in td_content:
            list.append(td.text)
        col = len(element.find_elements_by_css_selector('tr:nth-child(1) th'))
        list = [list[i:i + col] for i in range(0, len(list), col)]
        for x in range(list.count(['', '', '', '', '', ''])):
            list.remove(['', '', '', '', '', ''])
        lrb_table1 = pd.DataFrame(list)
        print(lrb_table1)
    except:
        print('打印完成')

本文地址：https://blog.csdn.net/weixin_49101060/article/details/107160044

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

应用于网络摄像头的域格4G嵌入模组

CLR950模块示意图：CLR950是域格4G模组嵌入版：应用场景：网络摄像头CLR950模组尺寸为：38mm×... [阅读全文]
工业DTU应用于无线输电线路监测系统

我国地域辽阔，输电线路长、监测困难。且迅速增长的输电线路对线路运行人员的巡视维护工作，及周边环境情况信息实时性要... [阅读全文]
Napatech网络加速卡

1.背景越来越依赖互联网更复杂的服务和用户群体海量数据更快的网络速度——现在是100G所有的服务都转移到云端企业... [阅读全文]
机井控制系统是由什么组成的？

机井控制系统主要实现对机井灌溉运行系统的实时监控，设备包括机井控制器、流量计、水位变送器、智能电表和水泵控制柜等... [阅读全文]
曝三星Note20 Ultra为了续航支持自适应刷新率

近日，三星宣布将在8月5日举行新产品发布会。据悉，三星将带来一系列新产品，包括三星Note20系列，三星Z Fl... [阅读全文]
泰尔终端实验室运营商测试测业务范围

http://www.taf.org.cn/BusinessScope.aspx测试项目名称简介泰尔终端实验室能... [阅读全文]
物理通道和信号子组件

5G NR中的PRBS和低PAPR序列生成，符号调制，层映射和变换预编码。使用5G Toolbox™低级物理通道... [阅读全文]
海外市场做得最成功的小米在中印击败三星后，攻入韩国市场

据悉小米已在韩国市场推出小米10 lite版，定价颇为实惠，在配置方面与三星和LG的高端机型相当，但是价格却只有... [阅读全文]
计算机网络知识概要

计算机网络§1.1计算机网络基本概念计算机网络包括两点：通信技术计算机技术计算机网络可以定义成一个互联、自治的计... [阅读全文]
云图科技长沙VR，5G时代的到来解决了VR普及问题！

虚拟现实(VR)技术的结合和旅游并不新鲜,基于三维虚拟现实模拟三维的虚拟世界,为用户提供了一个真正的视听体验,除... [阅读全文]

网友评论


验证码：

selenium爬虫时常常会遇到stale element reference: element is not attached to the page document加了显式等待感觉没什么用

2020年07月07日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论