当前位置: 移动技术网 > IT编程>脚本编程>Python > scrapy爬虫踩的坑

scrapy爬虫踩的坑

2018年04月02日  | 移动技术网IT编程  | 我要评论

汽车总动员3国语版,陈修侃,92kdy.org

1.爬取网页时,当我们爬取(table)中的内容时,用xpath解析不到表格中td的值

  原因:浏览器会在table标签下添加tbody(注:在chrome、火狐测试都有这个情况。出现这种原因是因为浏览器会对html文本进行一定的规范化 )

  解决方法:解决方法:使用scrapy 时将分析出的xpath 中的 tbody 去掉即可。

  参考自:https://blog.csdn.net/lishk314/article/details/44916827

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网