当前位置：移动技术网 > IT编程>脚本编程>Python > python+selenium爬取淘宝羽毛球拍信息

python+selenium爬取淘宝羽毛球拍信息

2020年07月16日 | 移动技术网IT编程 | 我要评论

数据量很大，就爬取前五页偷下懒

from selenium import webdriver
import pandas as pd
import openpyxl
import time
driver = webdriver.Chrome()
url = 'https://s.taobao.com/search?q=羽毛球拍'
driver.get(url)
driver.implicitly_wait(20)
namelist = []
pricelist = []
weblist = []
locationlist = []
numberlist = []

def infor():
    items = driver.find_elements_by_class_name('item.J_MouserOnverReq  ')
    for i in items:
        name = i.find_element_by_class_name('row.row-2.title').find_element_by_class_name('J_ClickStat').text
        price = i.find_element_by_class_name('J_ClickStat').get_attribute('trace-price')
        web = i.find_element_by_class_name('J_ClickStat').get_attribute('href')
        location = i.find_element_by_class_name('location').text
        number = i.find_element_by_class_name('deal-cnt').text
        namelist.append(name)
        pricelist.append(price)
        weblist.append(web)
        locationlist.append(location)
        numberlist.append(number)

if __name__ == '__main__':
    for i in range(1,6):
        driver.implicitly_wait(20)
        driver.find_element_by_class_name('input.J_Input').clear()
        driver.find_element_by_class_name('input.J_Input').send_keys(i)
        driver.find_element_by_class_name('btn.J_Submit').click()
        time.sleep(3)
        driver.get(driver.current_url)
        driver.implicitly_wait(20)
        infor()
        print('第{}页录入成功'.format(i))
    data=pd.DataFrame([namelist,pricelist,locationlist,numberlist,weblist]).T
    data.columns=['name','price','location','number','web']
    data.to_excel('work.xlsx')

在这里插入图片描述
爬虫新手有不规范之处大家多多见谅O(∩_∩)O

本文地址：https://blog.csdn.net/weixin_47128538/article/details/107357109

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

通过实例了解Python异常处理机制底层实现

要了解try except异常处理的用法，简单来说，当位于 try 块中的程序执行出现异常时，会将该种异常捕获，同时找到对应的 except 块处理该异常，那么... [阅读全文]
[内附完整源码和文档] 基于python的新闻检索系统

1 系统介绍1.1 系统需求新闻检索系统：定向采集不少于 4 个中文社会新闻网站或频道，实现这些网站新闻信息及评... [阅读全文]
是他们，让云原生落地千万家企业！

199年，「伯俊」正式成立，从成立之初就一直致力于零售相关的IT服务，并在零售行业有很深的积累，是规模最大、客户... [阅读全文]
Django之初学习

Django之初学习Django简介MVC和MTV模型创建第一个Django项目安装Django创建第一个项目运... [阅读全文]
Python笔记-UiSelector混合定位

这里有如下几种方式完成功能。第一种是使用：布局找child：是这样找的：在android.widget.Rela... [阅读全文]
Python笔记-UiSelector中resourceId定位方式

这里以豌豆荚为例，通过资源ID进行定位：从中可以看到对应的下标为0，1，2，3，4；这里是使用resourceI... [阅读全文]
【3Dtiles】3Dmax模型处理为gltf和3dtiles，包含LOD效果

3dmax模型处理为3dtiles [阅读全文]
荐用Django全栈开发——08. 使用AdminLTE开发前端登录页面

大家好，这是皮爷给大家带来的最新的学习Python能干啥？之Django教程，从零开始，到最后成功部署上线的项目... [阅读全文]
2020.07.20 Python study Day 1

2020.07.20 Python study Day 1介绍学科明确学习目的和学习要求课堂纪律安装所需要的... [阅读全文]
slice、splice、split 的区别

1.1 slice功能：截取字符串（或数组），返回新的字符串（或数组）方法：（使用字符串举例，数组作用类似）st... [阅读全文]

网友评论


验证码：

python+selenium爬取淘宝羽毛球拍信息

2020年07月16日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论