当前位置：移动技术网 > IT编程>脚本编程>Python > Python Linux中用火狐无头浏览器爬取网页内容

Python Linux中用火狐无头浏览器爬取网页内容

2020年07月11日 | 移动技术网IT编程 | 我要评论

需要的包：

pip install selenium
pip install lxml
pip install bs4

本来一开始想用谷歌无头浏览器的，结果运行的时候一堆bug，换成火狐之后一下子就好了
安装firefox:

yum install firefox

驱动下载地址

https://github.com/mozilla/geckodriver

解压后我放在了/usr/bin下，放这似乎不用指定路径，同时为其添加可执行属性

from selenium import webdriver
from bs4 import BeautifulSoup 
options = webdriver.FirefoxOptions()
options.add_argument('-headless')

# 不指定路径
browser = webdriver.Firefox(options=options)
# 指定路径，如果用上一句不行的话就用下面的指定下路径
# browser = webdriver.Firefox(executable_path="/usr/bin/geckodriver",options=options)

browser.get("http://www.chinapeace.org.cn/gupiao/")
content = browser.page_source
soup = BeautifulSoup(content,'lxml')
a_docs = soup.find_all('a')
file = open('html.html','a')
for a_doc in a_docs:
    print a_doc
    print a_doc.get('href')
    print a_doc.string
    file.write(a_doc.encode('utf-8'))

在这里插入图片描述

本文地址：https://blog.csdn.net/qq_39664250/article/details/107251226

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

Linux建域使用samba（二）——安装Samba

Linux建域使用samba安装Samba相关依赖安装直接安装源码编译安装下载源码包执行./configure配... [阅读全文]
LINUX下搭建Apache HTTP Server

一、概述Apache HTTP Srver（简称Apache）是Apache软件基金会的一个开放源代码的网页服务... [阅读全文]
5G新时代

欢迎来到5G新时代何为5GG的发展历程5G技术指标5G应用场景（VR、AR、MR)VR:虚拟现实AR:增强现实M... [阅读全文]
HTT-Chain基于区块链3.0的物联网应用生态网络即将全球上线

HTT-Chain，基于区块链3.0的物联网应用生态网络，即将全球上线！HTT-Chain网络试图建立一套方案，... [阅读全文]
老猿学5G：融合计费基于流计费的触发器Triggers

☞ ░ 前往老猿Python博文目录 ░一、概述当用户UE发起上网行为时，SMF中的CTF向CHF发送计费事件... [阅读全文]
编程入门必看：带你零基础了解编程和编程语言，入门应该学什么？

什么是编程我们通过有固定格式和固定词汇的“语言”来控制他人，让他人为我们做事情。语言有很多种，包括汉语、英语、法... [阅读全文]
Windows汇总 ~命令；相关操作；windows详解等；持续更新

Windows汇总一、Windows基础命令与使用点击如下标题，会自动跳转到该命令详解 ~1、命令语法2、命令... [阅读全文]
【线程池下篇】IO密集型 VS CPU密集型

先来思考一个问题，线程数量是不是越多越好，我们都知道线程的出现是为了帮忙干活，就像生活中你找人帮你干活你得给人家... [阅读全文]
荐计算机组成原理中指令的四个工作周期

执行过程：在取址周期后，需要判断是否有间址周期，如果没有就进入到了执行周期，在执行周期过程中，需要判断有没有中断... [阅读全文]
荐 python 笔记-关于编码解码问题的解释

一、编码-解码编码通俗来讲就是用户向计算机当中输入字符，计算机去记录对应的二进制的值解码就是计算机会根据已经记录... [阅读全文]

网友评论


验证码：

Python Linux中用火狐无头浏览器爬取网页内容

2020年07月11日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论