当前位置: 移动技术网 > IT编程>脚本编程>Python > Windows下安装Scrapy

Windows下安装Scrapy

2018年11月08日  | 移动技术网IT编程  | 我要评论

皮皮小说网,中国汽配,风软

这几天正好有需求实现一个爬虫程序,想到爬虫程序立马就想到了python,python相关的爬虫资料好像也特别多。于是就决定用python来实现爬虫程序了,正好发现了python有一个开源库scrapy,正是用来实现爬虫框架的,于是果断采用这个实现。下面就先安装scrapy,决定在windows下面安装。

scrapy简介

scrapy,python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。

scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。

scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如basespider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持。

安装依赖

  • scrapy安装依赖于以下几个python库
  • lxml, an efficient xml and html parser
  • parsel, an html/xml data extraction library written on top of lxml,
  • w3lib, a multi-purpose helper for dealing with urls and web page encodings
  • twisted, an asynchronous networking framework
  • cryptography and pyopenssl, to deal with various network-level security needs

我选择手动安装这些依赖

  • pip install lxml
  • pip install parsel
  • pip install w3lib
  • pip install twisted
  • pip install cryptography
  • pip install pyopenssl

其他的安装都很顺利,就是在安装twisted的时候报错了。

microsoft visual c++ 14.0 is required. get it with "microsoft visual c++ build tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

于是下载离线的安装(下载自己的版本)

下载到一个目录,然后用

pip install twisted-17.9.0-cp36-cp36m-win32.whl

之后再用下面的命令安装就可以了

pip install scrapy

在命令行中输入scrapy,出现如下界面,则表示安装成功

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对移动技术网的支持。如果你想了解更多相关内容请查看下面相关链接

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网