Scrapy爬虫基础框架及实例演示

安装scrapy

安装 scrapy 之前需安装了window版的 Anaconda python,我的安装版本是

Anaconda3-5.1.0-Windows-x86_64.exe

①： DOS命令行输入：

conda install scrapy

②：下载完成输入 scrapy ，出现以下页面说明scrapy安装成功
在这里插入图片描述

注：若需要卸载scrapy,命令为：pip uninstall scrapy

使用 scrapy 框架创建爬虫项目

Scrapy爬虫工程首先要通过 DOS命令行 创建工程，然后再使用Pycharm打开工程

①：创建一个爬虫文件的工作目录，我的是：D:\work\scrapyWorkSpace

②：在 DOS 命令行中切换至该目录：

d: cd D:work/scrapyWorkSpace

③：创建一个爬虫项目 ScrapyProject

scrapy startproject ScrapyProject

④：切换至这个目录：

cd ScrapyProject

⑤：创建爬虫名 examplespider ,并指定访问的 url地址（地址随便写，可以用pycharm打开再修改）

scrapy genspider examplespider example.com

注：步骤②~⑤如下图所示：

在这里插入图片描述

⑥：使用pycharm打开工程，注意打开文件夹为最外层的工程名文件夹 ScrapyProject
在这里插入图片描述
⑦：在 spiders/examplespider.py 文件中修改需要爬虫的url地址及parse方法，验证爬虫是否可用
如下图所示：

⑧：启动Spider，有两种方式启动

（1）在DOS命令行启动 Spider
scrapy crawl 爬虫名

scrapy crawl examplespider

出现以下页面说明启动成功（部分截图，爬虫是可用的：
在这里插入图片描述
（2）在pycharm中直接启动爬虫Spider ，需要通过脚本启动，步骤如下：
在最外层的项目文件名下创建执行文件 run.py ，内容如下：

from scrapy.cmdline import execute execute("scrapy crawl examplespider".split())

测试爬虫连接：
如图所示：

在 parse() 方法中设置断点测试
在这里插入图片描述

右击 Debug 运行run.py文件
在这里插入图片描述
若Debug测试成功，说明顺利进入 parse() 方法，爬虫顺利运行，如下如所示：

本文地址：https://blog.csdn.net/and52696686/article/details/108245659

您可能感兴趣的文章:

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

使用py-spy解决scrapy卡死的问题方法

背景在使用scrapy爬取东西的时候，使用crontab定时的启动爬虫，但是发现机器上经常产生很多卡死的scrapy进程，一段时间不管的话，会导致有10几个进程... [阅读全文]

Python 串口通信的实现

串口通信是指外设和计算机间，通过数据信号线、地线、控制线等，按位进行传输数据的一种通讯方式。这种通信方式使用的数据线少，在远距离通信中可以节约通信成本，但其传... [阅读全文]

python如何调用百度识图api

一.先去百度识别官网注册开通服务且获得ak和sk链接:https://cloud.baidu.com/doc/reference/s/9jwvz2egb二.代码... [阅读全文]

如何使用python写截屏小工具

前言今天我看了一下自己的文件夹，发现了自己写了许多似乎很无聊的代码。于是乎，一个想法油然而生：“生活已经很无聊了，不如再无聊一点叭”。说干就干，那就开一个专题，... [阅读全文]

详解用python -m http.server搭一个简易的本地局域网

工作时同事间几mb小文件的传输，一般使用qq或者微信就足够了，但当传输文件几百mb或者几十g时，这种方法的效率就显得不足了。本篇就是简单说明一个python小功... [阅读全文]

Python爬取网页信息的示例

python爬取网页信息的步骤以爬取英文名字网站（）中每个名字的评论内容，包括英文名，用户名，评论的时间和评论的内容为例。1、确认网址在浏览器中输入初始网址，逐... [阅读全文]

python 绘制正态曲线的示例

import numpy as npimport matplotlib.pyplot as pltimport math# python实现正态分布# 绘制正态... [阅读全文]

python实现人性化显示金额数字实例详解

我们在开发过程中，有时候需要把float，int型等数字作为金额类型数字显示会出现很多问题，比如float会显示成 965868.4599999，int型没有小... [阅读全文]

matplotlib设置颜色、标记、线条,让你的图像更加丰富(推荐)

matplotlib 是 python 的绘图库。它可与 numpy 一起使用，提供了一种有效的 matlab 开源替代方案。它也可以和图形工具包一起使用，... [阅读全文]

如何基于pandas读取csv后合并两个股票

最近在研究螺纹钢与铁矿石的比价变化，所以用python写个代码分析一下。数据文件：数据下载自网络。代码：中间有些没用的，看官们请忽略，那是我从另一个文件直接复制... [阅读全文]


验证码：

验证码：

Scrapy爬虫基础框架及实例演示

2020年08月01日 | 移动技术网IT编程 | 我要评论

Scrapy爬虫基础框架及实例演示

安装scrapy

使用 scrapy 框架创建爬虫项目

您可能感兴趣的文章:

相关文章:

网友评论