当前位置：移动技术网 > IT编程>脚本编程>Python > 荐听说你想爬点壁（mei）纸图

荐听说你想爬点壁（mei）纸图

2020年07月13日 | 移动技术网IT编程 | 我要评论

面向小白的基础教程，无法再基础了，里面的原理一些名词，原理写的也比较详细，虽然可能看了还不太懂，但肯定能让你实战应用。

在这里插入图片描述

首先导入我们需要的模块

import requests # requests是python实现的最简单易用的HTTP库
import re  #regular expression，正则表达式，是用来简洁表达一组字符串特征的表达式。最主要应用在字符串匹配中。
import os  #os库提供通用的，基本的操作系统交互功能（windows，mac os，linux）

找网站的网址和User-Agent

为什么要使用User Agent？

因为一些网站不喜欢外界的爬虫消耗自己的服务器的大量资源，因此他自身就写了一个反爬虫程序，不使用代理的话，他们就能识别出你是爬虫，从而给你进行重定向无数次，导致你的爬虫报错.
User-Agent其实就是你的浏览器信息。是一种向访问网站提供你所使用的浏览器类型及版本、操作系统及版本、浏览器内核、等信息的标识。通过这个标识，用户所访问的网站可以显示不同的排版从而为用户提供更好的体验或者进行信息统计；

一般网站都有反爬虫机制，所以我们要对我们的爬虫进行伪装，应该先去该网址找到他的请求头，也就是他的User-Agent
请求头：右键单击然后点检查，然后按步骤找请求头

在这里插入图片描述

headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.7 Safari/537.36'}

设置我们需要爬取的网页url，也就是这个网址


url='https://image.baidu.com/search/index?isource=infinity&iname=baidu&tn=baiduimage&word=%E5%A3%81%E7%BA%B8'

获取单张图片的url，并保存图片

首先找到单张图片的URL

找张图片单击一下

每往下滑动滑轮就Name那一栏就会出现新的内容，下面的数字是0—30的，也就是相当于每一页有三十张图片。

可以看到多了很多，点开右面的每个图片的json信息，比如时间，内容，最关键的有这张图片的URL地址

这个就是这张图片的网址，可以复制下打开看看。

可以看到是个美女壁纸
您可能感兴趣的文章:
如对本文有疑问，点击进行留言回复！！

Linux建域使用samba（二）——安装Samba

Linux建域使用samba安装Samba相关依赖安装直接安装源码编译安装下载源码包执行./configure配... [阅读全文]
LINUX下搭建Apache HTTP Server

一、概述Apache HTTP Srver（简称Apache）是Apache软件基金会的一个开放源代码的网页服务... [阅读全文]
5G新时代

欢迎来到5G新时代何为5GG的发展历程5G技术指标5G应用场景（VR、AR、MR)VR:虚拟现实AR:增强现实M... [阅读全文]
HTT-Chain基于区块链3.0的物联网应用生态网络即将全球上线

HTT-Chain，基于区块链3.0的物联网应用生态网络，即将全球上线！HTT-Chain网络试图建立一套方案，... [阅读全文]
老猿学5G：融合计费基于流计费的触发器Triggers

☞ ░ 前往老猿Python博文目录 ░一、概述当用户UE发起上网行为时，SMF中的CTF向CHF发送计费事件... [阅读全文]
编程入门必看：带你零基础了解编程和编程语言，入门应该学什么？

什么是编程我们通过有固定格式和固定词汇的“语言”来控制他人，让他人为我们做事情。语言有很多种，包括汉语、英语、法... [阅读全文]
Windows汇总 ~命令；相关操作；windows详解等；持续更新

Windows汇总一、Windows基础命令与使用点击如下标题，会自动跳转到该命令详解 ~1、命令语法2、命令... [阅读全文]
【线程池下篇】IO密集型 VS CPU密集型

先来思考一个问题，线程数量是不是越多越好，我们都知道线程的出现是为了帮忙干活，就像生活中你找人帮你干活你得给人家... [阅读全文]
荐计算机组成原理中指令的四个工作周期

执行过程：在取址周期后，需要判断是否有间址周期，如果没有就进入到了执行周期，在执行周期过程中，需要判断有没有中断... [阅读全文]
荐 python 笔记-关于编码解码问题的解释

一、编码-解码编码通俗来讲就是用户向计算机当中输入字符，计算机去记录对应的二进制的值解码就是计算机会根据已经记录... [阅读全文]