当前位置: 移动技术网 > IT编程>脚本编程>Python > 学习爬虫的第一天

学习爬虫的第一天

2019年05月24日  | 移动技术网IT编程  | 我要评论

香菜种植,艾力达官网 德康正品专卖,会议

爬虫是什么?

网络就如同蜘蛛网,而数据相当于里面的节点,爬虫如同蜘蛛,通过节点去获取蜘蛛网上的内容,获取想要的数据信息

获取网页数据方式:

1、浏览器访问——下载网页数据

2、模拟浏览器对网页进行访问——解析数据——将所需要的内容保存在本地

其中第二种方式就是爬虫的整体流程

 

首先先了解下关于网页必备知识

https和http的区别?

http:明文显示,端口号为80

https:进行加密,添加数字证书,端口号为443

 

网络请求方式

get

post

put

head

delete

patch

简单说下get和post区别

get请求:htpp默认的请求方式是get;

get请求的特点:

*没有请求体,携带数据保存在url后面

*get请求携带的参数必须在4k之内

*get请求的携带的数据由于封装在url后面,所以会暴露在浏览器地址栏中

 

post请求的特点

*有请求体,数据保存在请求体中

*上传提交的数据可以无限大

*请求体中如果存在中文,会使用url编码!

 第一次写博客,过程不太熟悉,望大神们多加指导2019-05-23

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网