当前位置：移动技术网 > IT编程>脚本编程>Python > python中requests库基础应用解析

python中requests库基础应用解析

2018年01月07日 | 移动技术网IT编程 | 我要评论

我是歌手第七期歌曲,miss紧身衣,丁子玲

python中requests库基础应用解析，python中requests库的基础应用，网页数据挖掘的常用库之一。也就是说最主要的功能是从网页抓取数据。

python2.7下

#coding:utf-8
#python网络爬虫库requests库应用全解
import requests
import json

print u'================入门================'

r = requests.get('https://cuiqingcai.com')  #返回Response对象
print type(r)
print r.status_code  # 获取返回状态
print r.encoding
print r.cookies
print r.raw #返回原始响应体，也就是 urllib 的 response 对象，使用 r.raw.read() 读取
print r.content #字节方式的响应体，会自动为你解码 gzip 和 deflate 压缩
print r.text #字符串方式的响应体，会自动根据响应头部的字符编码进行解码
r.headers #以字典对象存储服务器响应头，但是这个字典比较特殊，字典键不区分大小写，若键不存在则返回None
#*特殊方法*#
#r.json() #Response中内置的JSON解码器
#r.raise_for_status() #功能：如果失败请求(非200响应)抛出异常


print u'================基本请求================'
r = requests.post("https://httpbin.org/post")
r = requests.put("https://httpbin.org/put")
r = requests.delete("https://httpbin.org/delete")
r = requests.head("https://httpbin.org/get")
r = requests.options("https://httpbin.org/get")

print u'================基本GET请求================'
payload = {'key1': 'value1', 'key2': 'value2'}  #字典数据
headers = {'content-type': 'application/json'}  #header数据
r = requests.get("https://httpbin.org/get", params=payload, headers=headers) #payload可以省略，会在网址中添加
print r.url


print u'================基本POST请求================'

url = 'https://httpbin.org/post'
payload = {'some': 'data'}
r = requests.post(url, data=json.dumps(payload))  #上传json数据
print r.text

url = 'https://httpbin.org/post'
myfiles = {'file': open('test.txt', 'rb')}  #获取文件对象
r = requests.post(url, files=myfiles)  #上传文件
print r.text

#with open('test.txt') as f:  #流式上传
#    requests.post('https://some.url/streamed', data=f)


print u'================Cookies================'

url = 'https://httpbin.org/cookies'
r = requests.get(url)  #响应中会包含cookie
print r.cookies

url = 'https://httpbin.org/cookies'
cookies = dict(cookies_are='working')  #自定义cookie变量
r = requests.get(url, cookies=cookies)  #请求时附带cookie
print r.text

print u'================超时配置================'

requests.get('https://github.com', timeout=1)  #1秒没有响应就报错

print u'================会话对象（持久连接）================'

s = requests.Session()
s.get('https://httpbin.org/cookies/set/sessioncookie/123456789')  #get方式设置cookie
r = s.get("https://httpbin.org/cookies")  #获取cookie
print(r.text)


headers = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
           'Accept-Encoding': 'gzip, deflate, compress',
           'Accept-Language': 'en-us;q=0.5,en;q=0.3',
           'Cache-Control': 'max-age=0',
           'Connection': 'keep-alive',
           'User-Agent': 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:22.0) Gecko/20100101 Firefox/22.0'}

s = requests.Session()
s.headers.update(headers)  #更新header
r = s.get('https://httpbin.org/headers', headers={'x-test': 'true'})  #get函数中添加的headers会覆盖原有同名，添加不同名的，去除值为None的
print r.text

print u'================SSL证书验证================'

r = requests.get('https://github.com', verify=True)
print r.text

r = requests.get('https://kyfw.12306.cn/otn/', verify=False)  #把 verify 设置为 False即可跳过证书验证
print r.text


print u'================证书================'

proxies = {
  "https": "https://41.118.132.69:4433"
}
r = requests.post("https://httpbin.org/post", proxies=proxies)
print r.text

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

Python爬虫:Request Payload和Form Data的简单区别说明

request payload 和 form data 请求头上的参数差别在于：content-typeform datapost表单请求代码示例headers... [阅读全文]
如何基于python实现不邻接植花

有 n 个花园，按从 1 到 n 标记。在每个花园中，你打算种下四种花之一。paths[i] = [x, y] 描述了花园 x 到花园 y 的双向路径。另外，没... [阅读全文]
构建高效的python requests长连接池详解

前文：最近在搞全网的cdn刷新系统，在性能调优时遇到了requests长连接的一个问题，以前关注过长连接太多造成浪费的问题，但因为系统都是分布式扩展的，针对这种... [阅读全文]
python中threading开启关闭线程操作

在python中启动和关闭线程：首先导入threadingimport threading然后定义一个方法def serial_read():......然后定... [阅读全文]
浅谈Python中threading join和setDaemon用法及区别说明

python多线程编程时，经常会用到join()和setdaemon()方法，今天特地研究了一下两者的区别。1、join ()方法：主线程a中，创建了子线程b，... [阅读全文]
Python3-异步进程回调函数(callback())介绍

废话不多说，大家之家看代码吧！#异步'''举例：你喊你朋友吃饭，你朋友正忙，如果你一直在那等他，等你朋友忙完了，你们一块去。--同步调用你喊你朋友吃饭，你朋友正... [阅读全文]
python继承threading.Thread实现有返回值的子类实例

继承与threading.thread实现有返回值的子类mythread，废话不多说，大家直接看代码import threadingclass mythread... [阅读全文]
浅谈Python3多线程之间的执行顺序问题

一个多线程的题：定义三个线程id分别为abc，每个线程打印10遍自己的线程id，按abcabc……的顺序进行打印输出。我的解法：from threading i... [阅读全文]
Python中使用threading.Event协调线程的运行详解

threading.event机制类似于一个线程向其它多个线程发号施令的模式，其它线程都会持有一个threading.event的对象，这些线程都会等待这个事件... [阅读全文]
python 实现两个线程交替执行

我就废话不多说，直接看代码吧！import threadingimport timedef a(): while true: lockb.acquire... [阅读全文]

网友评论


验证码：

python中requests库基础应用解析

2018年01月07日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论