kaakoo,马鞍山唐人游,飘柔洗发水真假
1 import ssl 2 ssl._create_default_https_context = ssl._create_unverified_context
urllib 是python提供的一个用于发起和处理http请求和响应的框架。后期的一些框架,比如: requests、 scrapy等都是基于它
1 from urllib import request
1 url = "http://www.baidu.com/"
用于打开一个远程的url连接,并且向这个连接发出请求,获取响应结果。返回的结果是一个http响应对象,这个响应对象中记录了本次http访问的响应头和响应体
1 response = request.urlopen(url=url) 2 print(response)
3 结果 :<http.client.httpresponse object at 0x10be801d0>
1 print(response.headers)
1 print(response.url) #打印url 2 print(response.status) #打印状态码
1 res = response.read() # 读取的是二进制 2 print(res) # 读取到的响应体是一个二进制字符串 3 print(res.decode("utf-8")) # 对响应体进行解码
1 res = response.readline() # 读取一行 2 res1 = response.readline() # 读取下一行 3 res2 = response.readlines() # 读取多行。得到一个列表 每个元素是一行 4 print(res) # 打印
打开url这个连接 并且发起请求,获得响应并把响应结果保存到filename中
1 res3 = request.urlretrieve(url=url,filename="./baidu.html") 2 print(res3) # 获取url 保存到baidu.html中 并打印
对url进行编码,因为urllib这个框架中的url中不能出现汉字,只能出现ascii码字符
1 from urllib import parse
1 url = "https://www.baidu.com/s?"
1 dic= {"ie":"utf-8","wd":"奔驰"}
1 parames = parse.urlencode(dic)
1 url += parames 2 request.urlopen(url=url)
如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复
新手学习Python2和Python3中print不同的用法
Python基于os.environ从windows获取环境变量
网友评论