当前位置: 移动技术网 > IT编程>脚本编程>Python > 分页爬取斋藤飞鸟图片

分页爬取斋藤飞鸟图片

2019年09月30日  | 移动技术网IT编程  | 我要评论

波霸,夏天的约定 枫牙,暴走大事件第三季09

#简单爬取斋藤飞鸟图片
import requests
import time
from lxml import etree
# from requests.exceptions import requestexception
def get_one_page(url):
headers={
'user - agent':'mozilla / 5.0(windows nt 10.0;win64;x64) applewebkit / 537.36(khtml, likegecko) chrome / 75.0.3770.100safari / 537.36',
}
r=requests.get(url,headers=headers)
# if r.status_code==200:
# return r.text
# return none
# except recursionerror:
# return none
contend=r.text
html=etree.html(contend)
src_list=html.xpath('//img/@src')
alt_list=html.xpath('//div[@class="prop"]/text()')
for src,alt in zip(src_list,alt_list):
filename=src[48:]
print('正在爬取第%d页'%(d/30))
print('正在保存图片'+filename)
r = requests.get(src,headers=headers)
with open('斋藤飞鸟图片//'+filename,'wb') as f:
f.write(r.content)

def main(d):
url='https://movie.douban.com/celebrity/1329640/photos/?type=c&start=%d&sortby=like&size=a&subtype=a' %(d)
# print(r.text)
print(get_one_page(url))

if __name__=='__main__':
d = 0
while true:
d = d + 30
if d >= 500:
break
main(d)
time.sleep(0.5)

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网