当前位置：移动技术网 > 科技>操作系统>windows > 记一次爬取LOL全皮肤原画保存到本地的实例

记一次爬取LOL全皮肤原画保存到本地的实例

2020年01月05日 | 移动技术网科技 | 我要评论

影讯网,elkelake,宇智波鼬是好人吗

 1 #爬取lol全英雄皮肤
 2 import re
 3 import traceback #  异常跟踪
 4 import requests
 5 from bs4 import beautifulsoup

 6 #获取html
 7 def get_url(url, hander):
 8     try:
 9         r = requests.get(url, headers=hander, timeout=30)
10         r.raise_for_status()
11         r.encoding = r.apparent_encoding
12         return r.text
13     except:
14         traceback.print_exc() #将异常信息打印出来
15         return ""
16 #解析html
17 def prasing_page(lst,html):
18     try:
19         soup = beautifulsoup(html, "html.parser")
20         for a in soup.find_all('li', class_=re.compile('boxshadow')):
21             tag_a = a('a')
22             for i in tag_a:
23                 lst.append(i['href'])
24         return lst
25     except:
26         traceback.print_exc()
27         return ""


28 #解析获取到的单个html并筛选和下载
29 def geturl_prasingpag(lst, hander):
30     hero_img_url = []
31     hero_skin_name = []
32     hero_name = []
33     for u in lst:
34         try:
35             r = requests.get(u, headers=hander, timeout=30)
36             r.raise_for_status()
37             r.encoding = r.apparent_encoding

38 　　　　　　　#二次解析
39             soup = beautifulsoup(r.text, "html.parser")
40             pag = soup.find_all('div', class_=re.compile('otherspifubox'))
41             for m in pag:
42                 tag_img = m('img')
43                 tag_p = m('p')
44                 tag_span = m('span')
45                 for m in tag_p:
46                     hero_skin_name.append(m.string)
47                 for m in tag_img:
48                     hero_img_url.append(m['src'])
49                 for m in tag_span:
50                     hero_name.append(m.string)
51         except:
52             traceback.print_exc()  # 将异常信息打印出来
53             continue
54 　　　　　　
　　　　　　　　#下载到本地

55         for i in range(len(hero_name)):
56             try:
57                 path = 'o:/lol_hero_jpg/' + hero_skin_name[i]+'--' + hero_name[i] + '.jpg'
58                 f = open(path, 'wb')
59                 r = requests.get(hero_img_url[i], stream=true)
60                 f.write(r.content)
61                 print("\r当前进度>>>>>>>>>>>>>>>>>>{:.0f}%>>>>>>>>>>>>>>>>>>".format(i * 100 / len(lst)), end="")
62                 f.close()
63             except:
64                 traceback.print_exc()  # 将异常信息打印出来
65                 continue
66 
67 def main():
68     hander = {"user-agent":"mozilla/5.0"}
69     deep = 43 #定义爬取页数
70     list = []
71     for i in range(deep):
72         try:
73             url = "http://********/hero_"+str(1+i)+".shtml"
74             html = get_url(url, hander)
75             prasing_page(list, html)
76             geturl_prasingpag(list, hander)
77         except:
78             continue
79 
80 main()

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

新补丁让Windows 10出现死机、卡顿等微软坐不住称正解决

本周一，微软最新推送的kb4549951 windows 10系统更新受到很多用户的吐槽，原因是升级后设备出现了蓝牙、wi-fi、蓝屏死机等问题。据外媒报道称，... [阅读全文]
Ubuntu 20.04 LTS进驻Windows子系统：只能用3年

在很多人的印象中，开源的linux、闭源的windows应该是势不两立，其实完全不是这样，微软一直都在鼎力支持开源社区，也非常接纳linux，windows 1... [阅读全文]
ThinkPad正式加入：预装Linux发行版而非Win10的PC越来越多了

如果只是轻度办公、上网、做开发，你真的需要win10吗？在戴尔xps之后，联想的高端品牌thinkpad也开始选择预装成熟的linux发行版。北美市场，联想新出... [阅读全文]
最新版Android 11推送！谷歌Pixel 5被曝光：支持反向充电

4月24日消息，android 11 developer preview推送，xda在这一版系统中发现了谷歌pixel 5的秘密：支持反向无线充电。xda主编m... [阅读全文]
高度致敬Windows！开源优麒麟20.04 LTS发布：支持5年

优麒麟团队宣布，优麒麟(ubuntukylin)开源操作系统20.04 lts正式版已经发布，代号focal fossa，全球同步发布的还有ubuntu 20.... [阅读全文]
电脑小知识：Windows 10是用什么语言写的？到底有多少行代码？

这是微软的内核工程师 Axel Rietschin在Quora的一个回答。 Windows 10 的code base 和Windows 8.x , 7... [阅读全文]
Win10 5月更新准正式版：微软引入大量新功能系统响应速度快

之前微软已经放出预告，下个月要推出今年首个重要的windows 10更新，而他们还向release preview通道用户交付了buil... [阅读全文]
Windows 10新预览版19613推送：修复任务栏图标显示异常BUG

今晨，微软面向fast ring快速通道的insider用户推送新预览版，操作系统版本号build 19613。新功能方面，官方日志中仅... [阅读全文]
处理器及其调度

处理器及其调度 1. 处理器用于执行指令对数据进行加工处理。具有的机制：寄存器：寄存器有多种，主要的作用是构成处理器的工作现场指令系统非特权指... [阅读全文]
Windows AD 报错解决:UAC File Virtualization服务启动失败此驱动程序被阻止加载

环境 Windows Server 2012 R2 问题日志报错：原因如果已在服务器上禁用UAC，通常会出现此错误。如果在服务器上禁用了UAC，... [阅读全文]

网友评论


验证码：

记一次 爬取LOL全皮肤原画保存到本地的实例

2020年01月05日 | 移动技术网科技 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论

记一次爬取LOL全皮肤原画保存到本地的实例