Python爬虫实战之对B站排行榜前100作品的名称及地址获取_Python

Python爬虫实战之对B站排行榜前100作品的名称及地址获取

怎么将小破站的每日实时排行榜作品及地址爬取下来？

打开B站，点击B站作品排行榜进入排行榜
在这里插入图片描述
鼠标右击检查源码，找到作品对应的源码位置，此时我们知道作品在代码的相应大致位置。

接着在Pycharm里导入requests、BeautifulSoup

import requests
from bs4 import BeautifulSoup

在这里插入图片描述
因为作品对应的大致位置在div块（class= ‘info’），因此用find_all查找所有作品的此位置。

url = 'https://www.bilibili.com/v/popular/rank/all'
res = requests.get(url)	# B站不用获取headers伪装头
name_list = []	
b_list = BeautifulSoup(res.text, 'lxml').find_all('div', class_='info')
print(b_list)

此时，得到了info中的源代码
在这里插入图片描述
我们需要的作品和地址也在其中，所以需要第二次获取，设置变量q对代码进行遍历。用一开始创建的空列表name_list接收，设置kind放地址href。

for q in b_list:
    name_list.append(q.a.text)
    kind = q.find('a')

最后，进行排序展示。

for i, x in enumerate(name_list):
    print(i+1, x+"\t"+'地址：'+kind['href']+'\n')

在这里插入图片描述
爬取成功！顺序依次为序号+作品名称+地址。

本文地址：https://blog.csdn.net/JasonZ227/article/details/109962293

如您对本文有疑问或者有任何想说的，请点击进行留言回复，万千网友为您解惑！

python 实现控制鼠标键盘

1、安装类库pip install pyautogui2、代码：import pyautogui,time,randompyautogui.pause = 3p... [阅读全文]

VS 和 VS Code 更换字体设置

VS1、工具->选项打开选项窗口，定位到环境下面的字体和颜色：2、在显示其设置下面选择文本编辑器，在字体下... [阅读全文]

python各种编辑器、APP、软件下载

/python下载 / Windows推荐所有 Windows 10/8/7 用户安装 32 位版本部分扩展包可... [阅读全文]

react-native的windows环境安装

具体安装步骤文档，可看：https://reactnative.cn/docs/getting-started/... [阅读全文]

树莓派4无痛安装OpenCV+python3

树莓派4B无痛安装python3+OpenCV [阅读全文]

含有en端和load端的25min倒计时器

`timescale 1ns / 1ps//16进制module second(input wire clk,o... [阅读全文]

CUDA图像形态学腐蚀、膨胀CUDA实现

引言由于上两周杂七杂八的事情比较多加上自己写的算法有些问题，一直改bug。。。。没时间继续写博客，今天开始补上博... [阅读全文]

常用视频格式转换nv12,i420,i444,p010

文章目录视频存储格式NV12转I420视频存储格式P010格式与NV12格式一样，区别就是两个字节存一个像素值。... [阅读全文]

基础电子元器件介绍--电阻

第一节：电阻的学习1.电阻简介2.电阻的作用3.贴片电阻读数4.电阻选型1.电阻简介电阻器，通常简称为电阻。电阻... [阅读全文]

【Python数据可视化】创建3D可视化图表

创建3D柱状图import randomimport numpy as npimport matplotlib ... [阅读全文]


验证码：

验证码：

Python爬虫实战之对B站排行榜前100作品的名称及地址获取

2020年11月22日 | 移动技术网IT编程 | 我要评论

相关文章:

网友评论