当前位置: 移动技术网 > IT编程>脚本编程>Python > 弹幕有点逗比,用 Python 爬下来看看《民国奇探》的弹幕

弹幕有点逗比,用 Python 爬下来看看《民国奇探》的弹幕

2020年04月15日  | 移动技术网IT编程  | 我要评论

ai蜜桃,嬴摎,13524答案不是6

 

电视剧《民国奇探》是一部充斥着逗比风的探案剧,剧中主要角色:三土、四爷、白小姐,三土这个角色类似于《名侦探柯南》中的柯南但带有搞笑属性,四爷则类似于毛利小五郎但有大哥范且武功高强,三土尚文四爷尚武,白小姐大多时候扮演着傻白甜的角色。

因为该剧目前大多数时候都处于爱奇艺电视剧的榜首位置,所以自己也看了几集,总的来说剧情紧凑,剧风逗比,当然最令我印象深刻的还是网友们逗比的弹幕,所以我决定用 python 将弹幕爬下来大家一起瞧瞧。

如果你处于想学python或者正在学习python,python的教程不少了吧,但是是最新的吗?

说不定你学了可能是两年前人家就学过的内容,在这小编分享一波2020最新的python教程。

植物大战僵尸的代码如何使用python来实现

 

 

植物大战僵尸的代码如何使用python来实现

 

 

植物大战僵尸的代码如何使用python来实现

 

 

植物大战僵尸的代码如何使用python来实现

 

 

以上这些教程小编已经为大家打包准备好了,希望对正在学习的你有所帮助!

获取方式,私信小编 “ 资料 ”,即可免费获取哦!

数据爬取

现在开始我们的爬取工作,先用浏览器打开电视剧的网页,地址为:https://www.iqiyi.com/v_19rx2un304.html?vfrm=pcw_home&vfrmblk=b&vfrmrst=fcs_0_t12,我们使用开发者工具的 network 功能,进到 network 控制台后,我们先使用 ctrl+r 命令重新加载一下网页,然后再通过过滤器搜索 bullet,如下图所示:

这里的弹幕数据是以 .z 形式的压缩文件存在的,如下图所示:

我们可以看出压缩文件命名规则为 tvid_300_n.z,所以我们先来获取 tvid 列表,代码实现如下所示:

 

获取到 tvid 列表后,我们就可以根据 tvid 获取弹幕的压缩文件了,然后再对其进行解压及存储,实现代码如下所示:

文件存储到本地之后,我们先获取每一个文件的全路径名,实现代码如下所示:

获取到所有文件全路径名后,我们再根据全路径名获取文件并解析弹幕文本信息,实现代码如下所示:

最后,我们可以将整个弹幕字符串信息保存起来,因为我本次爬取的弹幕信息并不是特别多,所有就先存到 txt 文件中吧,实现代码如下所示:

词云展示

数据保存完了之后,我们再来个词云展示吧,代码实现如下所示:

看一下效果:

 

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网