当前位置：移动技术网 > IT编程>脚本编程>Python > Python 爬取喜马拉雅音频

Python 爬取喜马拉雅音频

2018年07月30日 | 移动技术网IT编程 | 我要评论

废液抽吸系统,阿策,假记者敲诈勒索案

一、分析音频下载相关链接地址

1. 分析专辑音频列表页面

在 PC端用 Chrome 浏览器中打开喜马拉雅网站，打开 Chrome开发者工具，随意打开一个音频专辑页面，Chrome开发者工具中返回如下图结果：

经过分析专辑音频列表地址为

其中:

albumId 专辑ID

pageNum 页号

返回的页面内容是 json 格式，相比于 html 源码，json 还是很容易处理的，下载音频只需要用到如下参数：

tracks 音频信息列表

tracks -> title 音频标题

tracks -> trackId 音频ID

2. 分析音频下载链接地址

随意播放一个音频，在Chrome开发者工具中返回如下图结果：

经过分析专辑音频下载链接为

其中

trackIds 音频ID

返回的页面内容也是 JSON 格式，其中 tracksForAudioPlay 字段包含了音频的相关信息，其 src 就是音频下载地址。

src 音频下载链接

trackName 音频名称

trackId 音频ID

二、编写代码

1. 安装相关依赖模块

本程序使用 requests 访问 web 页面，因此需要安装 requests 模块

pip install requests

2. 编写代码

提取专辑内的音频列表信息，如下：

提取音频下载地址，如下：

下载音频文件，如下：

完整源码：

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

Python爬虫:Request Payload和Form Data的简单区别说明

request payload 和 form data 请求头上的参数差别在于：content-typeform datapost表单请求代码示例headers... [阅读全文]
如何基于python实现不邻接植花

有 n 个花园，按从 1 到 n 标记。在每个花园中，你打算种下四种花之一。paths[i] = [x, y] 描述了花园 x 到花园 y 的双向路径。另外，没... [阅读全文]
构建高效的python requests长连接池详解

前文：最近在搞全网的cdn刷新系统，在性能调优时遇到了requests长连接的一个问题，以前关注过长连接太多造成浪费的问题，但因为系统都是分布式扩展的，针对这种... [阅读全文]
python中threading开启关闭线程操作

在python中启动和关闭线程：首先导入threadingimport threading然后定义一个方法def serial_read():......然后定... [阅读全文]
浅谈Python中threading join和setDaemon用法及区别说明

python多线程编程时，经常会用到join()和setdaemon()方法，今天特地研究了一下两者的区别。1、join ()方法：主线程a中，创建了子线程b，... [阅读全文]
Python3-异步进程回调函数(callback())介绍

废话不多说，大家之家看代码吧！#异步'''举例：你喊你朋友吃饭，你朋友正忙，如果你一直在那等他，等你朋友忙完了，你们一块去。--同步调用你喊你朋友吃饭，你朋友正... [阅读全文]
python继承threading.Thread实现有返回值的子类实例

继承与threading.thread实现有返回值的子类mythread，废话不多说，大家直接看代码import threadingclass mythread... [阅读全文]
浅谈Python3多线程之间的执行顺序问题

一个多线程的题：定义三个线程id分别为abc，每个线程打印10遍自己的线程id，按abcabc……的顺序进行打印输出。我的解法：from threading i... [阅读全文]
Python中使用threading.Event协调线程的运行详解

threading.event机制类似于一个线程向其它多个线程发号施令的模式，其它线程都会持有一个threading.event的对象，这些线程都会等待这个事件... [阅读全文]
python 实现两个线程交替执行

我就废话不多说，直接看代码吧！import threadingimport timedef a(): while true: lockb.acquire... [阅读全文]

网友评论


验证码：