当前位置：移动技术网 > IT编程>脚本编程>Python > python 获取qq音乐热歌新歌排行榜信息

python 获取qq音乐热歌新歌排行榜信息

2020年07月26日 | 移动技术网IT编程 | 我要评论

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
import re


class main(object):
    def __init__(self):
        self.chrome_options = Options()
        self.chrome_options.add_argument('--headless')
        self.chrome_options.add_argument('--disable-gpu')
        chrome_driver = "D:\\soft\\py3\\chromedriver.exe" #改成自己驱动的目录
        self.header = {
            "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3",
            "accept-language": "zh-CN,zh;q=0.9",
            "referer": "https://y.qq.com/n/yqq/toplist/27.html",
            "upgrade-insecure-requests": "1",
            "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.90 Safari/537.36"
        }

    def query_music(self,url):
    	self.driver = webdriver.Chrome(self.chrome_driver, options=self.chrome_options)
        self.driver.get(url)
        WebDriverWait(self.driver, 10).until(
            EC.presence_of_all_elements_located((By.CLASS_NAME, "songlist__songname_txt")))
        lists = self.driver.find_elements_by_class_name("songlist__songname_txt")
        pattern = re.compile(r"https://y.qq.com/n/yqq/song/(\S+).html")  # 取出每首歌的具体链接
        url = []
        for i in range(len(lists)):
            li = lists.__getitem__(i)
            a = li.find_element_by_class_name("js_song")
            href = a.get_attribute("href")
            m = pattern.match(href)
            url.append(m.string)
        self.driver.close()
        return url
        

    def list_music(self,url):
        with open("./sing.json","w",encoding="utf-8") as fw:
        	self.driver = webdriver.Chrome(self.chrome_driver, options=self.chrome_options)
            for u in self.query_music(url):
                self.driver.get(u)
                f = self.driver.find_element_by_class_name("data__name_txt")
                f = f.text #歌曲名
                g = self.driver.find_element_by_class_name("data__singer")
                g = g.text#歌手
                WebDriverWait(self.driver, 10).until(
                    EC.presence_of_all_elements_located((By.CLASS_NAME, "data__info")))
                lists = self.driver.find_elements_by_class_name("data__info")
                for i in range(len(lists)):
                    li = lists.__getitem__(i)
                    a = li.find_element_by_class_name("js_album")
                    #专辑
                    a = a.text
                    b = li.find_element_by_class_name("js_lan")
                    #语种
                    b = b.text
                    c = li.find_element_by_class_name("js_genre")
                    #流派
                    c = c.text
                    d = li.find_element_by_class_name("js_company")
                    #唱片公司
                    d = d.text
                    e = li.find_element_by_class_name("js_public_time")
                    #发行时间
                    e = e.text
                    fw.write("{}".format(f + "\n" + g + "\n" +a +"\n"+ b+"\n" + c+"\n" + d+"\n" + e + "\n\n"))
			self.driver.close()

if __name__ == '__main__':
    url = "https://y.qq.com/n/yqq/toplist/27.html#stat=y_new.toplist.menu.27"#新歌榜url
    url_re = "https://y.qq.com/n/yqq/toplist/26.html#stat=y_new.toplist.menu.26" #热歌榜
    url_bs = "https://y.qq.com/n/yqq/toplist/62.html#stat=y_new.toplist.menu.62" #飙升榜
    main().list_music(url_bs)

本文地址：https://blog.csdn.net/qq_39942956/article/details/107579567

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

序列化Python对象的方法

问题你需要将一个python对象序列化为一个字节流，以便将它保存到一个文件、存储到数据库或者通过网络传输它。解决方案对于序列化最普遍的做法就是使用 pickle... [阅读全文]
Python实现弹球小游戏

本文主要给大家分享一个实战项目，通过python代码写一款我们儿时大多数人玩过的游戏---小弹球游戏。只不过当时，我们是在游戏机上玩，现在我们通过运行代码来玩，... [阅读全文]
Python Flask异步发送邮件实现方法解析

第一步，修改工厂函数，配置邮件参数from flask import flaskfrom config import configfrom flask_sqla... [阅读全文]
Python sqlalchemy时间戳及密码管理实现代码详解

一、时间戳实际开发中，我们一般希望create_time和update_time这两个属性能自动设置，所以在建表的时候需要在model上特殊处理一下：from ... [阅读全文]
python中的django是做什么的

django是什么？django是一个基于python的web应用框架。它与python的另外一个web 框架 flask最大的区别是，它奉行 “包含一切” 的... [阅读全文]
Python过滤序列元素的方法

问题你有一个数据序列，想利用一些规则从中提取出需要的值或者是缩短序列解决方案最简单的过滤序列元素的方法就是使用列表推导。比如：>>> myli... [阅读全文]
python中selenium库的基本使用详解

什么是seleniumselenium 是一个用于web应用程序测试的工具。selenium测试直接运行在浏览器中，就像真正的用户在操作一样。支持的浏览器包括i... [阅读全文]
Python在字符串中处理html和xml的方法

问题你想将html或者xml实体如 &entity; 或 &#code; 替换为对应的文本。再者，你需要转换文本中特定的字符(比如<, ... [阅读全文]
Python如何将字符串转换为日期

问题你的应用程序接受字符串格式的输入，但是你想将它们转换为 datetime 对象以便在上面执行非字符串操作。解决方案使用python的标准模块 datetim... [阅读全文]
Python使用shutil模块实现文件拷贝

主要作用与拷贝文件用的。1.shutil.copyfileobj(文件1，文件2)：将文件1的数据覆盖copy给文件2。import shutilf1 = op... [阅读全文]

网友评论


验证码：

python 获取qq音乐热歌新歌排行榜信息

2020年07月26日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论