首页 编程教程正文

爬虫之酷狗音乐TOP500歌曲信息

piaodoo 编程教程 2020-02-22 22:02:09 917 0 python教程

本文来源吾爱破解论坛

本帖最后由 PAOLO 于 2019-3-18 21:49 编辑

嗨学网爬酷狗音乐TOP500歌曲信息!嗨学网


[Python] 纯文本查看 复制代码

#导入需要的模块
import requests
from bs4 import BeautifulSoup
import time
#伪装浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3641.400 QQBrowser/10.4.3284.400'
}#加入请求头

#获取网页信息
def get_info(url):
    wb_data = requests.get(url,headers = headers)#定义获取信息的函数
    soup = BeautifulSoup(wb_data.text,'lxml')
    ranks = soup.select('span.pc_temp_num')
    titles = soup.select('div.pc_temp_songlist > ul > li > a')
    times = soup.select('span.pc_temp_tips_r > span')
    for rank,title,time in zip(ranks,titles,times):
        data ={
            '排名':rank.get_text().strip(),
            '歌手':title.get_text().split('-')[0],
            '歌曲':title.get_text().split('-')[1],#通过split获取歌手和歌曲信息
            '时间':time.get_text().strip(),

        }
        print(data)#获取爬虫信息并按字典格式打印
#
if __name__ == '__main__':#程序主入口
    urls = ['http://www.kugou.com/yy/rank/home/{}-8888.html'.format(str(i)) for i in range(1,24)]#构造多页URL
    for url in urls:
        get_info(url)#循环调用get_info()函数
        time.sleep(1)#暂停1秒

版权声明:

本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。

有关影视版权:本站只供百度云网盘资源,版权均属于影片公司所有,请在下载后24小时删除,切勿用于商业用途。本站所有资源信息均从互联网搜索而来,本站不对显示的内容承担责任,如您认为本站页面信息侵犯了您的权益,请附上版权证明邮件告知【754403226@qq.com】,在收到邮件后72小时内删除。本文链接:https://www.piaodoo.com/7364.html

搜索