首页 编程教程正文

喜马拉雅爬虫分析(成品和源码已打包)

piaodoo 编程教程 2020-02-22 22:16:17 1443 0 python教程

本文来源吾爱破解论坛

最近上了喜马拉松上学学如何才能交到女朋友,然后我就随机分析了一下,结果就给我我分析出来了,怎么办???我是来学习怎么找女朋友的,可不是来搞爬虫的...

真香...
先说明一下,我用的是函数式编程,因为面向对象还没学会,没办法,就是那么菜。
环境:python 3.7
第三方库:json,re,request,os
进入正题吧!
首先,我们先打开喜马拉雅的官网,随便打开一个音频页面,然后按F12,调到网络那一模块
然后播放音频

QQ截图20191214162425.png (274.32 KB, 下载次数: 1)

下载附件  保存到相册

2019-12-14 16:27 上传


这个音频的地址可以看出就是这段网页的音频地址,然后我们找找,应该从哪里去找到这个网址
点进详情,里面并没有我们想要的东西
接下来我们就一个一个在这些数据包里面找,寻找规律
然后我们在数据包里面发现了一个json包,打开它,里面竟然有我们要下载音频的地址

QQ截图20191214162947.png (79.7 KB, 下载次数: 2)

下载附件  保存到相册

2019-12-14 16:30 上传


让我们分析一下这个网址:https://www.ximalaya.com/revision/play/v1/audio?id=236504776&ptype=1
看他的id参数是不是可以入手一下???
接下来我们去他的主页面,查看源代码搜一下

QQ截图20191214163258.png (51.76 KB, 下载次数: 1)

下载附件  保存到相册

2019-12-14 16:33 上传


ok,找到了
接下来,让我们来捋一捋思路
网页里面有一个id号,我们可以通过这个id号填写到我们之前的那个网站里面,他就会给我们显示,当前网页音频的真实地址,然后我们下载,就ok了。
好,接下来我们写一下伪代码
先打开主页面,获取他的id号
然后在他当前的id号里面获取音频的真实地址,在保存










GUI页面正在开发和学习,等完工会我会发布的,也可能不会发布。但,只要我做了写了,就一定会发布。
可以看一下预览页面

QQ截图20191214165109.png (11.46 KB, 下载次数: 2)

下载附件  保存到相册

2019-12-14 16:51 上传


爬取成品(教你如何找女朋友):链接:https://pan.baidu.com/s/1kh4-_qm4UuiKmoYLomCRlg
提取码:0c3k

QQ截图20191214170649.png (260.16 KB, 下载次数: 1)

下载附件  保存到相册

2019-12-14 17:07 上传


在填写地址时,一定要全部复制进去,一定要看清楚页面
源码和可执行程序已经全部打包
下载完后,将会自动退出程序,目录我已经写死了,在E盘下的喜马拉雅上

嗨学网 附件.txt (147 Bytes, 下载次数: 63) 2019-12-14 17:15 上传 点击文件名下载附件
下载积分: 吾爱币 -1 CB


QQ截图20191214162503.png (302.36 KB, 下载次数: 3)

下载附件  保存到相册

2019-12-14 16:25 上传

QQ截图20191214162503.png

版权声明:

本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。

有关影视版权:本站只供百度云网盘资源,版权均属于影片公司所有,请在下载后24小时删除,切勿用于商业用途。本站所有资源信息均从互联网搜索而来,本站不对显示的内容承担责任,如您认为本站页面信息侵犯了您的权益,请附上版权证明邮件告知【754403226@qq.com】,在收到邮件后72小时内删除。本文链接:https://www.piaodoo.com/8051.html

搜索