本文来源吾爱破解论坛
本帖最后由 wushaominkk 于 2018-9-12 14:44 编辑
帮网友爬电影下载地址
小白发帖,望多多指教:
如果大家有需要爬的网站可以留言,有空可以帮忙爬
今天发帖才发现,发的代码不知道为什么贴上去,显示不完整,所以大家以图片中的代码为准,还有,那个发帖的时候代码显示格式不会弄,哪位大佬教一下
源码:
[Python] 纯文本查看 复制代码
from urllib import request import urllib,requests,redef pa(): header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:62.0) Gecko/20100101 Firefox/62.0','Host':'www.btdx8.com'} url='https://www.btdx8.com/' da=urllib.request.Request(url,headers=header) de=urllib.request.urlopen(da) html=de.read().decode("utf-8") [i]#print(html) [/i][i] [/i]lik=re.findall('<li ><a ',html,re.S) for l in lik: link=('https://www.btdx8.com/torrent/%s'%l) da=urllib.request.Request(link,headers=header) de=urllib.request.urlopen(da) html = de.read().decode("utf-8") url=re.findall('<div id="zdownload"><a href="(.*?)" rel="nofollow" title="点击进入 (.*?).torrent 下载页面" class="download-link" target="_blank"><span>(.*?)P种子</span>(.*?).torrent </a></div>',html,re.S) for i,l in enumerate(url): title=l[1] titlelink=l[0] print(('电影名称:%s--下载地址:%s'%(title,titlelink))) if __name__ == '__main__': pa()
1.png (214.83 KB, 下载次数: 6)
下载附件 保存到相册
2018-9-10 21:21 上传
版权声明:
本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。
- 上一篇: 斗图神器——python让你斗图无敌
- 下一篇: 获取类及函数工具