首页 编程教程正文

爬取千图网,居然还没水印!带上思路

piaodoo 编程教程 2020-02-22 22:06:40 991 0 python教程

本文来源吾爱破解论坛

昨天有个论坛上小哥们在我之前发的一篇帖子上留了言给我了一点启发,如何我晚上试了试,我靠,真把千图网的一个视频给爬下来了,今天早上一起床我就来试了试,本帖子是一遍写代码一遍打的,我会把我全部的思路都展现给你们看,我让那些在学习的人不要跟我一样走了很多弯路。
打开某个模块查看图片链接

QQ截图20190717082719.png (771.82 KB, 下载次数: 0)

下载附件  保存到相册

2019-7-17 08:28 上传

QQ截图20190717082730.png (699.09 KB, 下载次数: 1)

下载附件  保存到相册

2019-7-17 08:29 上传


找独一无二的

QQ截图20190717082802.png (862.74 KB, 下载次数: 0)

下载附件  保存到相册

2019-7-17 08:29 上传

,接下来去源码里看看

02.png (127.73 KB, 下载次数: 0)

下载附件  保存到相册

2019-7-17 09:21 上传


打开它,算了算了,我这浏览器太智障 了,配图有点麻烦,接下来我就口述吧
那个链接打开是没有水印的大概是这样不过没有水印,然后继续打开别的网站
也是一样的套路,也没水印所以去水印的表达式就是http://preview.qiantucdn.com/58pic(.*?)!w1024_water
接下来就可以写代码了,还有一种方法,下载的图片是像素更高的,不过我不知道表达式咋写,他们用了一个不知道是啥,我网站构造不出来我只成功了一个,给你们放图

QQ截图20190717082945.png (397.7 KB, 下载次数: 0)

下载附件  保存到相册

2019-7-17 08:29 上传

图片太大,不方便上传,接下来就是成品图

QQ截图20190717103524.png (361.4 KB, 下载次数: 0)

下载附件  保存到相册

2019-7-17 10:36 上传


代码:

链接:https://pan.baidu.com/s/13glBbRA6Cd0ClZRElCkuEA
提取码:rpbn
复制这段内容后打开百度网盘手机App,操作更方便哦
我的这个只能下载我点的模块的图片,如果 想要下载别的模块需要重新构造
另外这个表达式给你们:pic.qiantucdn.com/58pic(.*?)_pic2018.jpg
有些有水印的可以通过这个去掉,而且这个还是无损下载,网站上标码多少像素就是他的一半
md这个表达式又tm能使了,不管了import re
import urllib.request

for x in range(0,6):
    url_da = "https://www.58pic.com/piccate/53-0-0-p"+str(x) +".html"
    data_data = urllib.request.urlopen(url_da).read().decode('gbk','ignore')
    data_tj = '<a href="//www.58pic.com/newpic/(.*?).html"'
    data_p = re.compile(data_tj).findall(data_data)
    for a in range(len(data_p)):
        new_url = "http://www.58pic.com/newpic/" + str(data_p[a]) + ".html"
        data = urllib.request.urlopen(new_url).read().decode("gbk","ignore")
        tj_a = 'content="//preview.qiantucdn.com/58pic/(.*?)w1024_water"'
        title_tj = '<span class="pic-title fl">(.*?)</span>'
        p = re.compile(tj_a).findall(str(data))
        tit_p = re.compile(title_tj).findall(str(data))
        tit_p = tit_p[0]
        for i in range(len(p)):
            url = "http://preview.qiantucdn.com/58pic/" + str(p[i]) + "w1024_water"
            file = "F:/bing/千图网/" + str(tit_p) + ".jpg"
            urllib.request.urlretrieve(url,filename=file)
            print("下载完成:" + tit_p)

print("已全部下载完成")#如果不成功应该是文件地址的问题修改一下file就可以了

07.png (11.37 KB, 下载次数: 1)

下载附件  保存到相册

2019-7-17 09:22 上传

07.png

3.0.png (265.56 KB, 下载次数: 0)

下载附件  保存到相册

2019-7-17 09:22 上传

3.0.png

4.0.png (208.05 KB, 下载次数: 1)

下载附件  保存到相册

2019-7-17 09:22 上传

4.0.png

06.png (25.36 KB, 下载次数: 0)

下载附件  保存到相册

2019-7-17 09:22 上传

06.png

05.png (21.65 KB, 下载次数: 0)

下载附件  保存到相册

2019-7-17 09:21 上传

05.png

01.png (21.8 KB, 下载次数: 0)

下载附件  保存到相册

2019-7-17 09:21 上传

01.png

QQ截图20190717084308.png (700.17 KB, 下载次数: 0)

下载附件  保存到相册

2019-7-17 08:43 上传

QQ截图20190717084308.png

QQ截图20190717082810.png (146.43 KB, 下载次数: 1)

下载附件  保存到相册

2019-7-17 08:29 上传

QQ截图20190717082810.png

版权声明:

本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。

有关影视版权:本站只供百度云网盘资源,版权均属于影片公司所有,请在下载后24小时删除,切勿用于商业用途。本站所有资源信息均从互联网搜索而来,本站不对显示的内容承担责任,如您认为本站页面信息侵犯了您的权益,请附上版权证明邮件告知【754403226@qq.com】,在收到邮件后72小时内删除。本文链接:https://www.piaodoo.com/7554.html

搜索