本文来源吾爱破解论坛
本帖最后由 孤城2002 于 2019-7-24 16:04 编辑
先上源码
[Python] 纯文本查看 复制代码
import requests import re url = 'https://bcy.net/coser/toppost100' # 要进行抓取的url web_url = "https://bcy.net" # 官方网站 file = 'img/' # 文件的保存路径最后加反斜杠 headers = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36' } # 获取抓取数据页面 data = requests.get(url, headers=headers).text wi_url_id = re.findall('<a href=".*?class="db posr ovf"', data) # 对抓取图片单独页面url进行遍历 for s in wi_url_id: wi_id = web_url + s.lstrip('<a href="').rstrip('" class="db posr ovf"') n_data = requests.get(wi_id, headers=headers).text # 获取单独的图片页面数据 json_data = re.findall('"{.*?}"', n_data)[0].lstrip('"').rstrip('}}"') n_http = re.findall('"path.*?w650', json_data) # 对图片url进行遍历 for b in n_http: try: img_data = b.lstrip('"path\\":\\"s') + '.image' img_url = 'https:/' + img_data.replace('u002F', '').replace('\\\\', '/') img = requests.get(img_url, headers=headers).content # 获取图片数据 img_name = img_url.rstrip('.jpg~tplv-banciyuan-w650.image')[-31:] # 获取图片名 # 对图片进行保存 with open(file + img_name + '.jpg', 'wb') as f: f.write(img) print('以保存,图片url:' + img_url) except: print('保存失败')
运行图
(`RS{XYVKY@0H{W9H94[Q@4.png (547.65 KB, 下载次数: 0)
下载附件 保存到相册
可以爬的cos区链接
S[PO}TZW2{IJJ4SKY]45931.png (515.01 KB, 下载次数: 0)
下载附件 保存到相册
可以爬的绘画区链接
F3(`LR{O`U`UMI1{Q{B5QKO.png (451.19 KB, 下载次数: 0)
下载附件 保存到相册
使用说明需要安装requests库,在运行脚本的文件夹下新建一个img文件夹
源码也可供大家学习和参考。
版权声明:
本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。
- 上一篇: [原创] 定时检查更新进度, 及时推送更新
- 下一篇: [搬运]马里奥大大逃杀 开源源码