本文来源吾爱破解论坛
本帖最后由 panwanpeng 于 2019-3-20 16:12 编辑
[Python] 纯文本查看 复制代码
import requests from lxml import etree headers={ "user-agent":"Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36", "referer":"https://www.mzitu.com/tag/ugirls/" } #1.请求数据 response=requests.get("https://www.mzitu.com/tag/ugirls/",headers=headers) #2.抽取想要数据 xml=etree.HTML(response.text) #整理成xml文档数据 title_list=xml.xpath('//img[@class="lazy"]/@alt') src_list=xml.xpath('//img[@class="lazy"]/@data-original') #4.以图片标题保存图片 for tit,src in zip(title_list,src_list): response=requests.get(src,headers=headers) #反爬虫,模拟浏览器提交 filename="\\"+ tit +".jpg" with open(filename,"wb") as f: f.write(response.content)
需要安装requests和lxml插件
来张效果图:
QQ图片20190320145428.png (195.65 KB, 下载次数: 5)
下载附件 保存到相册
补充:这个东西我安装了python 3.7.2 和pycharm,然后用pycharm安装requests和lxml插件,这个不能一步一步讲啊,其实大家搜一下就知道了。
版权声明:
本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。
- 上一篇: python爬取二十四节气表
- 下一篇: RSAS批量下任务工具-pyqt5界面分离实现