本文来源吾爱破解论坛
听说斗破苍穹,恐怖如斯,爬下来瞧瞧。。。。。
import requests
import re
import time
hds = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/77.0.3865.120 Safari/537.36'
}
f = open(r'e:\book.txt','a+',encoding='utf-8')
def get_txt(url):
res = requests.get(url,headers = hds)
if res.status_code == 200:
contents = re.findall('<p>(.*?)</p>',res.content.decode('utf-8'),re.S)
for content in contents:
f.write(content + '\n')
else:
pass
if __name__ == '__main__':
urls = ['http://www.doupoxs.com/doupocangqiong/{}.html'.format(str(i)) for i in range(2,1647)]
for url in urls:
get_txt(url)
time.sleep(1)
f.close()
版权声明:
本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。
- 上一篇: 新手爬取豆瓣读书250练手
- 下一篇: Python分析12306JS