这篇文章主要介绍了Python使用bs4获取58同城城市分类的方法,涉及Python使用BeautifulSoup库解析html页面的技巧,需要的朋友可以参考下
本文实例讲述了Python使用bs4获取58同城城市分类的方法。分享给大家供大家参考。具体如下:
# -*- coding:utf-8 -*- #! /usr/bin/python import urllib import os, datetime, sys from bs4 import BeautifulSoup reload(sys) sys.setdefaultencoding( "utf-8" ) __BASEURL__ = "http://bj.58.com/" __INITURL__ = "http://bj.58.com/hezu/" soup=BeautifulSoup(urllib.urlopen(__INITURL__)) lv1Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem')('a',href=True) f=open('data.txt', 'w') for element in lv1Elements[1:]: f.write((element.get_text() + '\r\n')) print element.get_text() url = __BASEURL__ + element.get('href') print url soup=BeautifulSoup(urllib.urlopen(url)) lv2Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem').find('div', 'subarea').find_all('a') texts = [t.get_text() for t in lv2Elements] f.write(' '.join(texts) + '\r\n\r\n') f.close()
希望本文所述对大家的Python程序设计有所帮助。
版权声明:
本站所有资源均为站长或网友整理自互联网或站长购买自互联网,站长无法分辨资源版权出自何处,所以不承担任何版权以及其他问题带来的法律责任,如有侵权或者其他问题请联系站长删除!站长QQ754403226 谢谢。
- 上一篇: Python实现批量修改文件名实例
- 下一篇: python中偏函数partial用法实例分析