亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

Python爬蟲包BeautifulSoup學習實例(五)

2020-02-15 21:54:19
字體:
來源:轉載
供稿:網友

本文為大家分享了Python爬蟲包BeautifulSoup學習實例,具體內容如下

BeautifulSoup

使用BeautifulSoup抓取豆瓣電影的一些信息。

# -*- coding: utf-8 -*-# @Author: HaonanWu# @Date:  2016-12-24 16:18:01# @Last Modified by:  HaonanWu# @Last Modified time: 2016-12-24 17:25:33import urllib2import jsonfrom bs4 import BeautifulSoupdef nowplaying_movies(url):  user_agent = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36'  headers = {'User-Agent':user_agent}  request = urllib2.Request(url = url, headers = headers)  response = urllib2.urlopen(request)  soup_packetpage = BeautifulSoup(response, 'lxml')  items = soup_packetpage.findAll("li", class_="list-item")  # items = soup_packetpage.findAll("li", {"class" : "list-item"}) 等價寫法  movies = []  for item in items:    if item.attrs['data-category'] == 'nowplaying':      movie = {}      movie['title'] = item.attrs['data-title']      movie['score'] = item.attrs['data-score']      movie['director'] = item.attrs['data-director']      movie['actors'] = item.attrs['data-actors']      movies.append(movie)      print('%(title)s|%(score)s|%(director)s|%(actors)s' % movie)  return moviesif __name__ == '__main__':  url = 'https://movie.douban.com/nowplaying/beijing/'  movies = nowplaying_movies(url)  print('%s' % json.dumps(movies, sort_keys=True, indent=4, separators=(',', ': ')))

HTMLParser

使用HTMLParser實現上述功能

這里有一些HTMLParser的基礎教程

由于HtmlParser自2006年以后就再沒更新,目前很多人推薦使用jsoup代替它。

# -*- coding: utf-8 -*-# @Author: HaonanWu# @Date:  2016-12-24 15:57:54# @Last Modified by:  HaonanWu# @Last Modified time: 2016-12-24 17:03:27from HTMLParser import HTMLParserimport urllib2import jsonclass MovieParser(HTMLParser):  def __init__(self):    HTMLParser.__init__(self)    self.movies = []  def handle_starttag(self, tag, attrs):    def _attr(attrlist, attrname):      for attr in attrlist:        if attr[0] == attrname:          return attr[1]      return None    if tag == 'li' and _attr(attrs, 'data-title') and _attr(attrs, 'data-category') == 'nowplaying':      movie = {}      movie['title'] = _attr(attrs, 'data-title')      movie['score'] = _attr(attrs, 'data-score')      movie['director'] = _attr(attrs, 'data-director')      movie['actors'] = _attr(attrs, 'data-actors')      self.movies.append(movie)      print('%(title)s|%(score)s|%(director)s|%(actors)s' % movie)def nowplaying_movies(url):  headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36'}    req = urllib2.Request(url, headers=headers)  s = urllib2.urlopen(req)  parser = MovieParser()  parser.feed(s.read())  s.close()  return parser.moviesif __name__ == '__main__':  url = 'https://movie.douban.com/nowplaying/beijing/'  movies = nowplaying_movies(url)  print('%s' % json.dumps(movies, sort_keys=True, indent=4, separators=(',', ': ')))            
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
欧美激情亚洲自拍| 国产精品中文字幕在线观看| 91国产美女视频| 国产精品久久久久久久一区探花| 久久中文字幕在线视频| 亚洲国产精品va在线| 国产欧美日韩中文字幕在线| 成年无码av片在线| 精品国产欧美一区二区三区成人| 91免费的视频在线播放| 日韩中文有码在线视频| 久久av中文字幕| 91精品国产高清| 亚洲男女自偷自拍图片另类| 欧美激情视频在线| 国产日韩中文字幕在线| www.久久久久久.com| 在线视频日本亚洲性| 91欧美精品午夜性色福利在线| 国产一区二中文字幕在线看| 日韩午夜在线视频| 欧美激情xxxxx| 欧美另类99xxxxx| 成人午夜在线影院| 久久99国产精品久久久久久久久| 91大神在线播放精品| 日韩成人在线视频网站| 欧美亚洲国产视频小说| 亚洲欧洲在线播放| 亚洲大胆人体视频| 日韩精品在线免费| 日本一本a高清免费不卡| 久久午夜a级毛片| 亚洲高清在线观看| 欧美大片免费看| 亚洲伊人久久综合| 欧美大尺度电影在线观看| 日韩美女主播视频| 国产在线观看精品一区二区三区| 中文字幕一区二区三区电影| 国产精品色视频| 国产香蕉一区二区三区在线视频| 91九色在线视频| 欧美激情欧美激情| 91在线免费网站| 国产在线视频2019最新视频| 亚洲国产天堂网精品网站| 精品国产欧美一区二区五十路| 久久精品2019中文字幕| 菠萝蜜影院一区二区免费| 亚洲一区www| 欧美在线视频播放| 欧美精品videos另类日本| 久久精品免费播放| 国产精品91久久久久久| 91精品视频免费观看| 国产精品视频xxxx| 久久免费国产精品1| 久久精品91久久久久久再现| 超碰精品一区二区三区乱码| 国产精品美女999| 国产成人av在线播放| 亚洲精品自拍视频| 欧美性生活大片免费观看网址| 日韩精品在线免费| 日韩黄色av网站| 成人激情视频免费在线| 精品高清一区二区三区| 国产精品自拍视频| 欧美激情va永久在线播放| 成人精品网站在线观看| 成人写真福利网| 疯狂欧美牲乱大交777| 欧美理论在线观看| 国产男女猛烈无遮挡91| 91色p视频在线| 日韩亚洲精品视频| 国产91精品视频在线观看| 国产精品久久视频| 久久免费视频在线| 国产精品一二三在线| 国产精品羞羞答答| 国产成人综合亚洲| 日韩中文字幕在线| 狠狠色噜噜狠狠狠狠97| 国产成人午夜视频网址| 欧美激情亚洲视频| 国产视频精品一区二区三区| 色哟哟网站入口亚洲精品| 久久99亚洲热视| 国产成人97精品免费看片| 欧美日韩国产91| 欧美亚洲国产日本| 亚洲视频精品在线| 亚洲精品456在线播放狼人| 69久久夜色精品国产69| 韩国精品美女www爽爽爽视频| 亚洲电影成人av99爱色| 国产成人综合一区二区三区| 97免费在线视频| 亚洲天堂男人的天堂| 黄色精品一区二区| 成人中文字幕+乱码+中文字幕| 日韩电影中文 亚洲精品乱码| 国产一区二区精品丝袜| 国产亚洲美女精品久久久| 亚洲欧美日韩天堂一区二区| 亚洲第一区在线观看| 久久av红桃一区二区小说| 欧美一级片一区| 美女撒尿一区二区三区| 日韩欧美高清在线视频| 欧美午夜视频一区二区| 亚洲精品国产成人| 精品中文视频在线| 亚洲中国色老太| 久久成人在线视频| 久国内精品在线| 欧美激情a∨在线视频播放| 国产精品极品美女在线观看免费| 亚洲精品在线91| 国产精品亚洲аv天堂网| 亚洲精品国产成人| 久99九色视频在线观看| 成年无码av片在线| 91精品在线播放| 91成人精品网站| 欧美高清在线观看| 92看片淫黄大片欧美看国产片| 热久久这里只有| 性夜试看影院91社区| 欧美高清第一页| 91天堂在线视频| 精品五月天久久| 国产91精品网站| 国产福利精品av综合导导航| 日本久久久久久| 精品国产精品三级精品av网址| 国产中文字幕日韩| 久久精品99国产精品酒店日本| 欧美成在线观看| 国产在线播放不卡| 国产一区二区视频在线观看| 97国产精品视频人人做人人爱| 欧美另类老女人| 中文字幕免费国产精品| 久久91亚洲精品中文字幕| 亚洲人成啪啪网站| 成人有码视频在线播放| 欧美成人午夜激情视频| 最近2019好看的中文字幕免费| 日本免费在线精品| 亚洲第一男人av| 日韩av中文在线| 中文字幕视频在线免费欧美日韩综合在线看| 国产视频综合在线| 在线看片第一页欧美| 欧美激情免费观看| 国产小视频国产精品| 亚洲va久久久噜噜噜| 日韩av电影院| 国产精品久久久久久久9999| 成人精品视频久久久久| 中文字幕亚洲欧美日韩高清|