亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

Python3爬蟲入門之爬取豆瓣Top250電影名稱

2019-11-06 07:02:03
字體:
來源:轉載
供稿:網友

Python3爬蟲入門之爬取豆瓣Top250電影名稱

準備工具

Python3.5requestsBeautifulSouplxml

最終效果

這里寫圖片描述

首先看一下網站的結構 這里寫圖片描述 可以很清楚的看到每個電影對應了一個<li>標簽,我們只需要一步一步的從<ol> 向下搜索,可以得到電影對應的名稱,即<span class="titile">肖申克的救贖</span> 這一行接著看一下網頁內 后頁按鈕對應的代碼結構 這里寫圖片描述 可以看出后一頁的URL為 https://movie.douban.com/top250?start=25&filter= 最后一頁這沒有這個標簽 對應None 這樣我們就可以進行翻頁了 直接上代碼獲取html代碼 這里使用requests模塊,獲取很方便import requests# 獲取目標網頁htmldef download_page(url):# 偽裝成瀏覽器 headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36' } data = requests.get(url, headers=headers).content return data解析html 獲取到html源碼后就要對其進行解析了,這里使用BeautifulSoup模塊from bs4 import BeautifulSoupURL='https://movie.douban.com/top250'# 解析html 方法一 (這里的寫法參考了某博主的代碼)def parse_html(html): # 獲取BeautifulSoup 對象 soup = BeautifulSoup(html,'lxml') movie_name_list = [] # 先獲取最外層ol movie_list_soup = soup.find('ol', attrs={'class':'grid_view'}) # 獲取每個列表<li> for movie_li in movie_list_soup.find_all('li'): detail = movie_li.find('div', attrs={'class':'hd'}) movie_name = detail.find('span', attrs={'class':'title'}).getText()# 這里名稱要用getText()獲取相應內容 movie_name_list.append(movie_name) next_page = soup.find('span',attrs={'class':'next'}).find('a') if next_page: return movie_name_list,URL+next_page['href'] return movie_name_list,Nonefrom bs4 import BeautifulSoupURL='https://movie.douban.com/top250'# 解析html方法2 這里用了一些BeautifulSoup的新特性 用起來比較方便def parse_html1(html): soup = BeautifulSoup(html, 'lxml'); movie_names = [] movie_list = soup.select('ol.grid_view li div.item div.info div.hd a') for movie_title in movie_list: movie_name = movie_title.find('span',class_='title') movie_names.append(movie_name.getText()) next_page = soup.find('span',class_='next').find('a') if next_page: return movie_names,URL+next_page['href'] return movie_names,None匯總一下,并把獲取到的名字列表寫進文件中import requestsfrom bs4 import BeautifulSoupURL='https://movie.douban.com/top250'# 獲取目標網頁htmldef download_page(url): headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36' } data = requests.get(url, headers=headers).content return data# 解析htmldef parse_html1(html): soup = BeautifulSoup(html, 'lxml'); movie_names = [] movie_list = soup.select('ol.grid_view li div.item div.info div.hd a') for movie_title in movie_list: movie_name = movie_title.find('span',class_='title') movie_names.append(movie_name.getText()) next_page = soup.find('span',class_='next').find('a') if next_page: return movie_names,URL+next_page['href'] return movie_names,Nonedef main(): url = URL with codecs.open('e:/movies.txt','wb',encoding='utf-8') as fp: while url: html = download_page(url) movies,url=parse_html1(html) for movie_name in movies: fp.write(movie_name) fp.write('/r/n')if __name__=='__main__': main()
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
最新中文字幕亚洲| 中文字幕v亚洲ⅴv天堂| 亚洲最大激情中文字幕| 久久久久九九九九| 91美女片黄在线观看游戏| 欧美一级黑人aaaaaaa做受| 亚洲综合中文字幕在线| 欧美精品999| 日韩欧美国产黄色| 亚洲视频在线观看网站| 欧美电影电视剧在线观看| 亚洲第一视频在线观看| 国产综合久久久久久| 国产精品青草久久久久福利99| 精品久久久国产精品999| 日韩中文字幕网址| 中文字幕一精品亚洲无线一区| 亚洲а∨天堂久久精品喷水| 精品中文字幕在线观看| 欧美亚洲日本黄色| 国产不卡av在线免费观看| 日韩国产一区三区| 97超级碰碰碰| 91精品久久久久久久| 97在线看福利| 亚洲精品在线91| 国产精品视频yy9099| 中文字幕av一区二区三区谷原希美| 久久久噜噜噜久久| 国产精品久久久久免费a∨大胸| 国产一区二区三区视频在线观看| 亚洲大胆美女视频| 久久久久久久久久久久久久久久久久av| 91久久久久久久久久| 欧美日韩国产精品专区| 欧美大尺度在线观看| 成人精品一区二区三区| 欧美一区二区三区免费视| 亚洲成人精品在线| 国产91在线视频| 成人黄色短视频在线观看| 久久久精品亚洲| 国产有码一区二区| 精品亚洲男同gayvideo网站| 亚洲欧美制服另类日韩| 国产精品91在线观看| 国产成人精品一区二区在线| 精品国产一区二区三区在线观看| 欧美成人午夜视频| 中文字幕在线成人| 国内精品模特av私拍在线观看| 亚洲国产成人精品一区二区| 亚洲黄色成人网| 久久久久久久久久久成人| 国产精品视频导航| 97精品视频在线播放| **欧美日韩vr在线| 国产自产女人91一区在线观看| 欧美xxxx综合视频| 国产精品99久久99久久久二8| 日韩中文字幕在线看| 亚洲福利视频久久| 国产欧美精品一区二区三区介绍| 日韩一区二区三区在线播放| 亚洲天堂男人的天堂| 欧美黄色性视频| 久久久之久亚州精品露出| 欧美性猛交99久久久久99按摩| 国产成人精品av| 91精品综合久久久久久五月天| 国产精品免费视频久久久| 国产日韩欧美日韩大片| 亚洲人成电影网站| 中文字幕国产精品久久| 欧美特级www| 中文字幕九色91在线| 国产亚洲欧洲在线| 久久久亚洲天堂| 亚洲精品久久久一区二区三区| 日韩电影在线观看永久视频免费网站| 日本亚洲欧洲色α| 成人美女av在线直播| 欧美裸体xxxxx| 亚洲伊人久久综合| 成人在线视频福利| 91精品国产免费久久久久久| 亚洲mm色国产网站| 伊人伊成久久人综合网小说| 精品国产福利视频| 亚洲一区二区日本| 国产成人精品亚洲精品| 国产精品99蜜臀久久不卡二区| 欧美电影第一页| 久久成人亚洲精品| 亚洲国产精品999| 亚洲人成在线观| 国产精品羞羞答答| 这里只有精品视频在线| 亚洲少妇激情视频| 欧美尺度大的性做爰视频| 亚洲乱码国产乱码精品精| 日韩欧美成人网| 欧美午夜精品久久久久久久| 精品久久久久久久久久ntr影视| 亚洲aⅴ男人的天堂在线观看| 日韩精品视频免费在线观看| 国产精品美女免费视频| 亚洲综合国产精品| 亚洲人精品午夜在线观看| 亚洲国产成人精品电影| 欧美第一页在线| 国产精品一区二区性色av| 俺去了亚洲欧美日韩| 久久九九热免费视频| 欧美午夜视频在线观看| 欧美高清视频在线| 国产精品日韩专区| 久久综合久久88| 久久免费精品日本久久中文字幕| 成人444kkkk在线观看| 欧美日韩在线视频一区二区| 午夜精品久久久久久99热| 亚洲国产欧美一区二区三区久久| 国产精品视频xxxx| 亚洲欧美一区二区三区久久| 影音先锋欧美在线资源| 亚洲福利精品在线| 精品国产一区二区三区久久狼5月| 免费av在线一区| 亚洲精品按摩视频| 国产有码在线一区二区视频| 丝袜美腿亚洲一区二区| 4438全国亚洲精品在线观看视频| 欧美猛少妇色xxxxx| 欧美激情视频在线| 色偷偷偷亚洲综合网另类| 国产视频精品va久久久久久| 91精品啪aⅴ在线观看国产| 久久久免费精品| 精品亚洲aⅴ在线观看| 精品国产一区二区三区久久狼黑人| 欧美性xxxx极品高清hd直播| 欧美裸体xxxxx| 日韩一区二区久久久| 国产精品福利网| 成人免费自拍视频| 欧亚精品在线观看| 91亚洲va在线va天堂va国| 这里只有精品在线观看| 欧美激情精品久久久久| 91精品国产91久久久| 日韩a**站在线观看| 美女视频久久黄| 久久99青青精品免费观看| 国产精品第七影院| 日韩性生活视频| 国产精品亚洲欧美导航| 亚洲新中文字幕| 欧美黑人xxxⅹ高潮交| www.日韩不卡电影av| 久久av中文字幕| 乱亲女秽乱长久久久| 久久精品成人欧美大片| 国产亚洲精品成人av久久ww|