亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

Python的charts和Jupyter的使用 使數據可視化 對58同城的爬取

2019-11-11 05:46:09
字體:
來源:轉載
供稿:網友

嘗試學習了將爬取的數據進行清洗,更新數據庫后。進行可視化。記錄一部分

主要是對兩個庫的使用

使用pip進行安裝

jupyter安裝后再cmd下輸入 jupyter notebook

成功的話會跳轉到瀏覽器: 這里寫圖片描述

這里寫圖片描述

確實好用方便

在jupyter中編寫

這里寫圖片描述

有個庫是string中的。是標點符號的庫。 punctuation if not in punctuation

可以做數據的清洗過濾。如果不是標點符號

清洗數據后,更新 update方法 db.collection.update() 接收兩個參數 1. 更新哪個文件 2. 怎么改。

如下圖:

這里寫圖片描述

其他操作符 這里寫圖片描述

清洗后 可視化

Charts

例子:

import charts#數據series =[ { 'name':'OS X', 'data':[11], 'type':'column' }, {'name':'Ubuntu', 'data':[8], 'type':'column' }, {'name':'Windows', 'data':[12], 'type':'column' }, {'name':'Other', 'data':[29], 'type':'column' }]#使用charts繪畫charts.plot(series,show='inline',options=dict(title=dict(text='Charts test')))

運行后:好方便!

這里寫圖片描述

我也百度看的別人的博客

http://www.cnblogs.com/pangduzi/p/5889896.html

這個就寫的很詳細。我也記錄下,方便以后使用。

我也爬取了一會58二手數據。。。但是沒讓電腦跑那么久。 看到這位大佬也爬取了 http://www.cnblogs.com/pangduzi/p/5889952.html

學習了。

對這幾天學習的爬取做下總結: 更加熟練的使用BeautifulSoup了。結合谷歌瀏覽器的復制來獲取其分析路徑。 然后用其的select方法來獲取。

還有對其網頁進行分析。 使用多進程快些。多核的話多進程比多線程更快些。

記錄下當時的筆記:

對58同城的二手市場爬取

先進入二手市場首頁,然后獲取所有二手分類

這里寫圖片描述

分析就是 這里寫圖片描述

Ul下的li下的b的a

ul.ym-submnu > li > b > a

但是返回的只是后面的,并不是完整的url,那么拼接

# -*- coding: UTF-8 -*-import requestsfrom bs4 import BeautifulSoup#二手首頁,然后獲取每個二手分類的urlstart_url = 'http://cd.58.com/sale.shtml'def get_channel_urls(url): wb_data = requests.get(start_url) soup = BeautifulSoup(wb_data.content) links = soup.select('ul.ym-submnu > li > b > a') for link in links: page_url = 'http://cd.58.com/'+link.get('href') PRint(page_url)get_channel_urls(start_url)

這里寫圖片描述

然后獲取每個分類也后的每個商品的url,并存入mongoDB

這里寫圖片描述

# -*- coding: UTF-8 -*-import requestsfrom bs4 import BeautifulSoupimport timeimport pymongo#將爬取的url放入數據庫,先建立數據庫client = pymongo.MongoClient('localhost',27017)ceshi = client['ceshi']url_list = ceshi['url_list']#第一個爬蟲,抓起列表中的url#每一個二手分類頻道里的每個商品獲取其urldef get_links_from(channel,pages,who_sells=0): #http://cd.58.com/diannao/pn2 #頁面變的就是pn ,who_sells是分類個人還是商家 默認0也就是個人 list_view = '{}{}/pn{}'.format(channel,str(who_sells),str(pages)) wb_data = requests.get(list_view) time.sleep(1) soup = BeautifulSoup(wb_data.content) for link in soup.select('td.t a.t'): item_link =link.get('href').split('?')[0] url_list.insert({'url':item_link}) print(item_link)get_links_from('http://cd.58.com//danche/',2)

這里寫圖片描述

但是輸入過大的頁面有可能就沒有了

那么做個判斷。 比較有與沒有的差別 在于是否有商品,用的是td

就在for前面加個判斷

if soup.find('td','t'): for link in soup.select('td.t a.t'): item_link =link.get('href').split('?')[0] url_list.insert({'url':item_link}) print(item_link)else: pass

然后第二個爬取,爬取每個商品的詳細信息

有可能之前爬取的url突然刪除了或者已經交易出去了。

返回的是404頁面。那么做個判斷 404在 script標簽中有404就是灰跳轉到404

#爬取商品的詳細信息def get_item_info(url): wb_data = requests.get(url) soup = BeautifulSoup(wb_data.content) #有可能之前爬取的url突然刪除了或者已經交易出去了。 no_longer_exist = '404' in soup.find('script',type="text/javascript").get('src').split('/') if no_longer_exist: pass else: title = soup.title.text price = soup.select('span.price.c_f50')[0].text date = soup.select('.time')[0].text #有的有可能會沒有所有在后面做了個if else的判斷 ##content > div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.sumary > ul > li:nth-child(3) > div.su_con > span area = list(soup.select('#content > div.person_add_top.no_ident_top > div.per_ad_left > div.col_sub.sumary > ul > li:nth-of-type(3) > div.su_con > span > a:nth-of-type(1)')[0].text) if soup.find('span','c_25d') else None item_info.insert({'title':title,'price':price,'date':date,'area':area}) print(area)get_item_info('http://cd.58.com/diannao/23276725917860x.shtml')

這里寫圖片描述

設置代理的話

先有代理ip和端口 然后proxies={‘http’:那個代理} Request.get(url,headers=headers,proxies=proxies)

對于類似二手交易網站的爬取。 先爬取頻道,分析其url。 先進入一個頻道,然后分析其商品和需要的數據。使用beautifulsoup來解析,使用谷歌的復制方便些,也可以自己分析其結構。 然后可以進入這個商品的詳細信息分析。 使用MongoDB實在是有夠方便。。。。

一個爬蟲:爬取所有頻道url 一個爬取把放入的頻道url進行商品的爬取。 還可以寫個每個商品的詳細信息爬取。 使用多進程要快與多進程5-7倍。單核的電腦不要使用多進程。 可以寫個監視py 也就是簡單來說每隔一定時間查詢數據庫中的數據量。

就是多寫,多分析。多使用一些python方便的庫~


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
国产成人精品免费视频| 欧美黑人一区二区三区| 91高清免费在线观看| 日韩天堂在线视频| 国产亚洲视频在线观看| 国产亚洲a∨片在线观看| 亚洲精品色婷婷福利天堂| 57pao成人国产永久免费| 国产精品十八以下禁看| 国产精品色悠悠| 国产美女被下药99| 尤物九九久久国产精品的分类| 欧美成人一二三| 亚洲欧洲av一区二区| 欧美一级淫片播放口| 亚洲精品国产拍免费91在线| 欧美激情在线有限公司| 国产成人精品综合| 国产91精品久久久久久久| 国产欧美日韩精品在线观看| 国产999视频| 国产欧美精品日韩| 色偷偷噜噜噜亚洲男人| 97视频免费观看| 中国日韩欧美久久久久久久久| 91国产视频在线| 欧美综合国产精品久久丁香| 欧美激情网站在线观看| 91av视频在线| 亚洲国产精久久久久久久| 久久躁狠狠躁夜夜爽| 日本久久久久久久| 亚洲第一精品夜夜躁人人躁| 亚洲最大成人网色| 成人a在线观看| 亚洲国产成人精品女人久久久| 日韩在线观看免费高清完整版| 日韩在线视频免费观看高清中文| 日韩精品有码在线观看| 九九久久久久99精品| 欧美激情xxxx| 亚洲高清一区二| 日韩在线资源网| 欧美国产极速在线| 国产在线高清精品| 国产日韩欧美中文| 一区二区国产精品视频| 久久久99久久精品女同性| 国产精品久久av| 亚洲精品自拍偷拍| 欧美视频免费在线| 亚洲一区二区三区成人在线视频精品| 91国产视频在线| 亚洲国产精品va在线看黑人动漫| 91免费版网站入口| 国模吧一区二区| 日韩亚洲成人av在线| 欧美在线免费观看| 88国产精品欧美一区二区三区| 欧美亚洲国产视频小说| 欧美丝袜一区二区三区| 欧美最顶级丰满的aⅴ艳星| 欧美在线免费视频| 精品国产乱码久久久久酒店| 91精品国产91久久久久福利| 亚洲国产精品电影在线观看| 亚洲综合中文字幕在线观看| 在线观看精品国产视频| 亚洲精品影视在线观看| 欧美日韩国产精品一区| 日韩黄色高清视频| 欧美日韩第一视频| 亚洲人成网7777777国产| 日韩精品亚洲视频| 久久久久久久久久久av| 久久久免费高清电视剧观看| 在线视频欧美日韩精品| 少妇精69xxtheporn| 中文字幕欧美专区| 欧美一区深夜视频| 日韩视频精品在线| 精品中文字幕在线观看| 国产精品大片wwwwww| 中文字幕日韩专区| 国产精品青青在线观看爽香蕉| 欧美电影免费观看| 91精品啪在线观看麻豆免费| 久久久久久国产| 欧美日韩美女视频| 亚洲第一免费网站| 91国产视频在线| 久久久之久亚州精品露出| 国产69久久精品成人| 欧美一区二粉嫩精品国产一线天| 久久中文字幕在线| 在线性视频日韩欧美| 亚洲午夜未删减在线观看| 国产精品美女久久久免费| 色老头一区二区三区| 久久久久久亚洲| 免费成人高清视频| 亚洲一区二区免费在线| 宅男66日本亚洲欧美视频| 久久综合免费视频影院| 欧美成人合集magnet| 亚洲性生活视频| 狠狠躁夜夜躁人人爽超碰91| 欧美一级黑人aaaaaaa做受| 国产欧美一区二区三区在线看| 国产裸体写真av一区二区| 懂色aⅴ精品一区二区三区蜜月| 欧美在线一区二区三区四| 8x海外华人永久免费日韩内陆视频| 日韩成人免费视频| 91成人在线播放| 国产香蕉精品视频一区二区三区| 精品久久久久久国产| 久久亚洲精品网站| 欧美黄色小视频| 久久视频在线直播| 久久久亚洲精品视频| 黑人巨大精品欧美一区二区一视频| 亚洲亚裔videos黑人hd| 欧美日韩在线观看视频| 成人欧美一区二区三区黑人孕妇| 在线国产精品视频| 欧美裸身视频免费观看| 亚洲精品视频二区| 国产精品视频精品| 美女久久久久久久| 国产精品视频免费在线| 日韩av免费在线| 国产美女被下药99| 欧美高清无遮挡| 国产成人亚洲综合91精品| 国产一区二区三区直播精品电影| 日本成人在线视频网址| 欧美黄色成人网| 欧美理论片在线观看| 亚洲精品日韩激情在线电影| 欧美精品18videos性欧| 国产一区二中文字幕在线看| 亚洲一区中文字幕在线观看| 久久精品国产69国产精品亚洲| 欧美精品久久久久久久久久| 日韩欧美在线视频免费观看| 插插插亚洲综合网| 国产精品久久综合av爱欲tv| 欧美性生交大片免费| 国内免费精品永久在线视频| 91wwwcom在线观看| 91在线视频成人| 欧美插天视频在线播放| 国产91精品视频在线观看| 91精品免费视频| 欧美精品制服第一页| 亚洲国产欧美一区二区三区同亚洲| 精品一区二区三区四区在线| 国产精品高清在线观看| 国产精品日韩在线观看| 国产精品免费在线免费| 亚洲欧美一区二区三区久久| 国产专区欧美专区| 亚洲专区中文字幕|