亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

如何使用python爬取csdn博客訪問量

2020-01-04 17:45:58
字體:
來源:轉載
供稿:網友
這篇文章主要介紹了如何使用python爬取csdn博客訪問量的相關資料,需要的朋友可以參考下
 

最近學習了python和爬蟲,想寫一個程序練練手,所以我就想到了大家都比較關心的自己的博客訪問量,使用python來獲取自己博客的訪問量,這也是后邊我將要進行的項目的一部分,后邊我會對博客的訪問量進行分析,以折線圖和餅圖等可視化的方式展示自己博客被訪問的情況,使自己能更加清楚自己的哪些博客更受關注,博客專家請勿噴,因為我不是專家,我聽他們說專家本身就有這個功能。

一、網址分析

如何使用python爬取csdn博客訪問量

進入自己的博客頁面,網址為:http://blog.csdn.net/xingjiarong 網址還是非常清晰的就是csdn的網址+個人csdn登錄賬號,我們來看一下下一頁的網址。

如何使用python爬取csdn博客訪問量

看到第二頁的地址為:http://blog.csdn.net/xingjiarong/article/list/2 
后邊的數字表示現在正處于第幾頁,再用其他的頁面驗證一下,確實是這樣的,那么第一頁為什么不是http://blog.csdn.net/xingjiarong/article/list/1呢,那么我們在瀏覽器中輸入http://blog.csdn.net/xingjiarong/article/list/1試試,哎,果然是第一頁啊,其實第一頁是被重定向了,http://blog.csdn.net/xingjiarong被重定向到http://blog.csdn.net/xingjiarong/article/list/1,所以兩個網址都能訪問第一頁,那么現在規律就非常明顯了: 
http://blog.csdn.net/xingjiarong/article/list/ + 頁號

二、如何獲取標題

右鍵查看網頁的源代碼,我們看到可以找到這樣一段代碼:

如何使用python爬取csdn博客訪問量

我們可以看到標題都是在標簽

<span class="link_title"><a href="/xingjiarong/article/details/50651235">

所以我們可以使用下面的正則表達式來匹配標題:

<span class="link_title"><a href=".*?">(.*?)</a></span>

三、如何獲取訪問量

拿到了標題之后,就要獲得對應的訪問量了,經過對源碼的分析,我看到訪問量的結構都是這樣的:

<span class="link_view" style="margin: 0px; padding: 0px; line-height: 25.2px; width: 660px; overflow: hidden; clear: both;">		
<span class="link_view".*?><a href=".*?" style="margin: 0px; padding: 0px; line-height: 25.2px; width: 660px; overflow: hidden; clear: both;">		
<a href="/xingjiarong/article/list/2">下一頁</a> <a href="/xingjiarong/article/list/7">尾頁</a>

所以我們可以用下面的正則表達式來匹配,如果匹配成功就說明當前頁不是最后一頁,否則當前頁就是最后一頁。

<a href=".*?">尾頁</a>

五、編程實現

下面是完整的代碼實現:

#!usr/bin/python# -*- coding: utf-8 -*-'''Created on 2016年2月13日@author: xingjiarong使用python爬取csdn個人博客的訪問量,主要用來練手'''import urllib2import re#當前的博客列表頁號page_num = 1#不是最后列表的一頁notLast = 1account = str(raw_input('輸入csdn的登錄賬號:'))while notLast:#首頁地址baseUrl = 'http://blog.csdn.net/'+account#連接頁號,組成爬取的頁面網址myUrl = baseUrl+'/article/list/'+str(page_num)#偽裝成瀏覽器訪問,直接訪問的話csdn會拒絕user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'headers = {'User-Agent':user_agent}#構造請求req = urllib2.Request(myUrl,headers=headers)#訪問頁面myResponse = urllib2.urlopen(req)myPage = myResponse.read()#在頁面中查找是否存在‘尾頁'這一個標簽來判斷是否為最后一頁notLast = re.findall('<a href=".*?">尾頁</a>',myPage,re.S)print '-----------------------------第%d頁---------------------------------' % (page_num,)#利用正則表達式來獲取博客的標題title = re.findall('<span class="link_title"><a href=".*?">(.*?)</a></span>',myPage,re.S)titleList=[]for items in title:titleList.append(str(items).lstrip().rstrip()) #利用正則表達式獲取博客的訪問量view = re.findall('<span class="link_view".*?><a href=".*?" style="margin: 0px; padding: 0px; line-height: 25.2px; width: 660px; overflow: hidden; clear: both;">		
輸入csdn的登錄賬號:xingjiarong-----------------------------第1頁---------------------------------訪問量:1821 標題:python編程常用模板總結訪問量:1470 標題:設計模式之UML(一)類圖以及類間關系(泛化 、實現、依賴、關聯、聚合、組合)訪問量:0714 標題:ubuntu14.04 安裝并破解MyEclipse2014訪問量:1040 標題:ubuntu14.04 配置tomcat8訪問量:1355 標題:java調用python方法總結訪問量:0053 標題:Java多線程之Callable和Future訪問量:1265 標題:跟我學匯編(三)寄存器和物理地址的形成訪問量:1083 標題:跟我學匯編(二)王爽匯編環境搭建訪問量:0894 標題:跟我學匯編(一)基礎知識訪問量:2334 標題:java多線程(一)Race Condition現象及產生的原因訪問量:0700 標題:Matlab矩陣基礎訪問量:0653 標題:Matlab變量、分支語句和循環語句訪問量:0440 標題:Matlab字符串處理訪問量:0514 標題:Matlab運算符與運算訪問量:0533 標題:Matlab的數據類型-----------------------------第2頁---------------------------------訪問量:0518 標題:OpenStack設計與實現(五)RESTful API和WSGI訪問量:0540 標題:解決Android SDK Manager下載太慢問題訪問量:0672 標題:OpenStack設計與實現(四)消息總線(AMQP)訪問量:0570 標題:分布式文件存儲FastDFS(五)FastDFS常用命令總結訪問量:0672 標題:分布式文件存儲FastDFS(四)配置fastdfs-apache-module訪問量:0979 標題:分布式文件存儲FastDFS(一)初識FastDFS訪問量:0738 標題:分布式文件存儲FastDFS(三)FastDFS配置訪問量:0682 標題:分布式文件存儲FastDFS(二)FastDFS安裝訪問量:0511 標題:OpenStack設計與實現(三)KVM和QEMU淺析訪問量:0593 標題:OpenStack設計與實現(二)Libvirt簡介與實現原理訪問量:0562 標題:OpenStack設計與實現(一)虛擬化訪問量:0685 標題:食堂買飯的啟示訪問量:0230 標題:UML之時序圖詳解訪問量:0890 標題:設計模式之橋梁模式和策略模式的區別訪問量:1258 標題:設計模式(十二)責任鏈模式

總結:

使用python編寫爬蟲,我個人總結了以下的步驟:

1、分析要抓取的網址特征,以確定如何生成相關網頁的網址,如果只爬取一個網頁,則這一步可以省略。

2、查看網頁的源碼,分析自己想要爬取的內容所在的標簽的特征。

3、使用正則表達式從源碼中將自己想要的部分摳出來。

4、編程實現。

以上內容是針對如何使用python爬取csdn博客訪問量的相關知識,希望對大家有所幫助。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
国产精品扒开腿爽爽爽视频| 国产精品电影在线观看| 国产香蕉精品视频一区二区三区| 亚洲欧美另类人妖| 日韩中文字幕视频| 欧美性猛交xxxxx免费看| 精品成人乱色一区二区| 欧美巨猛xxxx猛交黑人97人| 欧美电影免费观看网站| 国产精品久久久久久久久久小说| 久久久亚洲福利精品午夜| 91在线|亚洲| 欧美在线一区二区视频| 亚洲电影中文字幕| 欧美老肥婆性猛交视频| 欧美国产日韩在线| 久久精品国产99国产精品澳门| 国内精品久久久久久| 精品毛片三在线观看| 久久国产精品影片| 日韩av影片在线观看| 久久精彩免费视频| 日本精品va在线观看| 国产视频观看一区| 98精品国产高清在线xxxx天堂| 色综合久久88| 国产精品欧美一区二区| 欧美日韩一二三四五区| 日韩综合视频在线观看| 国产精品免费一区二区三区都可以| 中文字幕少妇一区二区三区| 日韩www在线| 亚洲激情国产精品| 亚洲欧美日韩一区在线| 国产亚洲综合久久| 久久精品国产久精国产思思| 日韩高清人体午夜| 亚洲国产精品久久久久久| 97视频在线播放| 亚洲一区二区三区在线视频| 日韩69视频在线观看| 热久久视久久精品18亚洲精品| 亚洲综合在线播放| 一区二区福利视频| 日韩影视在线观看| 亚洲香蕉av在线一区二区三区| 日韩**中文字幕毛片| 91精品国产九九九久久久亚洲| 欧美伊久线香蕉线新在线| 亚洲欧美国产制服动漫| 一区二区三区回区在观看免费视频| 2020欧美日韩在线视频| 国产美女91呻吟求| 亚洲欧美日韩爽爽影院| 国产精品入口免费视频一| 日韩美女在线播放| 最好看的2019的中文字幕视频| 国产亚洲欧美日韩一区二区| 欧美午夜视频一区二区| 亚洲精品日韩久久久| 国产91久久婷婷一区二区| 久久不射电影网| 亚洲成年人影院在线| 538国产精品一区二区在线| 精品福利在线视频| 亚洲jizzjizz日本少妇| 欧美黑人一区二区三区| 亚洲色在线视频| 久久久久久久一| 国产在线一区二区三区| 亚洲国产一区二区三区在线观看| 91视频免费网站| 成人激情av在线| 亚洲字幕在线观看| 亚洲电影在线观看| 亚洲自拍小视频免费观看| 欧美做爰性生交视频| 中文字幕不卡在线视频极品| 国产欧美欧洲在线观看| 国产精品美女免费| 亚洲色在线视频| 国产免费一区二区三区香蕉精| 久久色在线播放| 欧美国产一区二区三区| 韩国国内大量揄拍精品视频| 国产精品永久免费在线| 日韩中文在线观看| 欧美激情视频网| 另类美女黄大片| 精品视频久久久久久| 精品五月天久久| 欧美性猛交xxxxx免费看| 精品国产欧美成人夜夜嗨| 欧美激情久久久久久| 久久久久久久一区二区三区| 日韩在线免费视频观看| 97超级碰碰人国产在线观看| 国产精品免费一区豆花| 亚洲精品久久7777777| 亚洲人成网站777色婷婷| 2020久久国产精品| 国产日韩专区在线| 91九色国产视频| 国产精品高清免费在线观看| 日韩欧美高清在线视频| 91在线精品播放| 久久精视频免费在线久久完整在线看| 国产精品专区h在线观看| 日韩免费观看在线观看| 亚洲天天在线日亚洲洲精| 午夜精品www| 欧美华人在线视频| 国产精品爱久久久久久久| 91免费福利视频| 色婷婷av一区二区三区在线观看| 欧美性做爰毛片| 中文字幕精品在线| 91精品国产亚洲| 欧美激情视频在线观看| 国产精品一区专区欧美日韩| 国产精品久久久久久久久久三级| 在线国产精品播放| 国产亚洲欧洲高清| 成人午夜一级二级三级| 日韩三级影视基地| 亚洲欧美精品中文字幕在线| 亚洲国产精彩中文乱码av| 国内精品久久久久影院 日本资源| 久久精品国产欧美激情| 亚洲精品99久久久久| 国产精品久久91| 国产裸体写真av一区二区| 日韩精品视频免费| 成人激情视频在线观看| 亚洲日本成人女熟在线观看| 日韩视频在线免费观看| 深夜精品寂寞黄网站在线观看| 91精品中文在线| 在线观看日韩欧美| 欧美性xxxxx极品| 国产精品美女网站| 亚洲一区二区三区在线免费观看| 久久久伊人日本| 国产成人福利视频| 日本高清不卡的在线| www.亚洲免费视频| 91精品国产高清久久久久久| 91成人在线播放| 亲爱的老师9免费观看全集电视剧| 黑人巨大精品欧美一区二区一视频| 国产在线久久久| 国a精品视频大全| 日韩在线播放视频| 91香蕉亚洲精品| 欧美与黑人午夜性猛交久久久| 美女av一区二区三区| 亚洲影院色在线观看免费| 欧美一级片一区| 欧美日韩另类在线| 久久夜色精品国产亚洲aⅴ| 欧美成人久久久| 久热国产精品视频| 日韩av影片在线观看| 国产精品电影久久久久电影网|