亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

使用python采集腳本之家電子書資源并自動下載到本地的實例腳本

2020-02-15 23:21:16
字體:
供稿:網(wǎng)友

jb51上面的資源還比較全,就準(zhǔn)備用python來實現(xiàn)自動采集信息,與下載啦。

Python具有豐富和強大的庫,使用urllib,re等就可以輕松開發(fā)出一個網(wǎng)絡(luò)信息采集器!

下面,是我寫的一個實例腳本,用來采集某技術(shù)網(wǎng)站的特定欄目的所有電子書資源,并下載到本地保存!

軟件運行截圖如下:

在腳本運行時期,不但會打印出信息到shell窗口,還會保存日志到txt文件,記錄采集到的頁面地址,書籍的名稱,大小,服務(wù)器本地下載地址以及百度網(wǎng)盤的下載地址!

實例采集并下載武林站長站的python欄目電子書資源:

# -*- coding:utf-8 -*-import reimport urllib2import urllibimport sysimport osreload(sys)sys.setdefaultencoding('utf-8')def getHtml(url): request = urllib2.Request(url) page = urllib2.urlopen(request) htmlcontent = page.read() #解決中文亂碼問題 htmlcontent = htmlcontent.decode('gbk', 'ignore').encode("utf8",'ignore') return htmlcontentdef report(count, blockSize, totalSize): percent = int(count*blockSize*100/totalSize) sys.stdout.write("r%d%%" % percent + ' complete') sys.stdout.flush()def getBookInfo(url): htmlcontent = getHtml(url); #print "htmlcontent=",htmlcontent; # you should see the ouput html #<h1 class="h1user">crifan</h1> regex_title = '<h1s+?itemprop="name">(?P<title>.+?)</h1>'; title = re.search(regex_title, htmlcontent); if(title): title = title.group("title"); print "書籍名字:",title; file_object.write('書籍名字:'+title+'r'); #<li>書籍大?。?lt;span itemprop="fileSize">27.2MB</span></li> filesize = re.search('<spans+?itemprop="fileSize">(?P<filesize>.+?)</span>', htmlcontent); if(filesize): filesize = filesize.group("filesize"); print "文件大小:",filesize; file_object.write('文件大小:'+filesize+'r'); #<div class="picthumb"><a  target="_blank" bookimg = re.search('<divs+?class="picthumb"><a href="(?P<bookimg>.+?)" rel="external nofollow" target="_blank"', htmlcontent); if(bookimg): bookimg = bookimg.group("bookimg"); print "封面圖片:",bookimg; file_object.write('封面圖片:'+bookimg+'r'); #<li><a  target="_blank">酷云中國電信下載</a></li> downurl1 = re.search('<li><a href="(?P<downurl1>.+?)" rel="external nofollow" target="_blank">酷云中國電信下載</a></li>', htmlcontent); if(downurl1): downurl1 = downurl1.group("downurl1"); print "下載地址1:",downurl1;  file_object.write('下載地址1:'+downurl1+'r'); sys.stdout.write('rFetching ' + title + '...n') title = title.replace(' ', ''); title = title.replace('/', ''); saveFile = '/Users/superl/Desktop/pythonbook/'+title+'.rar'; if os.path.exists(saveFile): print "該文件已經(jīng)下載了!"; else: urllib.urlretrieve(downurl1, saveFile, reporthook=report); sys.stdout.write("rDownload complete, saved as %s" % (saveFile) + 'nn') sys.stdout.flush() file_object.write('文件下載成功!r'); else: print "下載地址1不存在"; file_error.write(url+'r'); file_error.write(title+"下載地址1不存在!文件沒有自動下載!r"); file_error.write('r'); #<li><a  rel="external nofollow" target="_blank">百度網(wǎng)盤下載2</a></li> downurl2 = re.search('</a></li><li><a href="(?P<downurl2>.+?)" rel="external nofollow" target="_blank">百度網(wǎng)盤下載2</a></li>', htmlcontent); if(downurl2): downurl2 = downurl2.group("downurl2"); print "下載地址2:",downurl2;  file_object.write('下載地址2:'+downurl2+'r'); else: #file_error.write(url+'r'); print "下載地址2不存在";  file_error.write(title+"下載地址2不存在r"); file_error.write('r'); file_object.write('r'); print "n";def getBooksUrl(url): htmlcontent = getHtml(url); #<ul class="cur-cat-list"><a href="/books/438381.html" rel="external nofollow" class="tit"</ul></div><!--end #content --> urls = re.findall('<a href="(?P<urls>.+?)" rel="external nofollow" class="tit"', htmlcontent); for url in urls: url = "http://www.jb51.net"+url; print url+"n"; file_object.write(url+'r'); getBookInfo(url) #print "url->", urlif __name__=="__main__": file_object = open('/Users/superl/Desktop/python.txt','w+'); file_error = open('/Users/superl/Desktop/pythonerror.txt','w+'); pagenum = 3; for pagevalue in range(1,pagenum+1): listurl = "http://www.jb51.net/ books/list476_%d.html"%pagevalue; print listurl; file_object.write(listurl+'r'); getBooksUrl(listurl); file_object.close(); file_error.close();            
發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
日韩精品免费一区二区三区| 日韩欧美高清一区二区三区| 亚洲高清在线看| 亚洲精品欧美激情| 1区2区在线| 啪一啪鲁一鲁2019在线视频| 91麻豆成人久久精品二区三区| 久久亚洲一区二区三区四区五区高| 精品卡一卡卡2卡3网站| 日本视频免费高清一本18| 一本色道久久综合亚洲精品高清| 中文字幕不卡在线播放| 久草手机视频在线观看| 日本欧美一区二区在线观看| 久久久久久久性| 成人国产精品一级毛片视频| 在线视频日韩| 日本在线视频一区二区| 野花国产精品入口| 久久色精品视频| 欧美国产成人精品一区二区三区| 97在线免费视频观看| 午夜激情在线播放| 91极品美女在线| 亚洲黄色小视频在线观看| 2021最新国产精品一区| 亚洲国产午夜| 色综合天天综合在线视频| 久久一区二区三区四区五区| 日韩中文av在线| 久久99国产精品麻豆| 丝袜美腿玉足3d专区一区| 天堂av中文在线| 日本www视频| 日韩精品一区二区三区在线观看| 亚洲高清视频一区二区| 美女精品导航| 国产精品啊v在线| 一区二区国产盗摄色噜噜| 五月天激情小说综合| 亚洲免费综合| 亚洲私人黄色宅男| 美女黄a一级视频| 麻豆tv免费在线观看| 国产精品777777| 国产成a人无v码亚洲福利| 久久精品国产福利| 亚洲天堂av资源在线观看| 欧美日韩中文在线视频| 黄色小视频免费| 亚洲欧美日韩国产成人综合一二三区| 国产午夜精品视频| 超碰这里只有精品| 成人国产精品一区二区| 巨乳诱惑日韩免费av| 国产精品久久久久高潮| 日本韩国欧美一区二区三区| 成人18视频免费69| 色呦呦在线观看视频| 97视频精彩视频在线观看| 国产99久一区二区三区a片| 亚洲黄一区二区| 亚洲精品一区二区三区av| 成人看片爽爽爽| 亚洲欧美另类久久久精品2019| 成人免费在线小视频| 欧美扣逼视频| 婷婷中文字幕综合| 成人性生交免费看| 欧美日韩国产高清一区| 欧美最顶级丰满的aⅴ艳星| 国产精品电影一区| 韩国一区二区在线播放| 亚洲精品97| 国产亚洲精品久久久久久牛牛| 亚洲一级特黄毛片| 色18美女社区| 日韩高清av在线| 国产69精品久久久久9999人| 免费成人深夜夜行网站| 男人的天堂va免费视频| 91桃色在线| 麻豆免费版在线观看| 国产精品久久久久久久龚玥菲| 国产影视精品一区二区三区| 成人3d动漫在线观看| 中文字幕久热在线精品| 日韩中文字幕在线观看视频| 国产精品18久久久久网站| 日韩高清在线一区二区| 久久精子c满五个校花| 免费网站在线观看视频| 亚洲精品一区二区毛豆| 亚洲在线视频网站| 女人被狂躁到高潮视频免费网站| 最新中文字幕久久| 日本最新不卡在线| 国产精品一区久久久| 国产大尺度在线观看| 日韩精品一区二区三区不卡| 欧美在线在线| 精品一区二区三区中文字幕老牛| 爱福利视频一区| fc2ppv在线播放| 国产精选一区二区| 亚洲一区久久久| 在线观看入口黄最新永久免费国产| 久久精品在线观看视频| 欧美极品视频| 亚洲最新永久在线观看| 波多野结衣在线观看| 久草视频国产| 你懂得网站在线| 亚洲婷婷久久综合| 久久涩涩网站| 免费电影网站在线观看| 国产一区二区按摩在线观看| 影音先锋中文字幕一区二区| 欧美自拍偷拍一区二区| 免费在线黄网| 精品成人久久久| 欧美美女在线观看| 欧美一级日韩免费不卡| 成人高清在线观看免费| 国产精品精品国产| 天天爱天天做色综合| 日本精品视频在线| 亚洲成人网在线观看| 九九九久久国产免费| 日本在线视频中文有码| 国产精品视频免费播放| 午夜不卡影院| 久久99精品国产麻豆婷婷洗澡| 国产成人一区二区三区别| 激情综合网五月激情| 日本网站在线免费观看| 欧美大胆的人体xxxx| 91蝌蚪精品视频| 国产成人av在线播放| 成人午夜视频精品一区| 亚洲欧美日韩在线一区| 国产精品96久久久久久又黄又硬| 视频成人永久免费视频| 最新91在线| 欧美日韩在线视频一区二区| 毛片网站免费观看| 中文字幕网址在线| 精品视频在线导航| 欧美日韩国产精品一区| 国产不卡av在线免费观看| 久久躁狠狠躁夜夜爽| 亚洲大片一区二区三区| 蜜臀av在线播放一区二区三区| 97视频中文字幕| 女人18毛片九区毛片在线| 1024精品一区二区三区| 青青草97国产精品麻豆| 先锋影音亚洲资源| www.丝袜精品| 国产乱淫a∨片免费视频| 欧美性受xxxx黑人xxxx| 日本一本中文字幕| 亚洲涩涩在线| 国产精品试看| 欧美xxxx精品| 日韩av片免费在线观看| 日本日本19xxxⅹhd乱影响| 国产无码精品在线观看| 国产精品一区二区三区在线播放| 一本二本三本亚洲码| 日韩欧美国产一二三区| 色猫猫国产区一区二在线视频| 99九九99九九九99九他书对| 久久久久久久久久影视| 欧美知名女优| 男男做爰猛烈叫床爽爽小说| 999精品国产| 国产精品久久99久久| 亚洲制服欧美中文字幕中文字幕| 欧美一区二区三区在线观看| 国产三级短视频| 欧美久久一区| 欧美成人vr18sexvr| 成人爱爱电影网址| 7777精品伊人久久久大香线蕉| 国产精品资源网| 亚洲乱码精品久久久久..| 99久久久国产精品免费调教网站| 中文字幕一区二区人妻在线不卡| 久久久久97国产| 亚洲色图狂野欧美| 日韩av高清不卡| 国产成人jvid在线播放| 一本色道久久综合| 亚洲精品毛片一区二区三区| 美女被啪啪一区二区| 美女日批在线观看| 亚洲黄色片在线观看| 亚洲免费黄色网址| 亚洲制服欧美另类| 乱亲女秽乱长久久久| 国产树林野战在线播放| 国产一区网站| 538在线视频观看| 一本色道**综合亚洲精品蜜桃冫| 日韩av免费看| 久久av无码精品人妻系列试探| 欧美影院三区| 丁香五月缴情综合网| 久久综合入口| 国产精品99久| 在线观看老湿视频福利| 日韩成人免费| 欧美 丝袜 自拍 制服 另类| 欧美2区3区4区| 国产在线导航| 日本视频网站在线观看| 粉嫩av一区二区三区天美传媒| 丝袜美腿一区二区三区| 中文字幕久热在线精品| 欧美扣逼视频| 污网站在线看| a级大片免费看| 欧美激情自拍偷拍| 好男人中文字幕官网| 一呦二呦三呦精品国产| 精品久久久久香蕉网| 99视频国产精品免费观看a| 日韩在线观看视频一区二区| 在线看片免费人成视久网| 日韩av片在线播放| 亚洲精品久久久久久久久久久久久久| 国产成人精品久久一区二区小说| 国产同性人妖ts口直男| 精品国产欧美日韩一区二区三区| 浴室偷拍美女洗澡456在线| 国产精品1区在线| 色婷婷久久av| 精品国产免费观看| 国产日韩欧美在线看| 日本黄色免费视频| 欧美大片在线免费观看| 芬兰videosfree性少妇| frxxee中国xxx麻豆hd| 视频在线观看一区二区| 大杳蕉精品视频在线观看| 亚洲欧洲一区二区三区久久| 懂色av粉嫩av蜜臀av一区二区三区| 亚洲午夜久久久久久久国产| 久久久久亚洲av无码专区首jn| 日韩一级在线免费观看| 亚洲成人激情综合网| 久久人人爽亚洲精品天堂| 亚州一区二区| 四虎永久网址| 亚洲综合激情另类专区老铁性| 亚洲一区二区三区四区视频| 欧美日本三级| 亚洲天堂网站| 国产理论电影在线| 精品国产亚洲一区二区三区在线观看| 久久人体大胆视频| 麻豆91免费| 国产亚洲综合av| 亚洲精品乱码久久久久久自慰| 91久久偷偷做嫩草影院| 亚洲人成电影网站色mp4| 国产专区欧美专区| 精品中文字幕久久久久久| 亚洲国产成人一区| 久久国产精品波多野结衣av| 国产精品专区第二| 91精品国产高清一区二区三区蜜臀| 国产热re99久久6国产精品| 国产精品免费99久久久| 国产资源在线一区| av色男福利网| gogogo高清在线观看免费完整版| 久久五月情影视| 日本激情一区二区| www.91av| 亚洲美女少妇撒尿| av资源一区二区| 欧美成人黄色网| 亚洲国产剧情在线观看| 日韩精品欧美激情| 国产欧美综合一区二区三区| 免费av中文字幕| 91在线精品视频| 欧美va亚洲va香蕉在线| 在线午夜精品自拍| 国产一区二区三区久久久久久久久| 网友自拍区视频精品| www污污网站在线看| 91尤物视频在线观看| 亚洲天堂av线| 中文字幕久久久| 蜜桃导航-精品导航| 成人高清一区| 精品免费二区三区三区高中清不卡| 俄罗斯嫩小性bbwbbw| 国产一级片免费观看| 久久中文字幕一区| 伊人365影院| 日韩成人免费观看| 日韩经典中文字幕| 日韩在线二区| wwwxxx色| 日本一区二区三区视频视频| 久久亚洲成人| 亚洲一本大道在线| 91成人国产综合久久精品| 亚洲另类第一页| 97久精品国产片一区二区三区| 国内精品美女av在线播放| 丁香桃色午夜亚洲一区二区三区| 天天色天天上天天操| 欧美激情一区二区三区在线视频| 捆绑紧缚一区二区三区视频| 久久久资源网| 亚洲精品视频在线观看视频| 超碰porn在线| 超碰91在线观看| 天天干天天干天天干天天干天天干| 黄色动漫在线观看| 亚洲天堂免费| 婷婷久久伊人| 国产免费av在线|