亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 數據庫 > MongoDB > 正文

python實現爬蟲數據存到 MongoDB

2020-10-29 18:48:42
字體:
來源:轉載
供稿:網友

在以上兩篇文章中已經介紹到了 Python 爬蟲和 MongoDB , 那么下面我就將爬蟲爬下來的數據存到 MongoDB 中去,首先來介紹一下我們將要爬取的網站, readfree 網站,這個網站非常的好,我們只需要每天簽到就可以免費下載三本書,良心網站,下面我就將該網站上的每日推薦書籍爬下來。

利用上面幾篇文章介紹的方法,我們很容易的就可以在網頁的源代碼中尋找到書籍的姓名和書籍作者的信息。

找到之后我們復制 XPath ,然后進行提取即可。源代碼如下所示

# coding=utf-8import reimport requestsfrom lxml import etreeimport pymongoimport sysreload(sys)sys.setdefaultencoding('utf-8')def getpages(url, total):  nowpage = int(re.search('(/d+)', url, re.S).group(1))  urls = []  for i in range(nowpage, total + 1):    link = re.sub('(/d+)', '%s' % i, url, re.S)    urls.append(link)  return urlsdef spider(url):  html = requests.get(url)  selector = etree.HTML(html.text)  book_name = selector.xpath('//*[@id="container"]/ul/li//div/div[2]/a/text()')  book_author = selector.xpath('//*[@id="container"]/ul/li//div/div[2]/div/a/text()')  saveinfo(book_name, book_author)def saveinfo(book_name, book_author):  connection = pymongo.MongoClient()  BookDB = connection.BookDB  BookTable = BookDB.books  length = len(book_name)  for i in range(0, length):    books = {}    books['name'] = str(book_name[i]).replace('/n','')    books['author'] = str(book_author[i]).replace('/n','')    BookTable.insert_one(books)if __name__ == '__main__':  url = 'http://readfree.me/shuffle/?page=1'  urls = getpages(url,3)  for each in urls:    spider(each)

注意,在寫入數據庫的過程中不要一下子將字典中的數據寫入數據庫,我一開始就這么寫的,但是我發現數據庫中只有三條信息,其他信息都不見了。所以采用一條一條的寫入。

還有源代碼的開頭部分,對默認編碼的設置一定不可以省略,否則可能會報編碼錯誤(真心感覺 Python 在編碼這方面好容易出錯,尷尬)。

有的人可能發現了,我將提取的信息轉換成了字符串,然后使用 replace() 方法將 /n 去掉了,因為我發現在提取的書籍信息前后存在換行符,看著十分礙眼。

熱情提醒一下,在程序運行的時候別忘記將你的 Mongo DB 運行起來,下來看看結果

好了,就這樣,如果發現代碼哪里存在錯誤或者說有可以改善的地方,希望留言給我,感謝。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
国产精品久久久久久中文字| 亚洲欧美制服中文字幕| 亚洲第一福利在线观看| 亚洲午夜久久久久久久| 一区二区三区 在线观看视| 欧美韩国理论所午夜片917电影| 91精品啪aⅴ在线观看国产| 日韩第一页在线| 欧美视频免费在线观看| 国产精品美女免费| 动漫精品一区二区| 国产精品美女免费| 欧美又大又粗又长| 国产成人午夜视频网址| 国产精品第一第二| 欧美日韩中文字幕| 国产99视频精品免视看7| 国产精品免费看久久久香蕉| 亚洲人永久免费| 最近2019中文字幕大全第二页| 久久精品国产91精品亚洲| 国产日韩欧美综合| 亚洲国产精品va| 最新69国产成人精品视频免费| 国产精品视频网| 国产ts人妖一区二区三区| 国产丝袜精品第一页| 这里只有精品视频| 在线观看国产精品淫| 国产成人精品视频在线观看| 性色av一区二区三区| 欧美色图在线视频| 欧美日韩高清在线观看| 国产日韩精品电影| 国产精品美女在线| 98精品国产自产在线观看| 久久久精品久久久| 久久久视频免费观看| 国产精品久久久久av| 国产视频一区在线| 亚洲欧洲在线观看| 久青草国产97香蕉在线视频| 日韩av一区在线| 日韩av快播网址| 欧美日韩国产二区| 热99久久精品| 中文字幕日韩精品有码视频| 色哟哟网站入口亚洲精品| 久久精品国产亚洲精品2020| 国产精品久久久久久亚洲影视| 国产精品1区2区在线观看| 欧美黄色免费网站| 精品亚洲精品福利线在观看| 久久人人爽人人爽人人片av高清| 在线日韩欧美视频| 久久久噜久噜久久综合| 久久精品视频中文字幕| 日韩欧美中文免费| 91豆花精品一区| 国产精品欧美一区二区三区奶水| 久久影院免费观看| 欧美日韩亚洲国产一区| 国产精品一区专区欧美日韩| 成人av电影天堂| 91亚洲精华国产精华| 国产精品入口福利| 最新69国产成人精品视频免费| 久久久久久久久亚洲| 91精品久久久久久久久久久久久| www.欧美视频| 一道本无吗dⅴd在线播放一区| 中文字幕亚洲欧美日韩高清| 91日韩在线视频| 亚洲字幕一区二区| 中文字幕一区二区精品| 91av视频在线观看| 亚洲女人天堂网| 97精品国产91久久久久久| 亚洲性69xxxbbb| 国产精品国产三级国产aⅴ9色| 亚洲尤物视频网| 国产成人啪精品视频免费网| 欧美成年人网站| 国产午夜精品视频| 久久久免费在线观看| 日韩美女激情视频| 国产精品久久婷婷六月丁香| 国产成人精品在线视频| 2025国产精品视频| 久久免费国产精品1| 国产91ⅴ在线精品免费观看| 日韩久久精品成人| 久久综合久久88| 国产裸体写真av一区二区| 91精品国产综合久久香蕉最新版| 一区二区在线视频| 色综合91久久精品中文字幕| 亚洲黄在线观看| 亚洲网站视频福利| 成人福利视频网| 欧美日韩久久久久| 日韩av色在线| 久久人人爽人人| 亚洲最大福利视频网站| 亚洲电影免费观看高清完整版| 久久伊人91精品综合网站| 日韩视频免费观看| 成人高h视频在线| 亚洲肉体裸体xxxx137| 在线播放国产一区中文字幕剧情欧美| 久久久久久国产精品三级玉女聊斋| 韩国日本不卡在线| 欧美电影《睫毛膏》| 亚洲伦理中文字幕| 日韩av日韩在线观看| 亚洲中国色老太| 国产精品视频一区二区三区四| 日韩成人网免费视频| 日韩av片免费在线观看| 91精品国产综合久久男男| 海角国产乱辈乱精品视频| 日韩av一区在线观看| 欧美激情一区二区三区高清视频| 91日本在线视频| 57pao成人永久免费视频| 91成品人片a无限观看| 精品一区二区三区三区| 色偷偷偷亚洲综合网另类| 亚洲夜晚福利在线观看| 亚洲精品在线91| 欧美情侣性视频| 91亚洲午夜在线| 色伦专区97中文字幕| 不卡伊人av在线播放| 久久久噜噜噜久久中文字免| 亚洲人成在线观| 久久久久久尹人网香蕉| 亚洲精品午夜精品| 亚洲午夜小视频| 亚洲毛片在线看| 国产伦精品免费视频| 国产精品一区二区三区久久| 久久91精品国产91久久久| 成人精品视频久久久久| 亚洲国产精品久久精品怡红院| 欧美极品xxxx| www.精品av.com| 国产午夜精品一区理论片飘花| 精品国产拍在线观看| 国产精品久久网| 欧美日韩在线影院| 中文字幕久热精品在线视频| 中文字幕精品影院| 亚洲精品国产精品乱码不99按摩| 国产精品亚洲网站| 久久精品一偷一偷国产| 亚洲毛片在线观看.| 亚州欧美日韩中文视频| 欧美一级淫片videoshd| 91九色国产社区在线观看| 国产精品7m视频| 国产一区二区视频在线观看| 亚洲欧美成人在线| 日韩亚洲在线观看|