亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

python實現爬取千萬淘寶商品的方_法

2019-11-02 14:15:26
字體:
來源:轉載
供稿:網友

   本文實例講述了python實現爬取千萬淘寶商品的方法。分享給大家供大家參考。具體實現方法如下:

  ?

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 import time import leveldb from urllib.parse import quote_plus import re import json import itertools import sys import requests from queue import Queue from threading import Thread URL_BASE = 'http://s.m.taobao.com/search?q={}&n=200&m=api4h5&style=list&page={}' def url_get(url): # print('GET ' + url) header = dict() header['Accept'] = 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8' header['Accept-Encoding'] = 'gzip,deflate,sdch' header['Accept-Language'] = 'en-US,en;q=0.8'
五個字網名[www.la240.com/html2017/1/10/]
header['Connection'] = 'keep-alive' header['DNT'] = '1' #header['User-Agent'] = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/28.0.1500.71 Safari/537.36' header['User-Agent'] = 'Mozilla/12.0 (compatible; MSIE 8.0; Windows NT)' return requests.get(url, timeout = 5, headers = header).text def item_thread(cate_queue, db_cate, db_item): while True: try: cate = cate_queue.get() post_exist = True try: state = db_cate.Get(cate.encode('utf-8')) if state != b'OK': post_exist = False except: post_exist = False if post_exist == True: print('cate-{}: {} already exists ... Ignore'.format(cate, title)) continue db_cate.Put(cate.encode('utf-8'), b'crawling') for item_page in itertools.count(1): url = URL_BASE.format(quote_plus(cate), item_page) for tr in range(5): try: items_obj = json.loads(url_get(url)) break except KeyboardInterrupt: quit() except Exception as e: if tr == 4: raise e if len(items_obj['listItem']) == 0: break for item in items_obj['listItem']: item_obj = dict( _id = int(item['itemNumId']), name = item['name'], price = float(item['price']), query = cate, category = int(item['category']) if item['category'] != '' else 0, nick = item['nick'], area = item['area']) db_item.Put(str(item_obj['_id']).encode('utf-8'), json.dumps(item_obj, ensure_ascii = False).encode('utf-8')) print('Get {} items from {}: {}'.format(len(items_obj['listItem']), cate, item_page)) if 'nav' in items_obj: for na in items_obj['nav']['navCatList']: try: db_cate.Get(na['name'].encode('utf-8')) except: db_cate.Put(na['name'].encode('utf-8'), b'waiting') db_cate.Put(cate.encode('utf-8'), b'OK') print(cate, 'OK') except KeyboardInterrupt: break except Exception as e: print('An {} exception occured'.format(e)) def cate_thread(cate_queue, db_cate): while True: try: for key, value in db_cate.RangeIter(): if value != b'OK': print('CateThread: put {} into queue'.format(key.decode('utf-8'))) cate_queue.put(key.decode('utf-8')) time.sleep(10) except KeyboardInterrupt: break except Exception as e: print('CateThread: {}'.format(e)) if __name__ == '__main__': db_cate = leveldb.LevelDB('./taobao-cate') db_item = leveldb.LevelDB('./taobao-item') orig_cate = '正裝' try: db_cate.Get(orig_cate.encode('utf-8')) except: db_cate.Put(orig_cate.encode('utf-8'), b'waiting') cate_queue = Queue(maxsize = 1000) cate_th = Thread(target = cate_thread, args = (cate_queue, db_cate)) cate_th.start() item_th = [Thread(target = item_thread, args = (cate_queue, db_cate, db_item)) for _ in range(5)] for item_t in item_th: item_t.start() cate_th.join()
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
欧美老女人在线视频| 波霸ol色综合久久| 91欧美激情另类亚洲| 17婷婷久久www| 久久精品国产精品亚洲| 欧美一乱一性一交一视频| 68精品国产免费久久久久久婷婷| 九色精品免费永久在线| 黄色成人在线免费| 搡老女人一区二区三区视频tv| 中文字幕日韩精品在线| 国产精品国产三级国产专播精品人| 国产成人亚洲综合青青| 国产精品成人av在线| 久99九色视频在线观看| 国内精品久久久久影院优| 91亚洲精品久久久久久久久久久久| 日韩欧美在线观看| 亚洲欧洲在线免费| 日韩av在线一区| 不卡av在线网站| 国产精品你懂得| 久久久精品电影| 欧美亚洲视频一区二区| 亚洲激情在线观看视频免费| 久久久精品2019中文字幕神马| 国产精品久久久久不卡| 久久精品国产亚洲| 在线国产精品视频| 亚洲性生活视频在线观看| 日韩精品一区二区视频| 91精品久久久久久综合乱菊| 亚洲a在线播放| 国产精品成人一区二区| 欧美www视频在线观看| 亚洲第一网站男人都懂| 97视频在线观看播放| www亚洲欧美| 欧美大片va欧美在线播放| 日韩电影大片中文字幕| 黄色一区二区三区| 日韩av电影免费观看高清| 一区二区三区在线播放欧美| 亚洲精品国产精品乱码不99按摩| 5278欧美一区二区三区| 日韩在线观看免费全集电视剧网站| 亚洲xxxx在线| 性夜试看影院91社区| 日韩一区二区精品视频| 久久久久久中文| 亚洲成人在线网| 一本色道久久综合狠狠躁篇怎么玩| 亚洲成人精品久久| 在线观看国产精品日韩av| 国产精品亚洲片夜色在线| 久久91亚洲精品中文字幕| 亚洲第一福利网| 精品香蕉在线观看视频一| 福利精品视频在线| 亚洲国产精品va| 亚洲男人天天操| 亚洲精品一区在线观看香蕉| 欧美在线激情视频| 亚洲精品一区二区三区婷婷月| 久久久久久久久久久av| 欧美性做爰毛片| 亚洲高清久久久久久| www.99久久热国产日韩欧美.com| 日韩中文字幕免费看| 久久视频免费在线播放| 国产精品2018| 亚洲国产精彩中文乱码av在线播放| 久久久97精品| 日韩精品在线观看一区| 国产精品老女人精品视频| 欧美精品18videosex性欧美| 91精品啪在线观看麻豆免费| 欧美日韩国产中文字幕| 亚洲一区二区三区xxx视频| 精品无人区乱码1区2区3区在线| 国产色婷婷国产综合在线理论片a| 亚洲开心激情网| 97成人超碰免| 国产精品va在线播放我和闺蜜| 懂色av中文一区二区三区天美| 国产激情综合五月久久| 亚洲大胆人体在线| 久久亚洲精品毛片| 亚洲第一网站免费视频| 欧美高清在线视频观看不卡| 日本免费久久高清视频| 色偷偷av亚洲男人的天堂| 国产精品一区二区三区久久| 九九热这里只有精品6| 日韩精品在线观| 国产在线精品成人一区二区三区| 日韩不卡中文字幕| 自拍偷拍免费精品| 欧美日韩在线视频一区二区| 亚洲国产古装精品网站| 日韩综合中文字幕| 久久精品人人做人人爽| 欧美成人免费一级人片100| 亚洲v日韩v综合v精品v| 久久久久久久久久av| 欧美日韩国产精品一区二区不卡中文| 综合网日日天干夜夜久久| 色香阁99久久精品久久久| 国内精品美女av在线播放| 国产成人精品一区二区在线| 久久婷婷国产麻豆91天堂| 精品少妇v888av| 91网站在线看| 亚洲天堂2020| 国产在线播放91| 国产一区二区日韩精品欧美精品| 91黄色8090| 亚洲欧洲在线观看| 亚洲国产精品成人av| 日韩精品电影网| 国产精品精品一区二区三区午夜版| 国产成人亚洲综合91精品| 亚洲欧美自拍一区| 国产欧美亚洲精品| 91久久久久久久一区二区| 亚洲国产精品资源| 日韩欧美国产网站| 亚洲性线免费观看视频成熟| 欧美在线视频一二三| 国产欧美久久久久久| 欧美激情一区二区三区成人| 欧美成人性生活| 中文字幕亚洲自拍| 国产精品久久久久久久久久久新郎| 狠狠久久亚洲欧美专区| 亚洲精品自拍偷拍| 91av视频在线观看| 热99精品只有里视频精品| 4444欧美成人kkkk| 5566日本婷婷色中文字幕97| 97热精品视频官网| 欧洲精品久久久| 国产精品久久久久aaaa九色| 亚洲电影中文字幕| 欧美色道久久88综合亚洲精品| 青青久久av北条麻妃黑人| 欧美高清无遮挡| 欧美激情在线观看| 亚洲福利在线播放| 午夜精品久久久久久久男人的天堂| 日韩视频在线观看免费| 91精品久久久久久| 国产精品欧美激情| 中文字幕v亚洲ⅴv天堂| 国产精品丝袜久久久久久高清| 亚洲欧美国产一本综合首页| 热草久综合在线| 国产精品久久久久久久久久小说| 亚洲男人的天堂在线| 国产精品久久久久久中文字| 欧美超级乱淫片喷水| 欧美激情日韩图片| 亚洲欧洲一区二区三区在线观看| 久久伊人色综合|