亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

講解Python的Scrapy爬蟲框架使用代理進行采集的方法

2020-01-04 17:44:54
字體:
來源:轉載
供稿:網友
這篇文章主要介紹了講解Python的Scrapy爬蟲框架使用代理進行采集的方法,并介紹了隨機使用預先設好的user-agent來進行爬取的用法,需要的朋友可以參考下
 

1.在Scrapy工程下新建“middlewares.py”

# Importing base64 library because we'll need it ONLY in case if the proxy we are going to use requires authenticationimport base64# Start your middleware classclass ProxyMiddleware(object): # overwrite process request def process_request(self, request, spider):  # Set the location of the proxy  request.meta['proxy'] = "http://YOUR_PROXY_IP:PORT"  # Use the following lines if your proxy requires authentication  proxy_user_pass = "USERNAME:PASSWORD"  # setup basic authentication for the proxy  encoded_user_pass = base64.encodestring(proxy_user_pass)  request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass

2.在項目配置文件里(./project_name/settings.py)添加

DOWNLOADER_MIDDLEWARES = { 'scrapy.contrib.downloadermiddleware.httpproxy.HttpProxyMiddleware': 110, 'project_name.middlewares.ProxyMiddleware': 100,}

只要兩步,現在請求就是通過代理的了。測試一下^_^

from scrapy.spider import BaseSpiderfrom scrapy.contrib.spiders import CrawlSpider, Rulefrom scrapy.http import Requestclass TestSpider(CrawlSpider): name = "test" domain_name = "whatismyip.com" # The following url is subject to change, you can get the last updated one from here : # http://www.whatismyip.com/faq/automation.asp start_urls = ["http://xujian.info"] def parse(self, response):  open('test.html', 'wb').write(response.body)

3.使用隨機user-agent

默認情況下scrapy采集時只能使用一種user-agent,這樣容易被網站屏蔽,下面的代碼可以從預先定義的user- agent的列表中隨機選擇一個來采集不同的頁面

在settings.py中添加以下代碼

DOWNLOADER_MIDDLEWARES = {  'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware' : None,  'Crawler.comm.rotate_useragent.RotateUserAgentMiddleware' :400 }

注意: Crawler; 是你項目的名字 ,通過它是一個目錄的名稱 下面是蜘蛛的代碼

#!/usr/bin/python#-*-coding:utf-8-*-import randomfrom scrapy.contrib.downloadermiddleware.useragent import UserAgentMiddlewareclass RotateUserAgentMiddleware(UserAgentMiddleware): def __init__(self, user_agent=''):  self.user_agent = user_agent def process_request(self, request, spider):  #這句話用于隨機選擇user-agent  ua = random.choice(self.user_agent_list)  if ua:   request.headers.setdefault('User-Agent', ua) #the default user_agent_list composes chrome,I E,firefox,Mozilla,opera,netscape #for more user agent strings,you can find it in http://www.useragentstring.com/pages/useragentstring.php user_agent_list = [/  "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"/  "Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11",/  "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6",/  "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6 (KHTML, like Gecko) Chrome/20.0.1090.0 Safari/536.6",/  "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/19.77.34.5 Safari/537.1",/  "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5",/  "Mozilla/5.0 (Windows NT 6.0) AppleWebKit/536.5 (KHTML, like Gecko) Chrome/19.0.1084.36 Safari/536.5",/  "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",/  "Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",/  "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3",/  "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3",/  "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3",/  "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",/  "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",/  "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3",/  "Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3 (KHTML, like Gecko) Chrome/19.0.1061.0 Safari/536.3",/  "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24",/  "Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24 (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24"  ]

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
国产一区二区成人| 91精品国产综合久久香蕉922| 欧美老妇交乱视频| 亚洲人成电影网站色…| 欧美片一区二区三区| 日韩欧美亚洲范冰冰与中字| 精品日韩视频在线观看| 2024亚洲男人天堂| 国产精品久久在线观看| 国产激情综合五月久久| 国产精品久久久久久久久久久久久久| 日韩精品视频免费在线观看| 日韩中文字幕国产精品| 国产亚洲一级高清| 欧美日韩国产中文精品字幕自在自线| 91久久夜色精品国产网站| 欧美精品久久久久久久免费观看| 国产精品99久久久久久人| 亚洲国产精品大全| 亚洲免费av网址| 久久在线视频在线| 久久琪琪电影院| 亚洲男人天堂手机在线| 中文字幕日韩高清| 亚洲最新视频在线| 91在线视频九色| 午夜精品99久久免费| 日韩高清不卡av| 久久久亚洲影院| 日韩国产欧美精品在线| 日韩电影中文字幕av| 裸体女人亚洲精品一区| 在线看福利67194| 久久91亚洲精品中文字幕| 亚洲女人被黑人巨大进入al| 中文字幕精品网| 国内精品伊人久久| 亚洲精品久久在线| 97视频免费观看| 久久久精品国产一区二区| 欧洲亚洲妇女av| 亚洲精品国产精品国自产观看浪潮| 国产精品成人av性教育| 亚洲天堂网站在线观看视频| 日韩欧美第一页| 欧美激情在线狂野欧美精品| 国内伊人久久久久久网站视频| 97在线精品国自产拍中文| 欧美福利小视频| 亚洲国产成人一区| 中文字幕久热精品视频在线| 亚洲成人性视频| 欧亚精品中文字幕| 亚洲综合社区网| 成人国产在线视频| 久久av.com| 亚洲欧美日韩国产中文专区| 久久久久久网站| 国产精品igao视频| 国产精品一区=区| 色偷偷88888欧美精品久久久| 亚洲欧美日韩中文在线制服| 国产亚洲视频在线观看| 亚洲一区亚洲二区| 91美女高潮出水| 欧美最猛性xxxxx(亚洲精品)| 午夜精品久久久久久久久久久久久| 91精品久久久久久久久久另类| 97视频免费观看| 日韩成人av在线| 国产精品视频公开费视频| 国产精品网站入口| 亚洲综合视频1区| 国产99久久精品一区二区| 久久天天躁日日躁| 久久成人免费视频| 欧美老肥婆性猛交视频| 国内精品在线一区| 亚洲人成免费电影| 欧美一级电影免费在线观看| 国产一区二区av| 55夜色66夜色国产精品视频| 亚洲日韩中文字幕在线播放| 欧美精品在线第一页| 亚洲美女免费精品视频在线观看| 姬川优奈aav一区二区| 国产日韩精品在线| 亚洲精选中文字幕| 欧美wwwwww| 疯狂做受xxxx高潮欧美日本| 久久6免费高清热精品| 亚洲人成网站999久久久综合| 亚洲一区中文字幕| 成人黄色免费片| 国产日韩欧美综合| 欧美xxxx做受欧美.88| 久久精视频免费在线久久完整在线看| 国产成人精彩在线视频九色| 亚洲一区二区三区视频| 欧美电影免费在线观看| 久久视频在线播放| 欧美国产一区二区三区| 日韩欧美亚洲一二三区| 国产日韩欧美视频在线| 国产精品一区二区三区在线播放| 欧美日韩美女视频| 97精品国产aⅴ7777| 日韩欧美高清视频| 中文字幕免费国产精品| 亚洲va国产va天堂va久久| 精品久久久久国产| 日韩大片在线观看视频| 中文字幕精品www乱入免费视频| 久久艳片www.17c.com| 日韩中文有码在线视频| 91亚洲永久免费精品| 亚洲深夜福利网站| 国产黑人绿帽在线第一区| 色狠狠久久aa北条麻妃| 日韩av在线不卡| 美日韩精品免费观看视频| 精品国产乱码久久久久酒店| 精品国偷自产在线视频99| 欧美xxxx综合视频| 亚洲aⅴ日韩av电影在线观看| 亚洲护士老师的毛茸茸最新章节| 欧美性色视频在线| 亚洲男人av电影| 国产97人人超碰caoprom| 久久久91精品国产一区不卡| 综合av色偷偷网| 国产91色在线播放| 国产大片精品免费永久看nba| 日韩精品一区二区三区第95| 欧日韩在线观看| 欧美一级bbbbb性bbbb喷潮片| 日本欧美一级片| 国产成人+综合亚洲+天堂| 国产一区二区三区在线免费观看| 亚洲社区在线观看| 日本免费在线精品| 日韩亚洲在线观看| 精品国产精品自拍| 日韩成人免费视频| 亚洲女人被黑人巨大进入| 精品国产欧美成人夜夜嗨| 国产精品一区专区欧美日韩| 深夜福利国产精品| 成人激情视频在线观看| 国产午夜精品一区理论片飘花| 日韩中文字幕精品视频| 欧美日韩国产成人| 中文字幕自拍vr一区二区三区| 欧美主播福利视频| 理论片在线不卡免费观看| 中日韩美女免费视频网站在线观看| 国产精品久久久久久久久久东京| 欧美日韩色婷婷| 久久久久久网站| 久久精品国产清自在天天线| 欧美日韩中文字幕| 亚洲精品一区二区三区不| 国产午夜精品视频免费不卡69堂| 久久成人精品一区二区三区|