亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Python > 正文

Python中使用urllib2模塊編寫爬蟲的簡單上手示例

2020-01-04 17:49:17
字體:
來源:轉載
供稿:網友
這篇文章主要介紹了Python中使用urllib2模塊編寫爬蟲的簡單上手示例,文中還介紹到了相關異常處理功能的添加,需要的朋友可以參考下
 

提起python做網絡爬蟲就不得不說到強大的組件urllib2。在python中正是使用urllib2這個組件來抓取網頁的。urllib2是Python的一個獲取URLs(Uniform Resource Locators)的組件。它以urlopen函數的形式提供了一個非常簡單的接口。通過下面的代碼簡單感受一下urllib2的功能;

import urllib2 response = urllib2.urlopen('http://www.baidu.com/') html = response.read() print html

運行結果如下;

Python中使用urllib2模塊編寫爬蟲的簡單上手示例

查看http://www.baidu.com/源代碼發現跟以上運行結果完全一樣。這里的URL除了http:還可以是ftp:或file:
urllib2用一個Request對象來映射提出的HTTP請求。你可以創建一個Request對象,通過調用urlopen并傳入Request對象,將返回一個相關請求response對象,這個應答對象如同一個文件對象,所以你可以在Response中調用.read()。修改代碼如下;

import urllib2 req = urllib2.Request('http://www.baidu.com') response = urllib2.urlopen(req) page = response.read() print page

發現運行結果跟修改前一樣。同時在http請求前你還需要做以下事1、發送表單數據。2、設置headers信息。
1、發送表單數據;常見于模擬登錄時,一般的在登錄操作時需要發送數據到服務器。這里主要用到post方法,一般的HTML表單,data需要編碼成標準形式。然后做為data參數傳到Request對象。編碼工作使用urllib的函數而非urllib2。測試代碼如下

import urllib import urllib2  url = 'http://www.server.com/register.php'  postData = {'useid' : 'user',    'pwd' : '***',    'language' : 'Python' }  data = urllib.urlencode(postData) # 編碼工作 req = urllib2.Request(url, data) # 發送請求同時傳data response = urllib2.urlopen(req) #接受反饋的信息 page = response.read() #讀取反饋的內容

同時urllib2還可以使用get方法傳送數據。代碼如下;

import urllib2 import urllib  data = {}  data['useid'] = 'user' data['pwd'] = '***' data['language'] = 'Python'  values = urllib.urlencode(data) print values  name=Somebody+Here&language=Python&location=Northampton url = 'http://www.example.com/example.php' full_url = url + '?' + url_values  data = urllib2.open(full_url)

2、設置headers信息;有些站點對訪問來源做了限制,所以這里模擬User-Agent頭,代碼如下;

import urllib import urllib2  url = 'http://www.server.com/register.php'  user_agent = 'Mozilla/5.0 (Windows NT 6.1; rv:33.0) Gecko/20100101 Firefox/33.0' values = {'useid' : 'user',    'pwd' : '***',    'language' : 'Python' }  headers = { 'User-Agent' : user_agent } data = urllib.urlencode(values) req = urllib2.Request(url, data, headers) response = urllib2.urlopen(req) page = response.read()

urllib2就介紹到這里啦!

異常處理
通常URLError在沒有網絡連接時或者服務器地址不可達時產生,在這種情況下異常會帶有resaon屬性包含了錯誤號和錯誤信息。如下代碼測試效果;

import urllib import urllib2  url = 'http://www.server.com/register.php'  user_agent = 'Mozilla/5.0 (Windows NT 6.1; rv:33.0) Gecko/20100101 Firefox/33.0' values = {'useid' : 'user',    'pwd' : '***',    'language' : 'Python' }  headers = { 'User-Agent' : user_agent } data = urllib.urlencode(values) req = urllib2.Request(url, data, headers) response = urllib2.urlopen(req) page = response.read()

Python中使用urllib2模塊編寫爬蟲的簡單上手示例

查閱相關資料后顯示Errno 10061表示服務器端主動拒絕。
除此之外還有HTTPError,當客戶端與服務器之間建立正常連接時,urllib2將開始處理相關數據。如果遇到不能處理的情況就會產生相應的HTTPError,如網站訪問常見的錯誤碼”404″(頁面無法找到),”403″(請求禁止),和”401″(帶驗證請求)等……HTTP狀態碼表示HTTP協議的響應情況,常見的狀態碼見HTTP狀態碼詳解。
HTTPError會帶有一個'code'屬性,是服務器發送的錯誤號。當一個HTTPError產生后服務器會返回一個相關的錯誤號和錯誤頁面。如下代碼驗證;

import urllib2  req = urllib2.Request('http://www.python.org/callmewhy')  try:  urllib2.urlopen(req)  except urllib2.URLError, e:   print e.code 

Python中使用urllib2模塊編寫爬蟲的簡單上手示例

輸出404代碼,說明找不到頁面。
捕捉異常并處理……實現代碼如下;

 

#-*- coding:utf-8 -*-from urllib2 import Request, urlopen, URLError, HTTPError req = Request('http://www.python.org/callmewhy') try:   response = urlopen(req)  except URLError, e:   if hasattr(e, 'code'):    print '服務器不能正常響應這個請求!'    print 'Error code: ', e.code   elif hasattr(e, 'reason'):    print '無法與服務器建立連接'    print 'Reason: ', e.reason   else:   print '沒有出現異常'

Python中使用urllib2模塊編寫爬蟲的簡單上手示例

成功捕捉到異常!


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
国产精品96久久久久久又黄又硬| 亚洲欧美国产精品专区久久| 亚洲电影免费观看高清完整版在线观看| www国产精品com| 久久视频在线观看免费| 91豆花精品一区| 性色av一区二区三区在线观看| 日韩在线播放一区| 国产在线视频一区| 日韩小视频在线| 日韩精品在线私人| 欧美一级视频在线观看| 欧美性资源免费| 久久精品久久久久电影| 欧美视频在线观看免费| 亚洲精品久久久久| 欧美性猛交xxxx乱大交| 日韩视频在线免费观看| 日韩免费av片在线观看| 久久久最新网址| 国产精品日韩欧美综合| 国产中文字幕亚洲| 欧美性猛交xxxxx免费看| 欧美激情国产高清| 午夜精品免费视频| 国产精品小说在线| 欧美精品videosex性欧美| 91视频国产高清| 日韩欧美有码在线| 久久免费在线观看| 亚洲精品久久久久久久久久久久| 国产一区二区三区在线播放免费观看| 精品偷拍各种wc美女嘘嘘| 亚洲美女av在线播放| 亚洲一区二区精品| 国产成人精品av| 中文字幕国产亚洲| 精品中文字幕在线| 日韩在线免费视频| 亚洲成人网在线| 国产精品专区h在线观看| 91福利视频在线观看| 欧美久久精品午夜青青大伊人| 久久久成人的性感天堂| 日韩性xxxx爱| 亚洲精品在线91| 欧美午夜视频一区二区| 久久久综合av| 亚洲热线99精品视频| 亚洲精品福利在线| 黑人巨大精品欧美一区二区| 日韩精品小视频| 久久久人成影片一区二区三区观看| 伊人久久男人天堂| 91九色单男在线观看| 亚洲成人黄色在线观看| 91色琪琪电影亚洲精品久久| 亚洲自拍av在线| 日韩专区中文字幕| 欧美性猛交xxxx免费看漫画| 国产欧美欧洲在线观看| 日韩在线一区二区三区免费视频| 亚洲欧美日韩精品久久亚洲区| 国产91精品网站| 日韩中文字幕国产| 国产精品入口夜色视频大尺度| 国产精品一区专区欧美日韩| 中文精品99久久国产香蕉| 中文字幕自拍vr一区二区三区| 激情久久av一区av二区av三区| 成人黄色在线免费| 欧美美最猛性xxxxxx| 亚洲美女av网站| 亚洲激情在线观看视频免费| 欧美在线免费视频| 国语自产精品视频在线看一大j8| 国产99久久久欧美黑人| 精品国产一区二区三区四区在线观看| 亚洲电影中文字幕| 琪琪亚洲精品午夜在线| 91久久国产综合久久91精品网站| 欧美一级大片在线免费观看| 国产视频精品va久久久久久| 久久影院资源网| 91精品久久久久久| 亚洲国产高清高潮精品美女| 亚洲欧美激情精品一区二区| 欧美大片免费看| 欧美成年人在线观看| 欧美乱大交xxxxx| 一区二区三区回区在观看免费视频| 欧美日韩国产精品一区| 57pao成人永久免费视频| 中文字幕欧美国内| 国产日韩欧美黄色| 欧美最猛性xxxxx亚洲精品| 国产97人人超碰caoprom| 久热精品视频在线免费观看| 欧美主播福利视频| 97视频在线观看网址| 全色精品综合影院| 亚洲精品福利资源站| 精品一区二区三区电影| 97国产在线视频| 91av在线免费观看| 亚洲精品欧美日韩| 亚洲美女又黄又爽在线观看| 国产午夜精品一区理论片飘花| 欧美猛交免费看| 欧美一级成年大片在线观看| 国产精品电影网| 美女av一区二区| www.美女亚洲精品| 日韩高清免费在线| 亚洲乱码一区二区| 亚洲精品久久久一区二区三区| 宅男66日本亚洲欧美视频| 欧美国产日产韩国视频| 亚洲国产日韩精品在线| 亚洲成年人在线播放| 国产精品678| 2023亚洲男人天堂| 亚洲黄色在线看| 黄色成人av在线| 一区二区av在线| 欧美日韩国产中字| 国产啪精品视频| 欧美自拍视频在线| 海角国产乱辈乱精品视频| 亚洲精品xxx| 欧美激情一区二区三区在线视频观看| 精品一区二区三区四区| 亚洲精品中文字幕女同| 成人网中文字幕| 亚洲aⅴ男人的天堂在线观看| 成人做爰www免费看视频网站| 成人欧美在线观看| 成人免费自拍视频| 久热精品视频在线观看一区| 久久99久久99精品中文字幕| 日韩电影大片中文字幕| 久久九九有精品国产23| 国产精品第8页| 国产日韩欧美一二三区| 久久中文字幕在线视频| 久久精品国产欧美亚洲人人爽| 人人澡人人澡人人看欧美| 亚洲欧美中文字幕在线一区| 精品国偷自产在线视频| 91国内揄拍国内精品对白| 国产成人黄色av| 中文字幕欧美精品在线| 国产精品欧美一区二区三区奶水| 日韩av网址在线| 日本aⅴ大伊香蕉精品视频| 超在线视频97| 欧美另类极品videosbest最新版本| 欧美激情一区二区三区久久久| 国产精品欧美在线| 久久久久久国产精品美女| 永久免费精品影视网站| 亚洲男人天堂网站| 中文字幕在线亚洲| 国产欧美一区二区三区视频|