亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 開發 > JS > 正文

淺談Node.js爬蟲之網頁請求模塊

2024-05-06 16:41:56
字體:
來源:轉載
供稿:網友

本文介紹了Node.js爬蟲之網頁請求模塊,分享給大家,具體如下:

注:如您下載最新的nodegrass版本,由于部分方法已經更新,本文的例子已經不再適應,詳細請查看開源地址中的例子。

一、為什么我要寫這樣一個模塊?

源于筆者想使用Node.js寫一個爬蟲,雖然Node.js官方API提供的請求遠程資源的方法已經非常簡便,具體參考

http://nodejs.org/api/http.html 其中對于Http的請求提供了,http.get(options, callback)和http.request(options, callback)兩個方法,

看方法便知,get方法用于get方式的請求,而request方法提供更多的參數,例如其它請求方式,請求主機的端口等等。對于Https的請求于Http類似。一個最簡單的例子:

var https = require('https');https.get('https://encrypted.google.com/', function(res) { console.log("statusCode: ", res.statusCode); console.log("headers: ", res.headers); res.on('data', function(d) {  process.stdout.write(d); });}).on('error', function(e) { console.error(e);});

對于以上代碼,我們無非就是想請求遠程主機,得到響應信息,例如響應狀態,響應頭,響應主體內容。其中get方法的第二個參數是一個回調函數,我們異步的獲取響應信息,然后,在該回調函數中,res對象又監聽data,on方法中第二個參數又是一個回調,而你得到d(你請求到的響應信息)后,很可能在對它進行操作的時候再次引入回調,一層層下去,最后就暈了。。。對于異步方式的編程,對于一些習慣同步方式寫代碼的同學是非常糾結的,當然國內外已經對此提供了一些非常優秀的同步類庫,例如老趙的Wind.js......好像有點扯遠了。其實,我們調用get最終要得到的無非就是響應信息,而不關心res.on這樣的監聽過程,因為太懶惰。不想每次都res.on('data',func),于是誕生了今天我要介紹的nodegrass。

二、nodegrass請求資源,像Jquery的$.get(url,func)

一個最簡單的例子:

var nodegrass = require('nodegrass');nodegrass.get("http://www.baidu.com",function(data,status,headers){  console.log(status);  console.log(headers);  console.log(data);},'gbk').on('error', function(e) {  console.log("Got error: " + e.message);});

咋一看,和官方原來的get沒啥區別,確實差不多=。=!只不過少了一層res.on('data',func)的事件監聽回調而已。不管你信不信,反正我看上去感覺舒服多了,第二個參數同樣是一個回調函數,其中的參數data是響應主體內容,status是響應狀態,headers是響應頭。得到響應內容,我們就可以對得到的資源提取任何我們感興趣的信息啦。當然這個例子中,只是簡單的打印的控制臺而已。第三個參數是字符編碼,目前Node.js不支持gbk,這里nodegrass內部引用了iconv-lite進行了處理,所以,如果你請求的網頁編碼是gbk的,例如百度。只需加上這個參數就行了。

那么對于https的請求呢?如果是官方api,你得引入https模塊,但是請求的get方法等和http類似,于是nodegrass順便把他們整合在一塊了。看例子:

var nodegrass = require('nodegrass');nodegrass.get("https://github.com",function(data,status,headers){  console.log(status);  console.log(headers);  console.log(data);},'utf8').on('error', function(e) {  console.log("Got error: " + e.message);});

nodegrass會根據url自動識別是http還是https,當然你的url必須得有,不能只寫www.baidu.com/而需要http://www.baidu.com/。

對于post的請求,nodegrass提供了post方法,看例子:

var ng=require('nodegrass');ng.post("https://api.weibo.com/oauth2/access_token",function(data,status,headers){  var accessToken = JSON.parse(data);  var err = null;  if(accessToken.error){     err = accessToken;  }  callback(err,accessToken);  },headers,options,'utf8');

以上是新浪微博Auth2.0請求accessToken的一部分,其中使用nodegrass的post請求access_token的api。

post方法相比get方法多提供了headers請求頭參數,options--post的數據,它們都是對象字面量的類型:

var headers = {    'Content-Type': 'application/x-www-form-urlencoded',    'Content-Length':data.length  };var options = {       client_id : 'id',     client_secret : 'cs',     grant_type : 'authorization_code',     redirect_uri : 'your callback url',     code: acode  };

三、利用nodegrass做代理服務器?……**

看例子:

var ng = require('nodegrass'),   http=require('http'),   url=require('url');   http.createServer(function(req,res){    var pathname = url.parse(req.url).pathname;        if(pathname === '/'){      ng.get('http://www.cnblogs.com/',function(data){        res.writeHeader(200,{'Content-Type':'text/html;charset=utf-8'});        res.write(data+"/n");        res.end();        },'utf8');      }   }).listen(8088);   console.log('server listening 8088...');

就這么簡單,當然代理服務器還有復雜的多,這個不算是,但至少你訪問本地8088端口,看到的是不是博客園的頁面呢?

nodegrass的開源地址:https://github.com/scottkiss/nodegrass

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持VeVb武林網。


注:相關教程知識閱讀請移步到JavaScript/Ajax教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
国产一区二区三区在线看| 成人免费视频a| 欧美三级xxx| 91视频国产精品| 久久黄色av网站| 国产亚洲aⅴaaaaaa毛片| 性色av一区二区三区| 国模吧一区二区三区| 久久综合88中文色鬼| 中文字幕欧美日韩va免费视频| 久久久久久久久久婷婷| 亚洲日本成人女熟在线观看| 欧美一区二区三区免费视| 久久久久久久久久久久久久久久久久av| 欧美成人高清视频| 国产在线视频2019最新视频| 国产精品精品久久久| 成人免费淫片aa视频免费| 国产精品狠色婷| 欧美在线欧美在线| 亚洲天堂免费观看| 欧美国产视频一区二区| 亚洲国产天堂久久综合网| 91精品国产色综合久久不卡98口| 亚洲人成网在线播放| 国产一区二区激情| 精品人伦一区二区三区蜜桃免费| 欧美专区在线视频| 久久激情视频免费观看| 欧美成人四级hd版| 亚洲色图激情小说| 欧美性猛交xxxxx水多| 91精品国产亚洲| 国产精品国产自产拍高清av水多| 日本不卡视频在线播放| 国产精品视频播放| 亚洲一区免费网站| 欧美午夜激情小视频| 欧美在线视频一区二区| 久久91亚洲人成电影网站| 亚洲最大激情中文字幕| 日本国产欧美一区二区三区| 亚洲激情国产精品| 2019中文字幕免费视频| 狠狠躁夜夜躁人人躁婷婷91| 亚洲男人天堂手机在线| 国产v综合ⅴ日韩v欧美大片| 亚洲精品99久久久久中文字幕| 欧美黑人一区二区三区| 国产一区二区动漫| zzijzzij亚洲日本成熟少妇| 精品亚洲va在线va天堂资源站| 欧美性一区二区三区| 亚洲国产毛片完整版| 亚洲欧洲视频在线| 国产精品久久久久久婷婷天堂| 亚洲人成网站色ww在线| 亚洲成人999| 欧美一区二区三区精品电影| 久久97精品久久久久久久不卡| 欧美午夜视频在线观看| 国产成人在线一区二区| 91精品国产沙发| 国产精品免费久久久久久| 久久亚洲综合国产精品99麻豆精品福利| 日韩中文字幕国产| 久久6免费高清热精品| 亚洲最新av在线网站| 亚洲无限av看| 日韩亚洲一区二区| 国产精品视频白浆免费视频| 欧美另类69精品久久久久9999| 欧美猛男性生活免费| 欧美成aaa人片在线观看蜜臀| 久久99视频精品| 亚洲色图狂野欧美| 欧美电影《睫毛膏》| 日韩一区二区久久久| 亚洲va久久久噜噜噜久久天堂| 亚洲国产精品va| 亚洲精选在线观看| 久久久精品在线| 国产国产精品人在线视| 成人av番号网| 亚洲欧美在线一区| 亚洲第一网站免费视频| 精品视频久久久久久久| 国产欧美日韩中文字幕在线| 精品美女永久免费视频| 欧美激情免费在线| 欧美贵妇videos办公室| 亚洲乱码一区av黑人高潮| 国产精品三级在线| 久久精品视频在线观看| 日韩av网址在线观看| 91精品国产精品| 日韩av在线网页| 九九热r在线视频精品| 久久久久久久久久久国产| 亚洲美女又黄又爽在线观看| 久久影视电视剧凤归四时歌| 久久噜噜噜精品国产亚洲综合| 中文字幕日韩在线播放| 91在线观看免费高清| 亚洲深夜福利视频| 日韩精品中文字幕在线播放| 国产亚洲一级高清| 国产精品欧美亚洲777777| 亚洲精美色品网站| 最近2019中文字幕一页二页| 久久影院免费观看| 久久精品视频免费播放| 亚洲欧美国产精品| 黄色成人在线播放| 国产91九色视频| 91网在线免费观看| 亚洲欧洲日产国码av系列天堂| 91精品综合视频| 日本午夜在线亚洲.国产| 亚洲精品中文字| 亚洲欧美成人一区二区在线电影| 欧美另类99xxxxx| 国产69精品99久久久久久宅男| 在线视频国产日韩| 日韩电影视频免费| 欧美久久精品午夜青青大伊人| 日韩中文字幕视频在线| 亚洲欧洲一区二区三区在线观看| 91牛牛免费视频| 伊人久久久久久久久久久| 中文字幕一精品亚洲无线一区| 国产啪精品视频网站| 亚洲午夜国产成人av电影男同| 亚洲国产成人久久综合| wwwwwwww亚洲| 国产丝袜高跟一区| 色偷偷偷综合中文字幕;dd| 永久免费精品影视网站| 搡老女人一区二区三区视频tv| 久久久综合av| 日本亚洲欧美三级| 日韩电视剧免费观看网站| 亚洲全黄一级网站| 91久久精品视频| 色综合久久88色综合天天看泰| 欧美日本国产在线| 精品久久久久久久久久久久| 亚洲精品视频免费| 欧美猛交ⅹxxx乱大交视频| 国产一区av在线| 免费99精品国产自在在线| 亚洲成人激情在线观看| 日韩在线免费高清视频| 亚洲欧美国产日韩天堂区| 日本久久91av| 日韩免费黄色av| 亚洲性xxxx| 操日韩av在线电影| 少妇久久久久久| 亚洲视频在线看| 中文字幕久久亚洲| 中文字幕av一区二区三区谷原希美| 国产精品久久久久久久av大片| 91日韩在线播放|