亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 語言 > JavaScript > 正文

用Node.js通過sitemap.xml批量抓取美女圖片

2024-05-06 16:20:58
字體:
來源:轉載
供稿:網友

這篇文章主要介紹了用Node.js通過sitemap.xml批量抓取美女圖片的方法和相關代碼,有需要的小伙伴可以參考下。

之前看了很多個版本,自己也搞一個。

1. 支持指定保存到哪個目錄

2. 按文章進行分目錄存放

3. 支持設置并行下載上限

下次有空再搞個整站下載的。

package.json

 

 
  1. "name""me2sex-images"
  2. "version""0.0.1"
  3. "description""Batch download images from http://me2-sex.lofter.com"
  4. "main""index.js"
  5. "author""Fay"
  6. "license""MIT"
  7. "dependencies": { 
  8. "async""^0.9.0"
  9. "cheerio""^0.18.0"
  10. "mkdirp""^0.5.0"
  11. "request""^2.51.0"
  12. "url""^0.10.2"
  13. "xml2js""^0.4.4" 

index.js

 

 
  1. var node = { 
  2. async: require('async'), 
  3. cheerio: require('cheerio'), 
  4. fs: require('fs'), 
  5. mkdirp: require('mkdirp'), 
  6. path: require('path'), 
  7. request: require('request'), 
  8. url: require('url'), 
  9. xml2js: require('xml2js'), 
  10. }; 
  11.  
  12. var Me2SexImages = { 
  13.  
  14. /** 
  15. * 配置選項 
  16. */ 
  17. options: { 
  18. // 網站sitemap地址 
  19. sitemap: 'http://sexy.faceks.com/sitemap.xml'
  20. // 保存到此文件夾 
  21. saveTo: '/Users/Fay/Pictures/me2sex'
  22. // 圖片并行下載上限 
  23. downLimit: 5, 
  24. }, 
  25.  
  26. posts: [], 
  27.  
  28. /** 
  29. * 開始下載(程序入口函數) 
  30. */ 
  31. start: function() { 
  32. var self = this
  33. var async = node.async; 
  34.  
  35. async.waterfall([ 
  36. self.wrapTask(self.sitemapXML), 
  37. self.wrapTask(self.sitemapJSON), 
  38. self.wrapTask(self.downAllImages), 
  39. ], function(err, result) { 
  40. if (err) { 
  41. console.log('error: %s', err.message); 
  42. else { 
  43. console.log('success: 下載成功'); 
  44. }); 
  45. }, 
  46.  
  47. /** 
  48. * 包裹任務,確保原任務的上下文指向某個特定對象 
  49. * @param {Function} task 符合asycs.js調用方式的任務函數 
  50. * @param {Any} context 上下文 
  51. * @param {Array} exArgs 額外的參數 
  52. * @return {Function} 符合asycs.js調用方式的任務函數 
  53. */ 
  54. wrapTask: function(task, context, exArgs) { 
  55. var self = this
  56. return function() { 
  57. var args = [].slice.call(arguments); 
  58. args = exArgs ? exArgs.concat(args) : args; 
  59. task.apply(context || self, args); 
  60. }; 
  61. }, 
  62.  
  63. /** 
  64. * 獲取站點sitemap.xml 
  65. */ 
  66. sitemapXML: function(callback) { 
  67. console.log('開始下載sitemap.xml'); 
  68. node.request(this.options.sitemap, function(err, res, body) { 
  69. if (!err) console.log('下載sitemap.xml成功'); 
  70. callback(err, body); 
  71. }); 
  72. }, 
  73.  
  74. /** 
  75. * 將sitemap.xml轉成json 
  76. */ 
  77. sitemapJSON: function(sitemapXML, callback) { 
  78. var self = this
  79. console.log('開始解析sitemap.xml'); 
  80. node.xml2js.parseString(sitemapXML, {explicitArray: false}, function(err, json) { 
  81. if (!err) { 
  82. self.posts = json.urlset.url; 
  83. self.posts.shift(); 
  84. console.log('解析sitemap.xml成功,共有%d個頁面', self.posts.length); 
  85. callback(err, self.posts); 
  86. }); 
  87. }, 
  88.  
  89.  
  90.  
  91. /** 
  92. * 下載整站圖片 
  93. */ 
  94. downAllImages: function(callback) { 
  95. var self = this
  96. var async = node.async; 
  97. console.log('開始批量下載'); 
  98. async.eachSeries(self.posts, self.wrapTask(self.downPostImages), callback); 
  99. }, 
  100.  
  101.  
  102. /** 
  103. * 下載單個post的圖片 
  104. * @param {Object} post 文章 
  105. */ 
  106. downPostImages: function(post, callback) { 
  107. var self = this
  108. var async = node.async; 
  109.  
  110. async.waterfall([ 
  111. self.wrapTask(self.mkdir, self, [post]), 
  112. self.wrapTask(self.getPost), 
  113. self.wrapTask(self.parsePost), 
  114. self.wrapTask(self.downImages), 
  115. ], callback); 
  116. }, 
  117.  
  118. mkdir: function(post, callback) { 
  119. var path = node.path; 
  120. var url = node.url.parse(post.loc); 
  121. post.dir = path.join(this.options.saveTo, path.basename(url.pathname)); 
  122.  
  123. console.log('準備創建目錄:%s', post.dir); 
  124. if (node.fs.existsSync(post.dir)) { 
  125. callback(null, post); 
  126. console.log('目錄:%s 已經存在', post.dir); 
  127. return
  128. node.mkdirp(post.dir, function(err) { 
  129. callback(err, post); 
  130. console.log('目錄:%s 創建成功', post.dir); 
  131. }); 
  132. }, 
  133.  
  134. /** 
  135. * 獲取post內容 
  136. */ 
  137. getPost: function(post, callback) { 
  138. console.log('開始請求頁面:%s', post.loc); 
  139. node.request(post.loc, function(err, res, body) { 
  140. if (!err) post.html = body; 
  141. callback(err, post); 
  142. console.log('請求頁面成功:%s', post.loc); 
  143. }); 
  144. }, 
  145.  
  146. /** 
  147. * 解析post,并獲取post中的圖片列表 
  148. */ 
  149. parsePost: function(post, callback) { 
  150. var $ = post.$ = node.cheerio.load(post.html); 
  151. post.images = $('.img'
  152. .map(function() {return $(this).attr('bigimgsrc');}) 
  153. .toArray(); 
  154. callback(null, post); 
  155. }, 
  156.  
  157. /** 
  158. * 下載post圖片列表中的圖片 
  159. */ 
  160. downImages: function(post, callback) { 
  161. console.log('發現%d張妹子圖片,準備開始下載...', post.images.length); 
  162. node.async.eachLimit( 
  163. post.images, 
  164. this.options.downLimit, 
  165. this.wrapTask(this.downImage, this, [post]), 
  166. callback 
  167. ); 
  168. }, 
  169.  
  170. /** 
  171. * 下載單個圖片 
  172. */ 
  173. downImage: function(post, imgsrc, callback) { 
  174. var url = node.url.parse(imgsrc); 
  175. var fileName = node.path.basename(url.pathname); 
  176. var toPath = node.path.join(post.dir, fileName); 
  177. console.log('開始下載圖片:%s,保存到:%s,文件名:%s', imgsrc, post.dir, fileName); 
  178. node.request(imgsrc) 
  179. .pipe(node.fs.createWriteStream(toPath)) 
  180. .on('close'function() { 
  181. console.log('圖片下載成功:%s', imgsrc); 
  182. callback(); 
  183. }) 
  184. .on('error', callback); 
  185. }; 
  186.  
  187. Me2SexImages.start(); 

以上所述就是本文的全部內容,希望大家能夠喜歡。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表

圖片精選

亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
欧美激情一区二区三区高清视频| 97超碰蝌蚪网人人做人人爽| 日韩一二三在线视频播| 欧美中文字幕第一页| 久久久久久尹人网香蕉| 色伦专区97中文字幕| 欧美乱大交xxxxx| 欧美另类老肥妇| 国产精品福利观看| 欧美性猛交xxxx乱大交极品| 欧美国产精品人人做人人爱| 日韩在线欧美在线| 亚洲自拍偷拍在线| 中文字幕一区日韩电影| 91精品国产91久久久久久最新| 亚洲夜晚福利在线观看| 国产一区二区三区直播精品电影| 97香蕉超级碰碰久久免费的优势| 亚洲精品美女久久久久| 中文国产成人精品| 伊人青青综合网站| 国模极品一区二区三区| 欧美性猛交xxxx久久久| 在线观看欧美www| 97超级碰碰碰久久久| 久久99精品久久久久久青青91| 日韩免费观看在线观看| 97精品在线视频| 自拍偷拍亚洲区| 亚洲成人在线视频播放| 国产精品视频免费观看www| 亚洲国产精品久久久久秋霞蜜臀| 亚洲电影免费观看高清完整版在线| 久久最新资源网| 欧美成人剧情片在线观看| 日韩欧美中文字幕在线观看| 国产精品夫妻激情| 欧美成人免费大片| 欧美日韩激情小视频| 69**夜色精品国产69乱| 国产成人久久精品| 国产精品入口夜色视频大尺度| 日本亚洲精品在线观看| 日本高清+成人网在线观看| 国产精品96久久久久久又黄又硬| 国产精品免费一区| 国产亚洲美女久久| 欧美—级a级欧美特级ar全黄| 国产精品男人的天堂| 欧美—级高清免费播放| 中文字幕欧美日韩| 欧美理论电影在线播放| 欧美激情精品久久久久久大尺度| 色综合久久中文字幕综合网小说| 欧美另类精品xxxx孕妇| 日韩电影中文字幕在线| 亚洲精品永久免费| 欧美日韩国产限制| 92版电视剧仙鹤神针在线观看| 欧美精品一区二区免费| 免费91麻豆精品国产自产在线观看| 91在线观看免费观看| 久久久国产一区| 欧美精品免费在线| 久久久久久久久久亚洲| 成人久久一区二区三区| 精品成人在线视频| 成人在线免费观看视视频| 久久久久久久久久久亚洲| 久久久久久成人| 国产欧美日韩中文| 国产精品电影观看| 亚州av一区二区| 日韩一区av在线| 精品中文视频在线| 俺去亚洲欧洲欧美日韩| 97热在线精品视频在线观看| 98精品在线视频| 国产精品久久久久9999| 不卡av在线网站| 青草青草久热精品视频在线观看| 亚洲japanese制服美女| 超碰97人人做人人爱少妇| 国产一区二区三区四区福利| 成人性生交大片免费观看嘿嘿视频| 91老司机精品视频| 中文字幕国内精品| 日韩欧美一区视频| 高清欧美电影在线| 一区二区三区动漫| 国产日韩av在线播放| 中文字幕在线国产精品| 欧美成人午夜激情视频| 久久精品国产欧美亚洲人人爽| 亚洲午夜av电影| 欧美精品手机在线| 日韩精品视频在线| 亚洲天堂第一页| 久久久久久久国产精品视频| 国产在线高清精品| 亚洲人成在线观| 久久久久久久久久久久av| 欧美日本中文字幕| 激情亚洲一区二区三区四区| 国产欧亚日韩视频| 欧美日韩亚洲高清| www.久久撸.com| 51视频国产精品一区二区| 久久精品中文字幕| 隔壁老王国产在线精品| 欧美在线视频免费播放| 久久久久亚洲精品成人网小说| 欧美最顶级的aⅴ艳星| 在线观看亚洲视频| 国产精品久久久av久久久| 欧美疯狂性受xxxxx另类| 国产精品福利久久久| 日本亚洲欧美成人| 亚洲美女性视频| 国产一区二区三区丝袜| 日韩中文字幕在线播放| 欧美精品18videos性欧| 91在线网站视频| 欧美性猛交xxxx久久久| 米奇精品一区二区三区在线观看| 成人午夜一级二级三级| 欧美美最猛性xxxxxx| 91精品国产自产在线| 欧美国产精品人人做人人爱| 久久6精品影院| 国产日韩精品入口| 欧美小视频在线观看| 日产精品久久久一区二区福利| 国产精品久久一区主播| 亚洲自拍偷拍第一页| 色妞在线综合亚洲欧美| 亚洲欧美制服综合另类| 91久久在线视频| 国产日本欧美一区二区三区在线| 精品国产欧美一区二区三区成人| 日韩免费看的电影电视剧大全| 日韩经典一区二区三区| 久久精品视频中文字幕| 91精品国产综合久久香蕉| 国产精品网站视频| 成人精品视频99在线观看免费| 亚洲国产精品热久久| 亚洲一区二区少妇| 国产精品无av码在线观看| 日韩av一区二区在线| 精品国产91久久久| 国产美女精品免费电影| 久久久亚洲影院你懂的| 国产a∨精品一区二区三区不卡| 久久这里有精品| 欧美区二区三区| 国产精品91久久久| 日韩欧美国产视频| 久久精品一偷一偷国产| 国产精品视频久久| 麻豆成人在线看| 色www亚洲国产张柏芝| 最新日韩中文字幕| 欧美乱大交xxxxx|