亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Regex > 正文

Java用正則表達式如何讀取網頁內容

2020-03-16 21:02:17
字體:
來源:轉載
供稿:網友

java用正則表達式讀取網頁內容,通過抓取文章標題及內容,進一步專區整個頁面的全部內容,本文代碼簡單易懂,對java用正則表達式讀取網頁內容感興趣的朋友可以參考下

學習java的正則表達式,抓取網頁并解析HTML部分內容

 

 
  1. package com.xiaofeng.picup; 
  2. import java.io.BufferedReader; 
  3. import java.io.IOException; 
  4. import java.io.InputStreamReader; 
  5. import java.net.MalformedURLException; 
  6. import java.net.URL; 
  7. import java.util.ArrayList; 
  8. import java.util.HashMap; 
  9. import java.util.List; 
  10. import java.util.regex.Matcher; 
  11. import java.util.regex.Pattern; 
  12. /** *//** 
  13. * 
  14. * @抓取頁面文章標題及內容(測試) 手動輸入網址抓取,可進一步自動抓取整個頁面的全部內容 
  15. * 
  16. */ 
  17. public class WebContent ...{ 
  18. /** *//** 
  19. * 讀取一個網頁全部內容 
  20. */ 
  21. public String getOneHtml(String htmlurl) throws IOException...{ 
  22. URL url; 
  23. String temp; 
  24. StringBuffer sb = new StringBuffer(); 
  25. try ...{ 
  26. url = new URL(htmlurl); 
  27. BufferedReader in = new BufferedReader(new InputStreamReader(url 
  28. .openStream(), "utf-8"));// 讀取網頁全部內容 
  29. while ((temp = in.readLine()) != null) ...{ 
  30. sb.append(temp); 
  31. in.close(); 
  32. }catch(MalformedURLException me)...{ 
  33. System.out.println("你輸入的URL格式有問題!請仔細輸入"); 
  34. me.getMessage(); 
  35. throw me; 
  36. }catch (IOException e) ...{ 
  37. e.printStackTrace(); 
  38. throw e; 
  39. return sb.toString(); 
  40. /** *//** 
  41. * 
  42. * @param s 
  43. * @return 獲得網頁標題 
  44. */ 
  45. public String getTitle(String s) ...{ 
  46. String regex; 
  47. String title = ""
  48. List<String> list = new ArrayList<String>(); 
  49. regex = "<title>.*?</title>"
  50. Pattern pa = Pattern.compile(regex, Pattern.CANON_EQ); 
  51. Matcher ma = pa.matcher(s); 
  52. while (ma.find()) ...{ 
  53. list.add(ma.group()); 
  54. for (int i = 0; i < list.size(); i++) ...{ 
  55. title = title + list.get(i); 
  56. return outTag(title); 
  57. /** *//** 
  58. * 
  59. * @param s 
  60. * @return 獲得鏈接 
  61. */ 
  62. public List<String> getLink(String s) ...{ 
  63. String regex; 
  64. List<String> list = new ArrayList<String>(); 
  65. regex = "<a[^>]*href=("([^"]*)"|'([^']*)'|([^s>]*))[^>]*>(.*?)</a>"; 
  66. Pattern pa = Pattern.compile(regex, Pattern.DOTALL); 
  67. Matcher ma = pa.matcher(s); 
  68. while (ma.find()) ...{ 
  69. list.add(ma.group()); 
  70. return list; 
  71. /** *//** 
  72. * 
  73. * @param s 
  74. * @return 獲得腳本代碼 
  75. */ 
  76. public List<String> getScript(String s) ...{ 
  77. String regex; 
  78. List<String> list = new ArrayList<String>(); 
  79. regex = "<script.*?</script>"
  80. Pattern pa = Pattern.compile(regex, Pattern.DOTALL); 
  81. Matcher ma = pa.matcher(s); 
  82. while (ma.find()) ...{ 
  83. list.add(ma.group()); 
  84. return list; 
  85. /** *//** 
  86. * 
  87. * @param s 
  88. * @return 獲得CSS 
  89. */ 
  90. public List<String> getCSS(String s) ...{ 
  91. String regex; 
  92. List<String> list = new ArrayList<String>(); 
  93. regex = "<style.*?</style>"
  94. Pattern pa = Pattern.compile(regex, Pattern.DOTALL); 
  95. Matcher ma = pa.matcher(s); 
  96. while (ma.find()) ...{ 
  97. list.add(ma.group()); 
  98. return list; 
  99. /** *//** 
  100. * 
  101. * @param s 
  102. * @return 去掉標記 
  103. */ 
  104. public String outTag(String s) ...{ 
  105. return s.replaceAll("<.*?>"""); 

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
亚洲黄色在线观看| 日韩成人高清在线| 热re99久久精品国产66热| 亚洲国产天堂网精品网站| 黑人巨大精品欧美一区二区一视频| 国产福利精品视频| 国产精品永久免费在线| 欧美成人精品在线播放| 国产精品中文在线| 日韩在线免费视频观看| 亚洲成人精品av| 日韩国产精品视频| 成人在线免费观看视视频| 久久中文久久字幕| 亚洲 日韩 国产第一| 国产成人精品免费久久久久| 91国产视频在线| 欧美激情三级免费| 精品日本美女福利在线观看| 亚洲天堂男人天堂| 韩国欧美亚洲国产| 精品自拍视频在线观看| 精品国产乱码久久久久久虫虫漫画| 久久精品国产96久久久香蕉| 日韩精品免费在线视频观看| 黑人欧美xxxx| 九九九久久国产免费| 亚洲一区第一页| 久久国产精品影视| 久久伊人精品一区二区三区| 国产精品亚洲美女av网站| 欧美日韩第一视频| 亚洲缚视频在线观看| 一区二区三区久久精品| 国产成人av网| 亚洲аv电影天堂网| 午夜精品在线观看| 日本精品免费一区二区三区| 国产精品第一第二| 久久久精品美女| 亚洲色图国产精品| 欧美成人精品激情在线观看| 日韩美女中文字幕| 国产在线视频2019最新视频| 欧美大秀在线观看| 成人激情视频在线播放| 2019中文字幕在线观看| 国产精品人人做人人爽| 国精产品一区一区三区有限在线| 久久精品成人欧美大片| 久久中文久久字幕| 欧美日本精品在线| 国产精品成人品| 成人激情视频网| 福利二区91精品bt7086| 亚洲а∨天堂久久精品9966| 亚洲成人黄色在线| 日韩有码视频在线| 岛国av午夜精品| 久久精品99久久香蕉国产色戒| 91精品国产乱码久久久久久蜜臀| 啊v视频在线一区二区三区| 亚洲综合在线中文字幕| 国产亚洲精品va在线观看| 精品无人区太爽高潮在线播放| 中文字幕欧美视频在线| 韩剧1988在线观看免费完整版| 一个色综合导航| 国产精品亚洲自拍| 久久人91精品久久久久久不卡| 国产激情综合五月久久| 国产精品日本精品| 亚洲一品av免费观看| 色噜噜久久综合伊人一本| 一区二区三区无码高清视频| 亚洲第一区中文99精品| 色综合天天综合网国产成人网| 懂色aⅴ精品一区二区三区蜜月| 国产日韩欧美另类| 国语自产精品视频在线看一大j8| 一区二区三区国产在线观看| 欧美综合在线第二页| 国产精品偷伦一区二区| 一本大道香蕉久在线播放29| 97婷婷大伊香蕉精品视频| 久久久久久久成人| 国产精品欧美一区二区| 91免费国产视频| 欧美激情影音先锋| 69影院欧美专区视频| 亚洲电影免费在线观看| 国产欧美日韩中文| 欧美国产日本高清在线| 国产精品久久久久久五月尺| 欧美精品免费在线观看| 热久久视久久精品18亚洲精品| 一区二区成人av| 日韩久久精品成人| 成人午夜激情网| 亚洲欧美三级在线| 91精品国产高清久久久久久久久| 97av视频在线| 国产精品美女免费| 亚洲精品电影网| 国产精品一区二区三| 亚洲一区二区久久久久久久| 亚洲国产免费av| 亚洲va久久久噜噜噜| 青青久久av北条麻妃黑人| 97精品免费视频| 自拍偷拍亚洲区| 亚洲天堂av图片| 国产精品丝袜一区二区三区| 精品福利在线看| 高清一区二区三区日本久| 国产自摸综合网| 欧美视频精品一区| 日本高清视频一区| 亚洲天堂av图片| 亚洲人午夜精品免费| 国产精品一区=区| 欧美日韩亚洲一区二区| 亚洲人成电影在线观看天堂色| 精品亚洲va在线va天堂资源站| 亚洲精品综合久久中文字幕| 精品调教chinesegay| 日韩中文字幕av| 国产97在线|日韩| 欧美日韩国产一区二区| 国产福利精品av综合导导航| 91伊人影院在线播放| 91夜夜揉人人捏人人添红杏| 久久好看免费视频| 热re99久久精品国产66热| 国产色婷婷国产综合在线理论片a| 日韩视频亚洲视频| 狠狠综合久久av一区二区小说| 中文字幕亚洲自拍| 精品亚洲永久免费精品| 欧美激情一区二区三区高清视频| 午夜精品久久久99热福利| 日本a级片电影一区二区| 国产精品久久99久久| 欧美综合在线观看| 国内精品久久久久久久久| 国产精品久久久久久久天堂| 5566日本婷婷色中文字幕97| 91精品国产电影| 日韩中文字幕在线视频| 国产精品久久久久aaaa九色| 亚洲一区二区少妇| 国产精品九九九| 欧美日本在线视频中文字字幕| 精品在线欧美视频| 国产女人18毛片水18精品| 亚洲a在线观看| 精品久久久久久久久国产字幕| 日韩中文字幕av| 日韩av在线一区二区| 成人激情综合网| 亚洲免费视频观看| 精品视频在线导航| 国产丝袜精品视频| 精品国产乱码久久久久久天美|