亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb

首頁 > 編程 > Java > 正文

java正則表達式匹配網頁所有網址和鏈接文字的示例

2019-11-26 15:35:37
字體:
來源:轉載
供稿:網友

復制代碼 代碼如下:

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import java.net.*;
import java.io.*;
import java.util.regex.*;

/*
根據指定的規則,通過構造正則表達式獲取網址
*/

public class Urls
{
    private String startUrl;                                         //開始采集網址
    String  urlContent;
    String ContentArea;
    private String strAreaBegin ,strAreaEnd ;            //采集區域開始采集字符串和結束采集字符串
    private String stringInUrl,stringNotInUrl;       
    String strContent;//獲得的采集內容
    String[] allUrls;                                                            //采集到的所有網址
    private String  regex;                                                 //采集規則

    UrlAndTitle   urlAndTitle=new UrlAndTitle();    //存儲網址和標題                   

   
    public static void main(String[] args)
    {
         Urls myurl=new Urls("<body","/body>");
         myurl.getStartUrl("http://www.zuzwn.com/");
         myurl.getUrlContent();
         myurl.getContentArea();
         myurl.getStartUrl("http://www.zuzwn.com/");
         myurl.getStringNotInUrl("google");
         myurl.Urls();

        //System.out.println("startUrl:"+myurl.startUrl);
        //System.out.println("urlcontent:"+myurl.urlContent);
        //System.out.println("ContentArea:"+myurl.ContentArea);

    }

   
    //初始化構造函數 strAreaBegin 和strAreaEnd

    public Urls (String strAreaBegin,String strAreaEnd)
    {
        this.strAreaBegin=strAreaBegin;
        this.strAreaEnd=strAreaEnd;
  }

  //
    public void Urls()
    {
        int i=0;
        //String regex ="<a href="?'?http://[a-zA-Z0-9]+/.[a-zA-Z0-9]+/.[a-zA-Z]+/?[/.?[/S|/s]]+[a>]$";
        String regex ="<a.*?/a>";
         //String regex ="http://.*?>";
        Pattern pt=Pattern.compile(regex);
        Matcher mt=pt.matcher(ContentArea);
        while(mt.find())
         {
                 System.out.println(mt.group());
                 i++;

                 //獲取標題
                 Matcher title=Pattern.compile(">.*?</a>").matcher(mt.group());
                 while(title.find())
                 {
                      System.out.println("標題:"+title.group().replaceAll(">|</a>",""));
                 }

                 //獲取網址
                 Matcher myurl=Pattern.compile("href=.*?>").matcher(mt.group());
                 while(myurl.find())
                 {
                      System.out.println("網址:"+myurl.group().replaceAll("href=|>",""));
                 }

                 System.out.println();

                
         }

        System.out.println("共有"+i+"個符合結果");

    }   

    //獲得開始采集網址
    public void getStartUrl(String startUrl)
    {
        this.startUrl=startUrl;
    }

    //獲得網址所在內容;
    public void getUrlContent()
    {

        StringBuffer is=new StringBuffer();
        try
        {
            URL myUrl=new URL(startUrl);
            BufferedReader br= new BufferedReader(
                                                        new InputStreamReader(myUrl.openStream()));

            String s;                                               
            while((s=br.readLine())!=null)
            {
                is.append(s);
            }                                           
            urlContent=is.toString();
        }
    catch(Exception e)

    {
        System.out.println("網址文件未能輸出");
        e.printStackTrace();
    }

       
    }

   
    //獲得網址所在的匹配區域部分
    public void getContentArea()
    {
         int pos1=0,pos2=0;
         pos1= urlContent.indexOf(strAreaBegin)+strAreaBegin.length();
         pos2=urlContent.indexOf(strAreaEnd,pos1);
         ContentArea=urlContent.substring(pos1,pos2);
    }

    //以下兩個函數獲得網址應該要包含的關鍵字及不能包含的關鍵字
    //這里只做初步的實驗。后期,保護的關鍵字及不能包含的關鍵字應該是不只一個的。
    public void getStringInUrl(String stringInUrl)
    {
         this.stringInUrl=stringInUrl;       

    }

    public void getStringNotInUrl(String stringNotInUrl)
    {
        this.stringNotInUrl=stringNotInUrl;
    }

    //獲取采集規則

    //獲取url網址
    public void getUrl()
    {

    }

    public String getRegex()
    {
        return regex;

    }

    class UrlAndTitle
    {
        String myURL;
        String title;
    }
}

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb
久久视频在线观看免费| 日韩成人在线视频| 国产视频精品xxxx| 国产精品永久免费视频| 欧美日韩国产色视频| 高清欧美性猛交xxxx| 91在线高清免费观看| 久久99久国产精品黄毛片入口| 久久精品最新地址| 久久久www成人免费精品张筱雨| 国产一区二区免费| 精品国偷自产在线视频99| 成人免费福利在线| 国产亚洲精品综合一区91| 亚洲视频在线免费观看| 午夜免费久久久久| 欧美激情在线观看| 久久综合久久88| 91久久在线播放| 国产大片精品免费永久看nba| 欧美肥老太性生活视频| 亚洲精品日韩激情在线电影| 欧美xxxx18国产| 成人国产在线视频| 久久香蕉国产线看观看av| 国产日韩精品在线播放| 国产精品极品尤物在线观看| 日韩成人av在线播放| 成人在线一区二区| 亚洲色图在线观看| 日韩在线观看免费高清完整版| 成人精品视频99在线观看免费| 精品久久久久久久久中文字幕| 国产精品免费视频xxxx| 日本aⅴ大伊香蕉精品视频| 国产视频一区在线| 成人黄色在线播放| 国产精品入口夜色视频大尺度| 国产精品久久久av久久久| 伦伦影院午夜日韩欧美限制| 欧美激情免费视频| 国产免费一区视频观看免费| 欧美日韩激情美女| 中文字幕亚洲欧美一区二区三区| 日韩一区二区福利| 亚洲午夜精品久久久久久性色| 亚洲国产欧美久久| 国产精品久久久久久久久借妻| 26uuu另类亚洲欧美日本一| 欧美猛交免费看| 51久久精品夜色国产麻豆| 久久久这里只有精品视频| 欧美性极品少妇精品网站| 草民午夜欧美限制a级福利片| 欧美高清电影在线看| 97婷婷涩涩精品一区| 日韩免费观看网站| 日本一区二区三区在线播放| 欧美黑人xxxⅹ高潮交| 亚洲一区二区少妇| 欧美午夜性色大片在线观看| 久久久欧美精品| 日韩精品视频在线| 红桃视频成人在线观看| 91亚洲va在线va天堂va国| 国产精品美女久久久久av超清| 91精品国产成人| 少妇激情综合网| 91在线国产电影| 日韩一区二区欧美| 国产亚洲免费的视频看| 精品国产一区久久久| 中文综合在线观看| 亚洲精品一区二三区不卡| 不用播放器成人网| 欧美日韩国产页| 国产精品啪视频| 欧美性xxxxx极品娇小| 国产精品中文久久久久久久| 久久亚洲成人精品| 在线成人一区二区| 欧美日韩免费一区| 成人久久一区二区| 久久综合久久美利坚合众国| 91色视频在线观看| 国产色婷婷国产综合在线理论片a| 国产精品午夜国产小视频| 国产男人精品视频| 日韩在线观看免费网站| 久久久久久成人| 亚洲变态欧美另类捆绑| 国产精品扒开腿做| 国产成人精品一区二区| 国产精品99久久久久久久久久久久| 亚洲最大福利视频| 亚洲美女精品久久| 狠狠色狠狠色综合日日五| 精品国产一区久久久| 日韩欧美a级成人黄色| 日韩精品在线观| 日韩久久精品成人| 欧美疯狂性受xxxxx另类| 国产精品美女网站| 欧美精品18videosex性欧美| 亚洲精品久久视频| 欧美日韩在线观看视频| 91av在线播放视频| 亚洲大尺度美女在线| 国产精品视频网| 国产在线播放不卡| 在线播放国产一区中文字幕剧情欧美| 亚洲三级 欧美三级| 久久视频免费在线播放| 2019精品视频| 精品偷拍各种wc美女嘘嘘| 国产91色在线免费| 亚洲国产精品99久久| 亚洲女同性videos| 国产综合久久久久| 精品露脸国产偷人在视频| 亚洲欧美日本另类| 国产精品成人av在线| 欧美国产日韩一区二区三区| 久久6精品影院| 欧美性猛交xxxx乱大交3| 欧美精品在线免费观看| 亚洲美女性生活视频| 在线成人激情黄色| 九九精品在线视频| 亚洲精品国产suv| 亚洲福利视频久久| 中国人与牲禽动交精品| 日韩乱码在线视频| 精品福利免费观看| 欧美在线一级va免费观看| 久久色在线播放| 亚洲男人天堂网| 欧美日韩久久久久| 91影视免费在线观看| 亚洲视频自拍偷拍| 久久在线免费视频| 91免费欧美精品| 国产一区二区三区四区福利| 欧美自拍大量在线观看| 亚洲r级在线观看| 亚洲自拍偷拍区| 亚洲国产精品成人一区二区| 色香阁99久久精品久久久| 97精品国产97久久久久久| 欧美华人在线视频| 91国产视频在线| 国产精品高潮粉嫩av| 久久中文精品视频| 久热国产精品视频| 色噜噜亚洲精品中文字幕| 国产mv久久久| 97av在线播放| 国产91精品久久久久久久| 国产精品亚洲аv天堂网| 亚洲一区亚洲二区| 亚洲free性xxxx护士白浆| 久久精品一区中文字幕| 亚洲国产福利在线| 亚洲无线码在线一区观看|