使用Java獲取網頁源文件,可以使用正則表達式獲取鏈接地址,因為正則表達式不好學習,所以很多程序員都會使用JSP抓取網頁代碼的程序,下面就跟著錯新技術頻道小編的步伐來了解一下吧!
JSP抓取網頁代碼的程序
<%@ page contentType="text/html;charset=gb2312"%>
<%??
String sCurrentLine;??
String sTotalString;??
sCurrentLine="";??
sTotalString="";??
java.io.InputStream l_urlStream;??
java.net.URL l_url = new java.net.URL("http://www.163.net/");??
java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();??
l_connection.connect();??
l_urlStream = l_connection.getInputStream();??
java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));??
while ((sCurrentLine = l_reader.readLine()) != null)??
{??
sTotalString+=sCurrentLine;??
}??
out.println(sTotalString);??
%>
上文是錯新技術頻道小編為大家整理的JSP抓取網頁代碼的程序,雖然代碼相對比較簡單,但我認為根據這一點,我們可以實現“網頁爬蟲”的功能。
新聞熱點
疑難解答