ASP.NET抓取網頁內容

2019-11-17 01:50:17

字體：大中小

來源：轉載

供稿：網友

asp.net抓取網頁內容

一、ASP.NET 使用HttpWebRequest抓取網頁內容

這種方式抓取某些頁面會失敗

不過，有時候我們會發現，這個程序在抓取某些頁面時，是獲不到所需的內容的，有時候甚至返回404的錯誤提示頁，這是什么原因呢？

其實，很多人都忽略了一個問題，那就是服務器默認的瀏覽器問題。有的服務器默認的瀏覽器是手機瀏覽器，那么，當我抓取這個服務器下的網頁是，就相當于用手機瀏覽器來打開網頁，而如果要抓取的目標網頁沒有相應的手機網頁的話，就會返回意想不到的結果，有的返回404錯誤提示頁，有的返回403錯誤提示頁，有的甚至跳轉到其他網頁去了。

如何解決這個問題？

要解決這個問題，其實很簡單，我們只需要在程序里指定使用的瀏覽器的即可，即是設置UserAgent的參數值。

完整代碼：

C# 代碼復制

        /// <summary>方法一：比較推薦        /// 用HttpWebRequest取得網頁源碼        /// 對于帶BOM的網頁很有效，不管是什么編碼都能正確識別        /// </summary>        /// <param name="url">網頁地址" </param>        /// <returns>返回網頁源文件</returns>        public static string GetHtmlSource2(string url)        {            //處理內容            string html = "";            HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);            request.Accept = "*/*"; //接受任意文件            request.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; .NET CLR 1.1.4322)"; //             request.AllowAutoRedirect = true;//是否允許302            //request.CookieContainer = new CookieContainer();//cookie容器，            request.Referer = url; //當前頁面的引用            HttpWebResponse response = (HttpWebResponse)request.GetResponse();            Stream stream = response.GetResponseStream();            StreamReader reader = new StreamReader(stream, Encoding.Default);            html = reader.ReadToEnd();            stream.Close();            return html;        }

二、ASP.NET 使用 WebResponse 抓取網頁內容

C# 代碼復制

        public static string GetHttpData2(string Url)        {            string sException = null;            string sRslt = null;            WebResponse oWebRps = null;            WebRequest oWebRqst = WebRequest.Create(Url);            oWebRqst.Timeout = 50000;            try            {                oWebRps = oWebRqst.GetResponse();            }            catch (WebException e)            {                sException = e.Message.ToString();            }            catch (Exception e)            {                sException = e.ToString();            }            finally            {                if (oWebRps != null)                {                    StreamReader oStreamRd = new StreamReader(oWebRps.GetResponseStream(), Encoding.GetEncoding("utf-8"));                    sRslt = oStreamRd.ReadToEnd();                    oStreamRd.Close();                    oWebRps.Close();                }            }            return sRslt;        }

三、ASP.NET 使用 WebClient 抓取網頁內容

C# 代碼復制

        /// <param name="url">/要訪問的網站地址</param>

上一篇：linq中let關鍵字學習

下一篇：使用Ajax的Time實現倒計時功能

學習交流

索泰發布一款GTX 1070 Mini迷你版本:小機

索泰發布一款GTX 1070 Mini迷你版本:小機箱大愛...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

榮耀總裁趙明烏鎮演講：榮耀首款5G手機V30下月發布

2019-10-23 09:17:05

搜狐張朝陽：回歸媒體是搜狐重新崛起的關鍵

2019-10-21 09:20:02

華為輪值董事長郭平：虛擬技術創造現實價值

2019-10-21 09:00:12

滴滴英文服務上線兩周年用戶已超200萬

2019-09-26 08:57:12

華為推出全球至快AI訓練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國技術團隊

2019-09-25 08:15:43

疑難解答

圖片精選

網友關注

亚洲香蕉成人av网站在线观看_欧美精品成人91久久久久久久_久久久久久久久久久亚洲_热久久视久久精品18亚洲精品_国产精自产拍久久久久久_亚洲色图国产精品_91精品国产网站_中文字幕欧美日韩精品_国产精品久久久久久亚洲调教_国产精品久久一区_性夜试看影院91社区_97在线观看视频国产_68精品久久久久久欧美_欧美精品在线观看_国产精品一区二区久久精品_欧美老女人bb