首頁| 新聞| 娛樂| 游戲| 科普| 文學| 編程| 系統| 數據庫| 建站| 學院| 產品| 網管| 維修| 辦公| 熱點
標記和倒數第二個
標記之間,并且倒數第二個
標記后緊跟table字符,而且這個組合“
"); //取 result_string從第一個
開始后的字符串,以去除Google臺頭 position= strpos( result_string,"
table符號的位置 result_string= substr( result_string,0, position);//截取第一個
table符號之前的字符串,以去除腳注 應用與實現 OK,現在我們已經得到有用的HTML源碼主干了,剩下的問題是如何自主地顯示這些內容。我們再分析一下這些搜索結果條目,發現每個條目之間也是很有規律的用 分隔,也就是各成一個段落,按這個特點我們用explode()函數把每個條目切開: 語法:explode(string separator, string string); 返回一個數組,按separator切開后的各個小字串被保存在數組中。 于是: result_array=explode("
", result_string); //用字串"
"把結果切開 我們就得到一個數組 result_array,其中每個元素都是一個搜索結果條目。我們所要做的僅僅是研究每個條目及其HTML顯示格式代碼,然后按要求替換就行了。下面用循環來處理 result_array中的每個條目。 for( i=0; i { ... //處理每個條目 } 對于每個條目,我們也很容易找到一些特點:每個條目都由標題、摘要、簡介、類別、網址等組成,每個部分都換行,即包含標記,于是再次分割:(以下處理程序放在上文的循環中) every_item=explode("", result_array[ i]); 這樣我們得到一個數組 every_item,其中 every_item[0]就是標題, every_item[1]和 every_item[2]兩行為摘要, every_item[3]和 every_item[4]等等的頭部如果包含“簡介:”、“< font size=-1 color=#6f6f6f>類別:< /font>”字符,則是簡介或類別(因為有的結果條目沒有該項),如果頭部包含“< font color=green>”則肯定就是網址啦,這種對比判斷我們常使用正則表達式(略),如果要替換也很方便,比如包含標題的$every_item[0],其本身是有鏈接的,我們希望修改這個鏈接屬性,讓它在新窗口打開鏈接: echo eregi_replace(' { ... //處理每個條目中除去第一項(第一項為標題,已經顯示)的每一項 ... //更多格式修改 } 這樣就修改了鏈接屬性,其余很多顯示格式的修改、剝離、替換都能用正則替換eregi_replace()來完成。 至此我們已經得到了每個搜索條目的每一項,并能任意修改每項的格式,甚至可以給他套上漂亮的表格。然而一個好的程序應該能適應各種運行環境的,這里也不例外,我們其實還只是討論了搜索結果的HTML剝離的一種框架方法,真正要做得完美,還要考慮很多內容,比如要顯示一共搜索出多少結果,分成多少頁等等,甚至還可以刨除與Google相關的那些“類別”、“簡介”等代碼,讓客戶根本看不到原始網站。不過這些內容和要求我們都能通過分析HTML進行剝離得到?,F在大家完全能自己動手,做個極富個性化的搜索引擎啦。 摘自:http://tech.163.com/tm/010228/010228_15747.html 作者:maxid
索泰發布一款GTX 1070 Mini迷
AMD新旗艦顯卡輕松干翻NVIDIA
索泰發布一款GTX 1070 Mini迷你版本:小機
芭蕾舞蹈表演,真實美到極致
下午茶時間,悠然自得的休憩
充斥這繁華奢靡氣息的城市迪拜風景圖片
從山間到田野再到大海美麗的自然風景圖片
肉食主義者的最愛美食烤肉圖片
夏日甜心草莓美食圖片
人逢知己千杯少,喝酒搞笑圖集
搞笑試卷,學生惡搞答題
新聞熱點
疑難解答
圖片精選
使用ASP建設私人搜索引擎
華為短消息中心的發展與應用
移動通信計費及客戶服務系統
移動客戶服務中心系統
網友關注