上網(wǎng)行為管理產(chǎn)品具有URL(或網(wǎng)址)過濾的功能,企業(yè)可以使用上網(wǎng)行為管理設備過濾與工作無關的網(wǎng)站,從而規(guī)范員工上網(wǎng)行為,提高工作效率。但很多用戶在使用RUL過濾功能時容易產(chǎn)生困惑,如為什么已經(jīng)設置了對指定URL(或網(wǎng)址)的過濾規(guī)則,該URL(或網(wǎng)址)還可以打開?本文將從URL過濾功能的實現(xiàn)原理出發(fā)解答這些問題,并介紹不同需求條件下的URL過濾規(guī)則設置技巧。
URL定義
Uniform Resource Locator即“統(tǒng)一資源定位符”,也被稱為“網(wǎng)頁地址”,是因特網(wǎng)上標準資源的地址。URL的一般格式是:“協(xié)議://主機/路徑/文件名.文件后綴”。URL 是對可以從因特網(wǎng)上得到的資源的位置和訪問方法的一種簡潔的表示,相當于一個文件名在網(wǎng)絡范圍的擴展。因此URL是與因特網(wǎng)相連的機器上的任何可訪問對象的一個指針。例如:http://baike.baidu.com/view/1321789.htm代表baike.baidu.com這臺主機view路徑下的1321789.htm文件,其通信協(xié)議為http(超文本傳輸協(xié)議)。
URL過濾原理
上網(wǎng)行為管理產(chǎn)品對URL的過濾通常是指針對HTTP協(xié)議URL的過濾。下面我們還是以訪問“http://baike.baidu.com/view/1321789.htm”為例講解URL過濾的原理:當我們?yōu)g覽“http://baike.baidu.com/view/1321789.htm”這個網(wǎng)址的同時運行抓包軟件,將會捕獲到下圖所示的報文:
分析上述報文可以看出當主機訪問網(wǎng)站時,首先會發(fā)送一個HTTP請求報文,該報文指明了應用層協(xié)議為HTTP,操作方法為GET,URL字段內容(路徑及文件名)為“/view/1321789.htm”,HOST字段內容為“baike.baidu.com”。當一個http報文經(jīng)過上網(wǎng)行為管理設備時,設備可以識別出上述信息,并進一步檢查報文中的HOST和URL字段內容,如果HOST或URL字段內容中有字符串與URL過濾規(guī)則中定義的過濾關鍵字相匹配,那么該報文將會被丟棄,用戶電腦與該網(wǎng)站服務器的連接斷開,從而無法打開該網(wǎng)頁。
實用案例
案例一:為什么已經(jīng)設置了過濾 “http://www.163.com”網(wǎng)址關鍵字,網(wǎng)易主頁卻還是能打開?
上面已經(jīng)說過上網(wǎng)行為管理設備在進行URL過濾時檢查的是HTTP報文中HOST和URL字段的內容,從上述抓包信息分析可知“http://”字符串并不會出現(xiàn)在這兩個字段中。因此,設備無法在訪問網(wǎng)易網(wǎng)站的HTTP報文的HOST及RUL字段中匹配到“http://www.163.com”這個字符串,正確的過濾關鍵字應該為“www.163.com”。
案例二:我想過濾網(wǎng)易郵箱,但不想過濾網(wǎng)易主頁和其他網(wǎng)易子鏈接,如何設置?
由于網(wǎng)易郵箱的HOST字段為mail.163.com,設置過濾關鍵字為“mail.163.com”即可以達到效果。而訪問網(wǎng)易主頁時HTTP報文中的HOST字段為www.163.com,不會匹配過濾規(guī)則定義的“mail.163.com”關鍵字,因此訪問網(wǎng)易主頁不會被過濾。
案例三:我想過濾所有與網(wǎng)易有關的網(wǎng)頁,并已經(jīng)設置了“www.163.com”過濾關鍵字,為什么只有網(wǎng)易主頁打不開,網(wǎng)易郵箱和網(wǎng)易新聞卻還能打開?
很顯然由上述兩案例我們已經(jīng)知道“www.163.com”是網(wǎng)易主頁的HOST字段內容。而網(wǎng)易郵箱是“mail.163.com”,網(wǎng)易新聞是“news.163.com”,因此無法完全匹配“www.163.com”過濾關鍵字,也就達不到過濾它們的效果。想達到這個效果其實很簡單,設置關鍵字為“163.com”即可。因為與網(wǎng)易有關的網(wǎng)頁其HOST字段都會包含“163.com”字符。
新聞熱點
疑難解答