當遇到網(wǎng)絡(luò)故障時每個網(wǎng)絡(luò)管理員都會很頭疼。因為互聯(lián)網(wǎng)布局復(fù)雜,要進行故障排查的話不是一件輕松的活。筆者這里跟大家分享一下如何通過Trace命令來幫助管理員進行網(wǎng)絡(luò)故障排查。希望這篇文章能夠給網(wǎng)絡(luò)管理員提供一個解決問題的思路。Trace命令主要用來跟蹤數(shù)據(jù)包的傳輸過程,可以向網(wǎng)絡(luò)管理員提供路由器到目的地地址的每一跳信息。主要是通過控制IP報文的生存期字段來實現(xiàn)這個目的。
一、Trace命令的原理
Trace命令提供路由器到目的地址的每一跳的信息。他通過控制IP報文的生存期(英文簡稱為TTL)字段來實現(xiàn)。為了獲得往返延遲的時間信息,Trace命令會發(fā)送三個報文顯示平均延遲時間。然后命令會將報文的TTL字段加1并在此發(fā)送這三個報文。這些報文將達到路徑的第二個路由器上,并返回超時錯誤或者端口不可達的信息。反復(fù)使用這個方法,不斷增加報文的TTL字段的值,直到接收到目的地址的響應(yīng)消息。
上面這么說可能有點繞口令。筆者這里舉一個簡單的例子來說明。如果現(xiàn)在有用戶反映他們不能夠訪問公司的網(wǎng)站,但是可以訪問其他網(wǎng)頁。此時網(wǎng)絡(luò)管理員該如何處理呢?網(wǎng)絡(luò)管理員懷疑是連接那個網(wǎng)站的路由器出現(xiàn)了問題。此時就可以利用 Trace + 被懷疑有故障的路由器IP地址的方式,來跟蹤數(shù)據(jù)包到這個路由器的整個過程。這個Trace命令會列舉出從管理員路由器到那個被懷疑出現(xiàn)故障路由器之間所有的路由器連接信息。如此的話,網(wǎng)絡(luò)管理員就可以發(fā)現(xiàn)是中間那個路由器出現(xiàn)了問題。這將幫助管理員迅速定位出問題的路由器。如果最后網(wǎng)絡(luò)管理員受到了來自那個被懷疑路由器的反應(yīng)信息,則表明跟那個路由器之間的連接時沒有問題的。這就表明問題可能不出在路由器身上,而有可能是那個WEB服務(wù)器在搞怪。
二、如何讀懂Trace命令返回的消息
要利用Trace命令來排查網(wǎng)絡(luò)故障,則讀懂Trace返回報文的含義這是最基礎(chǔ)的。還好Trace命令返回的報文并不復(fù)雜,比較容易看懂。
MSEC表示路由器在接收到響應(yīng)消息之前的往返網(wǎng)絡(luò)延遲,這是以毫秒為單位。在網(wǎng)絡(luò)中從發(fā)送方和接受方之間交換數(shù)據(jù),接受方收到數(shù)據(jù)和發(fā)送方發(fā)送數(shù)據(jù)之間的時間差就是網(wǎng)絡(luò)延遲。也就是說,從路由器發(fā)送消息到下一個路由器接收到消息并做出響應(yīng)中間會有一個時間的間隔。這個間隔就是網(wǎng)絡(luò)延遲。造成網(wǎng)絡(luò)延遲的原因有很多,比如在物理線路上電磁波傳播要時間,在網(wǎng)絡(luò)中間設(shè)備轉(zhuǎn)發(fā)數(shù)據(jù)包也要時間,受網(wǎng)絡(luò)帶寬限制,發(fā)送數(shù)據(jù)也要時間,還有其他的排隊時延等。從理論上來說,這個時間間隔為零為好,但是實際上做不到。在采用Trace命令時,只有第一跳的MSEC時間可能為0,達到自己路由器接口的時間。為此在網(wǎng)絡(luò)性能優(yōu)化時,不能夠消除這個網(wǎng)絡(luò)延遲,而只能夠把這個延遲盡量的縮短。若最終能夠出現(xiàn)這個信息,至少說明跟對方的連接是通的。此時網(wǎng)絡(luò)管理員要考慮的是,這個延遲的時間是否在可以容忍的范圍之內(nèi)。如果網(wǎng)絡(luò)雖然通了,但是延遲時間比較長則管理員仍然需要進行網(wǎng)絡(luò)調(diào)整。要把這個網(wǎng)絡(luò)延遲的時間控制在可以忍受的范圍之內(nèi)。
(責任編輯:武林網(wǎng))
新聞熱點
疑難解答
圖片精選