故障現(xiàn)象
1、內(nèi)部關(guān)鍵業(yè)務(wù)響應(yīng)很慢,信息處理不流暢;
2、服務(wù)器和交換機(jī)的CPU和內(nèi)存利用率低;
3、無法定位查找到網(wǎng)絡(luò)響應(yīng)慢的原因;
網(wǎng)絡(luò)環(huán)境
1、一臺cisco3560交換機(jī);
2、局域網(wǎng)內(nèi)有8臺服務(wù)器,其中4臺是UNIX系統(tǒng),另外4臺是Windows 2003系統(tǒng);
現(xiàn)場診斷
首先做Ping 測試。UNIX系統(tǒng)主機(jī)互ping的比較穩(wěn)定,Ping值均小于1MS。而UNIX系統(tǒng)主機(jī)去Ping Windows系統(tǒng)主機(jī)的Ping值經(jīng)常會出現(xiàn)9-15MS的延時。Windows系統(tǒng)主機(jī)之間互Ping值很不穩(wěn)定,在1MS到15MS之間跳躍性出現(xiàn)。
現(xiàn)象分析
該網(wǎng)絡(luò)結(jié)構(gòu)簡單清晰,服務(wù)器和交換機(jī)的性能良好。網(wǎng)絡(luò)內(nèi)經(jīng)常出現(xiàn)大于1MS的延時將會影響到整個網(wǎng)絡(luò)正常運(yùn)行,對關(guān)鍵業(yè)務(wù)的運(yùn)行造成影響,要解決該問題首先要找出延時發(fā)生的原因。
眾所周知,一次網(wǎng)絡(luò)交易處理過程:由客戶端發(fā)起連接,通過網(wǎng)絡(luò)轉(zhuǎn)發(fā)到服務(wù)端,服務(wù)端處理后再返回客戶端的。因此,在整個交易過程中的時延可以由三個時間來決定,客戶端響應(yīng)時間(t1)網(wǎng)絡(luò)傳輸所用時間(t2)服務(wù)端響應(yīng)時間(t3)。
現(xiàn)場測試發(fā)現(xiàn)UNIX系統(tǒng)主機(jī)之間ping值穩(wěn)定的小于1MS,而Windows系統(tǒng)主機(jī)之間、或與UNIX系統(tǒng)主機(jī)Ping時出現(xiàn)較大延時。這就表明UNIX系統(tǒng)主機(jī)之間通信是良好的,但是與Windows系統(tǒng)主機(jī)通信、或Windows系統(tǒng)主機(jī)之間互相通訊過程中才會有延時的出現(xiàn)。因此,我們推斷是Windows系統(tǒng)主機(jī)響應(yīng)較慢。為了驗(yàn)證以上推斷,我們用科來網(wǎng)絡(luò)通訊分析系統(tǒng)2009進(jìn)行診斷。
利用科來網(wǎng)絡(luò)通訊分析系統(tǒng)進(jìn)行網(wǎng)絡(luò)診斷
(利用科來網(wǎng)絡(luò)通訊分析系統(tǒng)2009進(jìn)行抓包分析)
首先,打開科來網(wǎng)絡(luò)通訊分析系統(tǒng)2009,配置上IP為 190.15.xxx.200,此主機(jī)做為ping發(fā)起者,向一臺IP地址為190.15.xxx.218的Windows系統(tǒng)主機(jī)進(jìn)行Ping測試。將該Windows系統(tǒng)主機(jī)的交換機(jī)端口做一個鏡像,鏡像收發(fā)的流量。然后,用190.15.xxx.200主機(jī)去Ping 190.15.xxx.218,用科來網(wǎng)絡(luò)通訊分析系統(tǒng)2009進(jìn)行13分鐘的抓包。
抓包過程中我們發(fā)現(xiàn),190.15.xxx.200主機(jī)在Ping 190.15.xxx.218主機(jī)的時候會產(chǎn)生9MS的延時,而且頻率較頻繁。而190.15.xxx.200主機(jī)Ping UNIX系統(tǒng)主機(jī)則都是小于1MS的延時。另外,在鏡像口收到的icmp response 不很穩(wěn)定,而且是1MS與9MS交替出現(xiàn),表明網(wǎng)絡(luò)是不停在抖動。
鏡像的位置是Windows系統(tǒng)主機(jī)的SW端口,因此在echo response出現(xiàn)的延時可以看做是服務(wù)端響應(yīng)延時,而這個響應(yīng)經(jīng)常會出現(xiàn)9MS的時延。由此驗(yàn)證:該網(wǎng)絡(luò)時延由win主機(jī)的響應(yīng)慢造成。
(責(zé)任編輯:武林網(wǎng))
新聞熱點(diǎn)
疑難解答
圖片精選