故障回放
單位培訓中心機房共有36臺普通工作站,2臺考試專用服務器,通過三臺交換機連接在一起組成一個中等規模的培訓、考試網絡,其中有一臺思科WS-C2950sx-24型號的交換機作為局域網的主交換機,另外兩臺D-Link DES-1024D型號的交換機作為局域網的次交換機,每臺次交換機中同時連接了18臺普通工作站,而每一臺次交換機又都級連到局域網中的主交換機中,2臺考試專用服務器直接連接到局域網主交換機中,局域網中所有計算機均通過主交換機連接到外網中(如圖1所示)。
圖1
近日,培訓中心機房的一部分普通工作站忽然全部不能訪問考試專用服務器了,另外一部分工作站卻能夠正常訪問到服務器中的內容,筆者趕到機房接線柜旁,對其中的網絡連接設備進行了一番仔細檢查,發現某一臺次交換機控制面板中的所有信號燈處于全亮不閃爍狀態,很明顯連接到這臺交換機中的所有普通工作站自然就出現網絡不通的現象了。
故障排除
再次返回到機房接線柜旁時,筆者看到先前出現問題的那臺交換機現在又好象處于癱瘓狀態了,這難道是局域網中的網絡病毒“惹”的禍?雖然筆者知道局域網中用于教學、培訓的普通工作站中肯定存在這樣或那樣的病毒程序,但假如真是病毒程序“惹”的禍的話,與該故障交換機型號相同、連接方式也相同的另外一臺次級交換機也應該出現相同的故障才對(如圖2所示),可現在另外一臺次級交換機工作狀態很正常,連接到這一臺交換機中的所有工作站也都能正常訪問服務器;根據這一比較,筆者幾乎斷定交換機癱瘓現象是由于先前的交換機自身碰到了硬件故障引起的。 圖2
由于交換機硬件故障主要包括端口、電源、模塊、背板等部件的故障,于是筆者就從這幾個方面對故障交換機進行了逐一檢查。在排除端口因素時,筆者認為端口故障至多是一個或幾個端口可能會被損壞,不可能在某一時刻交換機中的所有端口都會發生損壞,因此筆者推斷交換機硬件故障不應該出在端口位置處;在檢查電源時,筆者發現該故障交換機和另外一臺次級交換機連接到相同的電源插座上,也就是這兩臺交換機的電源輸入完全是一樣的,但現在有一臺交換機能夠正常工作,這表明電源輸入也不應該出現問題。在排除了端口和電源因素后,筆者估計交換機的硬件故障很可能發生在模塊或背板部件處,而對于這類硬件故障我們普通用戶唯一能做的就是重新更換新的交換機了。
由于手頭沒有其他空閑的交換機可以使用,筆者只好將那臺故障交換機電源暫時斷開,預備向領導匯報之后購買回新的交換機再說。趁那些工作站不能上網的間隙,筆者打算對所有工作站進行一下病毒“絞殺”操作,以便讓它們以全新的面貌迎接新交換機的到來。在經過漫長一段時間的病毒查殺之后,筆者果然發現網絡中的確存在不少病毒,偶然之間筆者看到其中一個比較熟悉,到網上查閱該病毒的相關資料時,發現該病毒能夠造成廣播風暴;于是筆者心中忽然想出這樣一個念頭,會不會是廣播風暴導致那臺故障交換機頻繁發生癱瘓現象呢?現在病毒已經被全部被清除了,那臺故障交換機會不會還出現癱瘓現象呢?抱著試一試的心態,筆者重新接通了那臺故障交換機的電源,剛開始交換機的運行狀態很正常,但筆者擔心時間一長交換機又會繼續“癱瘓”,于是特地在交換機旁呆了半個多小時,以便及時觀察交換機運行狀態的變化,可是半個多小時過去了,交換機控制面板中的信號燈狀態仍然一切正常,筆者此時有一種直覺認為交換機的癱瘓現象不會再發生了,果然當筆者第二天再次來到培訓中心機房時,看到那臺故障交換機信號燈一切正常而且始終保持穩定狀態,至此交換機癱瘓現象得到了徹底解決。
故障總結
總結上面的故障排除過程,筆者認為要想確保局域網始終能夠穩定、高效地運行,必須在組網之前挑選自身性能好、緩存容量大的交換機產品,以便提高交換機自身的抗干擾能力。另外,為了盡可能地避免網絡發生廣播風暴現象,我們應該在網絡中的每臺計算機中安裝殺毒軟件,并定期執行清除病毒操作。
排除經驗
在長時間、高負荷地運行之后,網絡中的交換機往往會不可避免地出現各種各樣的故障現象,那碰到故障現象時假如都毫無頭緒地隨意排查的話,故障解決效率肯定不會很高。事實上,我們只要把握了合理的故障排除順序,完全能夠有效地提高故障排除效率;一般來說,當交換機碰到故障現象時,我們可以嘗試按照下面的順序進行逐一排查:
首先按照由遠到近的線路連接順序進行排查,因為交換機存在的多數故障往往都是通過與其直接相連的工作站而發現的,所以我們在排查故障時盡可能地按照“終端工作站-連接線纜-端口模塊-網絡跳線-交換機”這樣的順序依次檢查。
按照上面的順序排查之后,假如確認交換機的確存在故障的話,那我們接著就要按照由外而內的順序來檢查交換機設備了。我們不妨先從交換機控制面板中的各種信號燈來辨別,并依照信號燈的故障指示,檢查交換機內部對應部件是否發生了故障。例如,交換機的Link信號燈要是處于熄滅狀態,那就表明對應端口沒有連接好或者該端口存在問題,要是Link信號燈處于綠色閃爍狀態,那就表示交換機當前處于100 Mb/s數據傳輸狀態,要是Link信號燈處于黃色閃爍狀態,那就說明交換機此刻正處于10 Mb/s數據傳輸狀態;要是交換機的Power信號燈處于綠色常亮狀態,那就表示交換機的電源供給一切正常,要是處于熄滅狀態就說明沒有電源供給。
當確認交換機內部存在故障時,我們肯定不會輕易地動手去拆卸交換機,因此在檢查內部故障時,我們應該先從系統程序或參數配置上著手來排查。要是參數配置或系統程序沒有問題的話,那幾乎就能斷定是硬件有問題了。比方說,某個端口不能正常使用時,那我們不妨先檢查一下指定工作站所連的端口是否在對應的VLAN中,或者檢查一下指定端口是否已經被其他的治理員關閉掉了等。
當然,在實際排查交換機故障的過程中,我們經常會碰到一些相當復雜的故障,此時我們盡量按照先易后難的順序,來從系統配置或簡單操作下手,來逐步分析、排查故障,相信這樣能夠提高故障的解決速度和故障排除效率。
新聞熱點
疑難解答