軟交換與承載網關聯性故障分析及應對
近幾年,中國電信運營商都開始大規模建設軟交換網絡。軟交換網絡和傳統PSTN的一個很大區別是從電路交換轉變為分組交換,其承載網絡從傳輸網絡轉變為IP分組網絡。這種轉變在網絡和業務上給運營商帶來各種優勢的同時,也對維護提出了一些新的挑戰。其中,軟交換和承載網關聯性故障的處理就是一個困擾軟交換網絡維護的主要難題。
本文引用地址:http://www.j9360.com/article/193419.htm軟交換和承載網關聯性故障是指故障現象體現在交換側,但實際故障點在IP承載網上網絡故障。軟交換網絡運行中已發生過多次相關故障,故障影響大、處理難,已成為相關維護部門普遍面臨的問題。
關聯性問題分析
目前軟交換網絡和IP承載網仍是松耦合關系,這種松耦合具體體現在兩個方面:首先體現在維護管理上,往往由不同的團隊分專業維護管理,由不同的網管系統監控,且IP網維護時往往只考慮了原有上網和專線數據業務的特點,未考慮話音這種實時業務的特征,其對承載網端到端服務質量的變化,缺乏相應的手段;其次體現在技術上,軟交換網絡在業務層缺乏感知承載網端到端服務質量的有效手段,承載網發生故障或服務質量劣化時,軟交換無法及時準確告警并切換。
由于這種松耦合關系,造成設備和網管上都缺乏詳細準確的告警信息,且故障主要處理人員一般仍為交換專業人員,造成運維人員對故障處理不知如何下手,嚴重影響故障修復的效率。
同時,軟交換網絡相比于原有PSTN網絡,由于采用了IP網絡作為其承載網絡,其在承載和業務故障關聯上也體現出不同的特征,具體如下。
——交換側保護切換能力方面:PSTN網絡中交換機能感知TDM傳輸問題(如中斷、滑碼)并切換,而IP網絡只能感知與承載網物理層中斷情況,不能感知承載網QoS的變化,因而軟交換網絡也無法根據承載網絡QoS變化進行切換。
——承載網保護切換能力方面:PSTN網絡中傳輸設備能根據中斷、滑碼進行保護切換,保護切換能力較強,而IP網絡只能根據物理層中斷進行切換,無法根據QoS變化進行切換,導致IP網絡板卡非中斷故障容易影響軟交換業務。
——故障定位手段方面:TDM網絡中傳輸協議較簡單(主要是物理層),依靠自環等簡單維護手段就能快速定位,而IP網絡中涉及應用層等協議,快速定位軟交換還是IP承載問題較困難,造成軟交換網絡中難以快速區分軟交換還是IP承載故障。
——語音質量方面:PSTN網絡占有話路后即獨享帶寬,而IP網絡中所有用戶共享帶寬,使得基于IP承載的軟交換網絡難以保障語音可靠的帶寬。
——語音傳送的顆粒度方面:PSTN網絡中使用2M和155M的接口傳送業務,顆粒度較小,而基于IP網絡的軟交換網絡流量集中,核心設備多以GE口傳輸,業務顆粒度較大,使得一旦發生承載網故障對業務量的影響巨大。
——網絡維護指標方面:PSTN網絡中定義影響10萬用戶小時即為網絡重大故障,而IP網最高服務標準(金牌客戶)為4小時故障修復時間,使得承載網中認為較小的故障,在軟交換網絡中就提供語音業務而言將成為重大故障。
由于這些差異,相對于原有傳輸網故障對交換網的影響,IP承載網故障時對軟交換網絡的影響更大,且我們不能借用PSTN原有的一些故障處理方法和經驗來處理軟交換和承載網的關聯故障。這就需要維護部門針對軟交換承載特點,從維護作業制度和維護手段創新,一方面盡量降低軟交換和承載關聯故障發生的概率,另一方面提升應對軟交換和承載關聯故障處理的效率。
應對措施建議
軟交換和承載關聯性問題涉及的原因較復雜,許多技術性問題和支撐手段也不可能在短期得到解決,因此建議相關維護部門在不同的階段,根據不同的條件,采取不同的應對措施。
(一)、短期應對措施
短期應對措施的目的是降低軟交換承載故障發生的概率,縮短承載層故障發生后故障處理的時間,避免故障范圍和影響面擴大,建議采取以下措施:
——開展網絡自查,減少故障隱患;
——優化軟交換設備和網管告警信息;
——增強承載網的透明度;
——將軟交換CE設備統一納入數據維護部門統一維護;
——對軟交換和承載網保護切換方式進行梳理,確保其保護切換的協調性;
——總結故障現象,優化故障處理流程,部分故障情況下建議相關部門并行同步處理。
(二)、中期應對措施
中期應對措施的目的是對于承載網絡質量和故障能做到監測系統自動發現、實時告警,維護人員主動處理,在大范圍用戶受影響前業務能恢復正常。主要方式有建立承載層的全程質量監測系統和軟交換綜合告警系統。
——建立承載層的全程質量監測系統針對現有承載網缺乏端到端服務質量監控手段的問題,建議通過部署探頭的方式,建設承載層的全程質量監測系統,對軟交換承載網端到端連通性及服務質量進行實時監測。
——建立軟交換綜合告警系統目前現網軟交換和承載網通過各自的網管系統對設備實施管理,系統告警僅輸出至自身網管,在發生問題時,維護人員需要綜合查看多個系統后進行故障關聯分析判斷,影響故障處理速度。針對該問題,建議建設軟交換綜合告警系統,將軟交換設備和承載網設備以及信令監控、承載監控等輔助系統的告警予以集中呈現,并將實現軟交換和承載網故障關聯,在網絡發生問題時能將故障點快速呈現,引導維護人員及時處理。
(三)、遠期應對措施
遠期應對措施的目的是對于網絡故障承載層設備能自動發現、實時告警、自動切換,將影響面降到最小。主要措施有:
——在軟交換業務全程質量監測系統的基礎上,增加對設備切換控制功能,使其能夠通過檢測結果,控制軟交換系統和承載網設備的切換。
——要求承載網設備廠商根據所承載的實時性業務(如語音、傳真、視頻、IPTV等)的特點改進設備,提供流量監測、流量控制、網絡指標監視、告警通知、路由自動切換等方面的功能。
分組網的承載方式增加了軟交換網絡維護的難度,但我們也不能由于這些維護上的困難否定軟交換網絡的應用成果,目前維護部門可通過故障處理方法的完善和維護經驗積累減少故障發生的概率,提高故障處理效率。但最終要解決承載網故障對軟交換業務的影響,還需要不斷完善軟交換系統,使其能感知承載網故障和服務質量的變化,從而在發生承載網故障時能快速切換,減少對業務的影響。
評論