多手段保證LTE承載網可靠性
1、可靠性概述
電信級運營網絡對可靠性需求可分為三個層面:設備可靠性、網絡可靠性和業務可靠性。在承載網中,網絡和設備的可用性要求達到99.999%(這相當于設備在一年的連續運行中,因各種可能原因造成停機維護的時間少于5分鐘),高可靠性是電信運營商網絡建設和網絡運營的基本要求。
在網絡架構不斷演進中可靠性的要求一直貫穿其中,可以說可靠性是網絡的必備特性。可靠性保證網絡發生故障時以最快的速度進行保護倒換,使得運營商的損失降到最低。
LTE承載網定位于綜合承載,實現2G、3G、LTE移動業務、固定業務的綜合接入,業務的多樣化使得網絡承載技術變得錯綜復雜,對網絡的高可靠性要求成為必然。
如上圖所示,在LTE階段,承載網絡架構發生了很大變化。由于EPC高置,即EPC只部署在省會或者大型城市,使得基站和EPC之間的承載網絡需要跨越回傳+Core兩層網絡。
LTE業務對時延要求更加嚴格,對于LTE承載網來說,無法控制無線側和核心網側的時延,只能控制承載網絡的時延,如何保證LTE業務時延滿足要求關系到LTE業務是否能夠正常運營,可靠性部署勢在必行。
如上圖所示,對于應用層來說,TCP的滑動窗口和其三次握手接收數據確認機制,導致TCP連接的吞吐量與端到端時延成反比。當TCP傳輸路徑發生故障時,TCP啟用重傳機制,如果長時間得不到倒換路徑,會導致連接中斷。
LTE時代數據業務激增,網絡設備提供的端口從GE到10GE、100GE不斷增加,當數據速率到Gbit數量級時,長時間不能切換代表著大量數據的丟失,對于語音、視頻等業務來說,這幾乎是致命的。
可靠性技術可以保證在最短時間內切換到保護路徑,不會出現連接中斷的情況。這對于運營商來說,無疑是保證用戶體驗的必然選擇。
可靠性技術可以分為快速檢測和保護倒換技術兩個方面來進行部署,二者相輔相成共同為網絡高可靠性提供保證。
1.1快速檢測技術
網絡設備一個越來越重要的特征是,要求對相鄰系統之間通信故障進行快速檢測,保證出現故障時可以更快的建立起替代通道或倒換到其他鏈路。
目前,一些硬件如SDH等可以提供這個功能,但是對于很多硬件或者軟件無法提供這個功能,比如以太網。還有一些無法實現路徑檢測,比如轉發引擎或者接口等,因此無法實現端到端的檢測。
目前的網絡一般采用慢Hello機制,尤其是路由協議在沒有硬件幫助下,檢測時間會很長(例如:OSPF需要2秒的檢測時間,ISIS需要1秒的檢測時間)。這對某些應用來說時間太長了,當數據速率到Gbit數量級時,缺陷感應時間長代表著大量數據的丟失,并且對于不運行路由協議的節點沒有辦法檢測鏈路的狀態。同時,在現有的IP網絡中并不具備秒以下的間歇性故障修復功能,而傳統路由架構在對實時應用(如語音)進行準確故障檢測方面能力有限。
快速檢測技術的出現解決了上述問題,典型的快速檢測技術包括BFD、Eth OAM、MPLS OAM等。這些快速檢測技術通過相鄰設備間ms級進行檢測報文的發送和接收,當到達配置的間隔收不到對端的報文時即上報故障,通知設備進行相應的協議倒換。
1.2保護倒換技術
網絡設備通過快速檢測技術檢測到故障后,配合保護倒換技術進行相應協議的倒換。保護倒換技術即在事先建立好備用通道供設備進行倒換,針對不同的承載技術需要部署相應的保護倒換技術。
針對LTE網絡,保護倒換技術按照業務部署可以分類為L2VPN類、L3VPN類、網關類、鏈路類保護倒換技術。L2VPN類保護倒換技術主要是PW冗余,L3VPN類保護倒換技術主要是VPN FRR,網關類保護保護技術為E-VRRP,鏈路類保護倒換技術包括LDP FRR、混合FRR、TE FRR和TE HSB.
2、LTE承載網可靠性技術
下面的章節將針對中國電信和中國聯通在LTE承載網建設中涉及到的可靠性技術進一步進行詳細介紹。
2.1中國電信LTE承載網可靠性技術
中國電信在建設IPRAN網絡時,主流場景是依托于現有的城域網進行建設,也存在端到端新建的IPRAN網絡。在演進到LTE承載組網時,沒有EPC機房的地市需要向上跨過CN2到省會或者大區城市EPC機房進行業務落地。
中國電信的LTE承載網架構和承載方式如上圖所示,本地網仍然采用IPRAN的承載方式(即PW+L3VPN),只是非省會城市需要途徑CN2省干網絡到省會或者大區的EPC機房落地業務。
為了敘述方便,拓撲圖簡化如下:
對于省會或者大區城市(EPC所在地),RAN ER直接上聯至EPC CE設備即可;對于非省會城市(沒有EPC),RAN ER設備需要和CN2的本地落地PE設備相連,由CN2調度到EPC CE設備然后到EPC進行業務落地。
PW+L3VPN方案的設計理念為接入層通過一種技術PW實現所有業務的接入,降低接入層的維護復雜度,以及維護人員的技能要求,到達匯聚路由器后再進入L3VPN轉發。
對于省會或者大區城市(EPC所在地),業務承載如下圖所示:
如上圖所示,接入層建立二層管道PW,匯聚路由器以上起L3VPN,通過內部環回接口實現PW與L3VPN的橋接。通常一個接入環會雙掛兩臺匯聚路由器,匯聚路由器作為基站的三層網關,此時需要為兩臺匯聚路由器三層內部環回接口設置相同的MAC和IP,實現雙網關保護。
PW+L3VPN同時采用二層PW及三層VPN技術,相應的保護方案也是兩種技術保護方案的組合。
按照保護模式可以分為隧道保護、業務保護及網關保護三類:
1)隧道保護
用于網絡內部鏈路及節點故障,特征是保護倒換前后業務源宿節點不變,相應的保護技術為LDP快速收斂、LSP 1:1、TE FRR,檢測技術為BFD for IGP/LSP.
2)業務保護
用于匯聚路由器、RAN ER以及EPC CE節點故障,特征是保護前后業務源宿節點(包括PW與L3VPN的橋接點)發生變化,相應的保護技術為PW Redundancy和VPN FRR,檢測技術分別為BFD for PW和BFD for Tunnel.
3)網關保護
用于EPC CE及EPC與EPC CE之間的鏈路故障,相應的保護技術為E-VRRP.
2.2中國聯通LTE承載網可靠性技術
中國聯通在建立IPRAN網絡時,主流場景是端到端新建的IPRAN網絡,也存在依托于現有的城域網進行建設。
中國聯通的LTE承載網架構和承載方式如下圖所示,本地網仍然采用IPRAN的承載方式(即HVPN),只是非省會城市需要途徑聯通B網省干到省會或者大區的EPC機房落地業務。
為了敘述方便,拓撲圖簡化如下:
HVPN(Hierarchy VPN)在傳統端到端L3VPN的基礎上進行了適當優化,通過引入一層“輕量級RR”來緩解核心側設備壓力,解決組建大網的問題。具體方案為:
將匯聚路由器設為“第二級RR”,接入路由器與匯聚路由器建立BGP會話,由于匯聚路由器下掛接入路由器數量有限,因此匯聚路由器上BGP會話壓力不大;匯聚路由器與城域骨干RR建立BGP會話,相比接入路由器,整網的匯聚路由器數量大大降低,相應的RR的BGP會話壓力也大大降低。匯聚路由器收到接入路由器發布的VPNv4路由后,將下一跳修改為自己之后再發布給RR,之后再由RR反射給EPC CE,因此EPC CE有整網明細路由;匯聚路由器收到的VPNv4路由均不向接入路由器發布,僅向接入路由器發布一條缺省路由,用于引導上行流量,由此,接入路由器僅需維護極少的VPN路由,路由壓力較大的問題得以徹底解決。由于VPN采用分層的方式,相應的用于承載VPN的隧道也需要采用分層的方式,接入路由器與匯聚路由器之間為一段隧道,匯聚路由器與EPC CE設備之間為另一段隧道,EPC CE的隧道數量較多的問題也不復存在。
通過上述方案,HVPN解決了傳統端到端L3VPN的擴展性問題,保證了低端設備與高端設備共同組大網的能力。
對于省會或者大區城市(EPC所在地),核心層設備直接上聯至EPC CE設備即可;對于非省會城市(沒有EPC),核心層設備需要和B網的本地落地PE設備相連,由B網調度到EPC CE設備然后到EPC進行業務落地。
對于省會或者大區城市(EPC所在地),業務承載如下圖所示:
L3VPN到邊緣的業務保護方案非常完備,可以分為隧道保護、業務保護及網關保護三種模式,隧道保護用于網絡內部鏈路及節點故障,特征是保護倒換前后業務源宿節點不變,相應的保護技術為LSP 1:1,檢測技術為BFD for LSP;業務保護用于匯聚路由器及EPC CE節點故障,特征是保護前后業務源宿節點(包括兩段L3VPN的銜接點)發生變化,相應的保護技術為VPN FRR,檢測技術為BFD for Tunnel;網關保護用于EPC CE及EPC與EPC CE之間的鏈路故障,相應的保護技術為E-VRRP.
2.3快速檢測技術
雙向轉發檢測BFD(Bidirectional Forwarding Detection)用于快速檢測系統之間的通信故障,并在出現故障時通知上層應用。
BFD for PW是一種對PW進行故障檢測的機制,用于觸發所承載業務的快速切換,達到業務保護的目的。利用BFD完成隧道或PW故障的快速檢測,從而引導所承載業務的快速切換,達到業務保護的目的。
BFD For TE是MPLS TE中的一種端到端的快速檢測機制,用于快速檢測隧道所經過的路徑(包括鏈路和節點)中所發生的故障。
TE傳統的檢測機制包括RSVP Hello或者RSVP刷新超時等檢測,都具有檢測速度緩慢的缺點。BFD檢測機制很好的克服了這些缺點,它采用快速收發報文的機制,完成這些隧道路徑故障的快速檢測,從而觸發承載業務的快速切換,達到保護業務的目的。
在LSP隧道上建立BFD會話,利用BFD檢測機制快速檢測LSP隧道的故障,可以提供端到端的保護。BFD可以用來檢測MPLS LSP轉發路徑上數據平面的故障。使用BFD檢測單向LSP路徑時,反向鏈路可以是IP鏈路、LSP.
3、總結
為了建設一張高可靠性的LTE網絡,華為公司針對各種業務提供了端到端的可靠性保護方案,保證業務順暢,同時在故障發生后能以最快的速度進行保護倒換,把運營商損失降到最低。
在快速檢測方面,華為公司較早實現的BFD for everything,可以針對端口、鏈路、LSP、TE-LSP、VPN、PWE3等等進行快速檢測,保證在故障發生的第一時間通知相關模塊進行快速倒換。
在故障倒換方面,華為公司配合快速檢測,推出了針對LTE場景的各種保護技術,如PW冗余、VPN FRR、混合FRR、TE HSB、VRRP等,已經在現網中廣泛應用,為運營商的無線和有線業務保駕護航。
評論