Enea Element:高可用性(HA)和嵌入式管理中間件
隨著網絡系統越來越復雜,整個系統的可靠性和可管理性變得越來越重要。
本文引用地址:http://www.j9360.com/article/201609/303642.htm網絡的高可用性包括軟硬件故障的監測和故障恢復,當軟硬件出現異常時通過冗余和狀態同步等方式實現無縫恢復,保證系統業務不間斷。同時還要承擔分布式系統的通訊,調試以及軟件的升級管理。
可管理性主要是針對復雜網絡節點環境(包括基于云端或者NVF的虛擬節點)如何實現北向接口和南向接口的自動通訊,包括配置數據和狀態數據的異步更新和通知機制來實現對整個系統的管理和維護。
Enea Element主要實現了HA要求的分布式管理、高可用性管理、CheckPoint、In Service軟件升級、嵌入式設備管理、機架管理、LOG管理等多種功能。基于Element可以極大地減少用戶部署HA應用的開發維護工作量。
嵌入式管理是針對嵌入式設備而設計的標準的、模塊化的管理系統中間件。對外提供北向接口(Northbound API)和南向接口(Southbound API)分別和運營管理系統、應用程序集成。通過YANG語言進行建模,實現對嵌入式設備的配置數據,運行狀態數據進行實時管理。
Element具有10+年的現場應用成功案例,如成功部署到電信設備、衛星控制和國防軍工等關鍵領域。
Element系統架構
Core Services (核心服務)
l 基于LINX的消息機制:提供一個可靠、高速的進程間通訊機制,和消息發布/訂閱、流控、命名服務的透明傳輸機制。
l 調試框架:提供系統及調試工具。調試工具可以提供可定制命令服務,消息trace跟蹤服務。
l 提供基于網頁和CLI的命令人機接口,可以方便的對整個系統進行配置和監測。
l 系統LOG服務;通用工具:提供通用API框架和數據類型轉換功能。

High Availability (高可用性)
l 出錯管理:提供系統運行監控、狀態檢測、事件驅動策略和故障主動通知功能,AMF框架完全符合SAF B.02.01標準。
l 支持AMF要求的2N,N+M,N-Way,N-Way Active和No Redundancy多種冗余模型組合。
l Checkpoint服務:Element提供一個輕量級的實時數據庫來動態保護系統狀態信息。
l 異常狀態歷史記錄:可以動態記錄系統中各個組件的異常狀況,并以后續分析和跟蹤。
Chassis Management (機架管理)
l 提供符合標準HPI的軟硬件接口,無縫適配業界主流ATCA硬件,并可以支持硬件熱插拔功能。
l 節點管理:提供發現,狀態監控和HPI管理功能。
l 告警服務:提供硬件異常告警功能。
ISU (軟件熱升級功能)
l 提供完整的在線升級功能,在升級過程中避免中斷現有進行中的業務。
l 對Element本身和用戶程序提供無縫的在線升級功能。

Enea 嵌入式管理 (Embedded Management)
Embedded Management針對嵌入式設備而設計的標準的、模塊化的管理系統中間件。對外提供北向接口(Northbound API)和南向接口(Southbound API)分別和運營管理系統、應用程序集成。通過YANG語言進行建模,實現對嵌入式設備的配置數據,運行狀態數據進行實時管理。

北向接口
l CLI:類似于Juniper命令行接口
l XML-RPC:基于http-based XML-RPC
YANG模型
l 基于YANG模型來組織系統配置和數據
l 支持RPC directive
l 支持完備的數據類型
支持Session和AAA認證機制
l 提供mediation layer,支持Session機制
l 集成了AAA驗證機制,提供訪問權限控制
l 提供賬戶審計信息記錄
ACID Transaction Support
l 支持Transaction回滾Rollback操作
l 配置數據冗余存儲,保證配置可靠
配置數據管理
l 配置數據能導出,導入和永久保存
l 支持running和startup兩種配置存儲
南向接口API
l 配置數據,基于配置對象級別的配置更新
l 狀態數據,基于狀態對象級別的配置更新
l 配置數據改變后,通過異步API接口通知應用

Element案例 – uTCA / ATCA / 服務器數據通訊應用
Element for uTCA / ATCA 平臺提供:
l Cluster內部有2塊控制板和4塊高速數據板卡構成6個Node(節點)
l Node間通過高速以太網卡和光纖互聯,軟件通過Enea LINX互聯
l Element對整個系統內組件進行高可用性管理,并通過Checkpoint實現運行狀態備份和恢復
l 系統運行Polyhedra內存數據庫,用于海量數據管理
l Node采用電信級Enea Linux為整個Cluster提供操作系統平臺
l 用戶后臺可以通過CLI或者Web方式對系統進行配置、管理和狀態查詢

Element案例 – Cloud 應用
Element Cloud 平臺提供:
l 配置數據和操作狀態數據配置管理
l 標準SAF高可用冗余方案
l 基于狀態備份的HA功能
l 系統的監控
l 軟件升級管理
l 軟件發布更新
l 基于ACL訪問控制配置操作
基于Cloud的分布式通訊采用LINX over TCP/IP 架構,并實現對OpenStack的集成。

評論