RAID內存:回寫技術和熱插拔容量技術
本內容總結了工作中RAID內存的經驗教訓。下面分別介紹了在HP的熱插拔技術中應用到的兩個小技術,它們就是回寫(Scrubbing)技術和熱插拔容量(Hot-Plug Capabilities)技術。
HP熱插拔RAID內存提供了一個回寫硬件方式,它可以確認ECC或RAID檢查出來的軟錯誤。HP技術嘗試定位于在讀內存時檢查出來所有軟錯誤,方法是把改正后的正確的數據寫回內存中去。但此方法不適用于硬錯誤。
回寫技術可以阻止軟錯誤的累積,避免發生更嚴重的錯誤。它降低了ECC的工作量,提高了系統的性能。一些傳統的系統采用的是軟件回寫,HP熱插拔RAID內存使用硬件完成這個工作。
HP熱插拔RAID內存會對錯誤生成錯誤日志,錯誤極限由軟件設定。當記錄的錯誤值達到錯誤極限的時候,軟件會自動做出反應。例如,當超過錯誤極限的時候故障燈會自動亮,這就是由軟件控制的。
熱插拔容量(Hot-Plug Capabilities)技術
HP熱插拔RAID內存還允許用戶在不關閉服務器電源的情況下在線更換、在線擴展及在線升級DIMM,這就是HP的熱插拔容量技術。
在線更換是指在系統運行的情況下更換出現故障的DIMM。HP熱插拔RAID內存不需要操作系統的支持,服務器在購買的時候就具有支持在線更換的能力。在線擴展指用戶在空的插槽上插入DIMM以擴展系統容量。在線升級是指用戶用容量更大的DIMM替代舊的較小容量的DIMM。在線擴展和在線升級都可以使用戶獲得更大的系統內存容量。在線擴展和在線升級要求操作系統的支持,系統要認出新增的內存。
當在線內存操作完成后,如果工作在熱插拔RAID內存模式下,那么系統會自動在所有的內存盒中重新放置數據(rebuild)。雖然這樣做會暫時降低內存的工作性能(重新放置4 GB的數據花費的時間少于30s),但是只需要花費很少的錢就可以提高容錯能力,并可避免系統檢修期間帶來的經濟損失。
評論