如何利用基于云的歸檔解決備份難題
這種解決方案的問題在于,它們給用戶造成了一種貌似安全的假象,導致用戶將大筆投資放在看似精密的解決方案和基礎架構上。這個問題的根源是,有 大量的數據根本不需要進行備份。根據最新的數據研究顯示,大多數數據中心的主存儲設備都保存著未來6個月到1年之內不會被訪問的靜態數據。在 很多數據中心中,這種靜態數據所占比例甚至高達80%。
靜態數據問題的影響
大多數數據中心每周或者每個月對整個環境進行一次完全備份。這意味著每次完全備份完成之后,網絡中遷移和在備份目標中保存的數據中有80%在過 去一年都是沒有任何變化的。這個事實使得重復數據刪除設備在市場中脫穎而出,這種設備使用塊層級的認證來刪除冗余信息。
然而有一個挑戰是,這些重復數據刪除設備并不能解決仍然要在網絡中遷移所有數據的問題。因此,實際上這些設備只能對備份存儲起到幫助作用。盡管 它們是基于磁盤的,但只能大幅度縮短備份所需的時間。除此之外仍然需要在網絡基礎架構方面的投資,而這可能是很復雜且高成本的。
盡管人們在網絡基礎架構方面有投資的預算和意向,但是仍然存在著為備份準備所有文件的問題。在備份過程中,應用需要對每份文件進行檢查,看它自 最近一次備份以來是否發生過變更。這個過程是非常耗費時間的,尤其是那些保存了大量文件的服務器。
另外還有保留方面的問題。在大多數備份系統中,“重要”數據中往往混合著真正“關鍵”的數據,而真正“關鍵”的數據中又混合著法規遵從所需的數 據。在大多數環境中,不同形式的數據往往具有不同的價值。有時候我們保存這些數據是為了法規遵從,有時候是為了企業內部監管。當所有這些數據與備份數據集混合在一起的時候,我們就很難制訂專 門的保留規劃。因此,大多數企業機構決定將所有數據保存超過必須保存的時間期限,而這進一步加重了負擔。這使得數據恢復就像是大海撈針。
最后是找回問題,這也是實時備份的最主要原因。所有靜態數據與動態數據都是混合在一起的,因此這就會延長恢復數據所需的時間。例如,將一臺服務 器恢復在初始狀態可能需要恢復1TB的數據,而實際上真正需要的數據也許只有200GB。不管使用什么技術,恢復200GB數據總要比恢復1TB數據快 吧。如果除去這些靜態數據的話,那么以前需要幾天時間的恢復現在可能只要幾小時就可以完成了。
利用歸檔解決靜態數據難題
解決靜態數據難題的最簡單方法就是去掉靜態數據,也就是將靜態數據從主存儲中遷移出來。假設一個環境中的所有靜態數據被刪除,那么將會釋放大約 80%的空間。即使不會完全停止存儲采購,這種方法也可以大幅加快備份和恢復流程。對于上面那個1TB數據的例子來說,對200GB數據進行掃描、遷移和 保存要比1TB數據容易得多了。
當然對于大多數企業機構來說,刪除80%的數據不僅是不切實際的,還有可能是非法的。這里我們需要其他的方法:歸檔存儲。通過創建一個歸檔存儲 層,IT經理可以將靜態數據集從主存儲和備份流程中排除掉。因為是單獨保存這些數據的,所以可以制訂單獨的保存策略。備份流程不再需要檢查那么多的文件來 決定他們的備份需求。這樣,不僅備份和恢復流程進一步完善了,在備份硬件和網絡基礎架構方面的投資也大幅度減少了。
歸檔并不是一個新理念。自從第一臺大型主機問世以來,歸檔就一直是卸載主存儲、減少備份流程負載的一種方法。開放存儲和Windows平臺很少 使用這種技術。最主要的挑戰是,大多數歸檔都是基于磁帶的。這種歸檔需要有復雜且定制的軟件以及客戶代理。而且,從歸檔中恢復數據以及在基于磁盤的歸檔中 分類數據也都是非常具有挑戰性的。
在最近幾年中,廠商們開發出來基于磁盤的歸檔技術來克服這種局限性。這種歸檔存儲便于訪問(通常通過NFS或者CFS加載點)、易于索引并提供了磁帶系統無法做到的快速恢復。此外這種歸檔存儲還通過提供更高的可 擴展性和可靠性解決了使用廉價磁盤陣列的局限性。
磁盤歸檔的挑戰
基于磁盤的歸檔也有自身的缺點。一些磁盤歸檔提供了“類似于磁帶”的可擴展性,通過使用1U服務器或 者互連存儲組成的集群架構實現了這種可擴展性。典型的存儲集群在添加節點數量方面是有限制的,所有這些都需要電力、空間和冷卻資源的支持,而這會進一步增 加成本。
另外,在很多情況下這些系統需要從一個相對大規模的節點部署起步。通常初始容量要求在25TB或者更高,而這對于小型和中型企業來說往往是不切實際的。
最后,在歸檔存儲中,磁盤或者磁帶仍然需要管理。我們需要創建、分配和監控存儲來確保一切正常,不需要維護或者升級。考慮到目前IT人員的縮 減,盡管磁盤歸檔可以帶來諸多好處,但是企業機構可能沒有足夠的人員來執行這些任務。
利用云存儲作為歸檔
有一個可行的選擇,那就是云存儲。使用云存儲作為歸檔可以為用戶帶來很多好處。要想把云存儲作為歸檔的話,大多數企業機構應該尋找這樣的解決方案:即使用了本地設備將最近歸檔數據緩存在本地磁盤以便快速恢復、然后將數據 遷移到云存儲中作為長期保存。因為大多數云歸檔解決方案都是付費即用型的,所以這對于規模最小的企業也是一個可行的選擇。
此外,一些云歸檔系統可以直接從API集中寫入。例如,有些存儲廠商與獨立軟件供應商合作,允許云歸檔直接與他們的應用進行集成。這是推動將數 據保存到歸檔存儲中的一個理想點。對于用戶來說,信息仍然保持最新,提供了關于歸檔數據集的智能性,同時應用也可以起到幫助作用。
云歸檔還解決了其他歸檔形式可能給IT員工帶來的操作問題。因為所有物理存儲都是外包的,因此數據集管理所需時間為零。此外,這也不需要消耗企 業機構的能源、空間或者冷卻資源。單是這一點就證明了對云歸檔的投資是合理的,而其他歸檔解決方案則無法提供這項保證。
發布者:博子
評論