XXXXX公司 網絡安全建設建議方案(八)

2014-12-26 12:55:00
dxt001
原創
2645
摘要:多年以來,點線通一直秉承的是顧問式銷售模式,從不采用抄襲方案,所有方案均由公司資深售前工程師或網絡架構師與用戶溝通后進行設計和編寫。歡迎來電咨詢,獲取專業建議和為您定制的方案。

接《XXXXX公司 網絡安全建設建議方案(七)》



6.9.1.2. 用戶對數據備份容災系統的要求

根據我們多年來與用戶的交流,我們總結出以下幾點備份系統設計的基本要求:

1、 為了不增加業務系統的運行壓力,避免數據備份與生產競爭系統資源,數據備份工作   必須在系統運行的最閑時進行。在業務系統正常運行情況下,每天留給所有備份任務的最長備份時間窗口不超過 8 小時,最好能實現“零時間窗口”的備份。

2、 備份系統建設最重要作用是數據丟失后的恢復,但數據恢復的時間長短直接影響業務   系統運行情況,也直接反映了備份系統的可用性。集中備份系統建設要求,最大容量(如 10TB )數據庫物理備份恢復要求在 24 小時內完成。

3、 備份系統作為數據保護最后一道防線,在數據恢復時要求用于恢復的備份數據是百分之百可用。

4、 備份需要占用業務系統的資源開銷。但應充分利用業務系統結構上的技術優勢,使設計出來的備份系統結構能夠減少業務系統資源的開銷,備份系統各資源模塊更加均衡,無明顯的資源瓶頸

5、 備份數據必須有異地存放的副本,并要求減少人為干預,大部分工作必須由備份系統自動完成。特別是如何平衡本地保存備份數據與異地備份數據的關系,需要異地存放的介質如何從備份系統中取出,如何快速準確地取回異地存放的備份數據用于恢復,如何回收異地過期備份數據的介質等問題的解決是備份數據異地存放的關鍵。使備份數據異地存放成為可行的數據容災方案。

6、 備份系統是業務系統正常運行的保障系統,但經常看到實施后的備份系統不但沒有起到業務系統運行的保障作用,反而由于備份系統自身經常性的發生故障而嚴重影響業務系統的正常運行。因此在備份方案和實施過程中,必須要有對各方面資源配置熟悉的專家進行指導各方面參數的配置,避免在備份系統運行過程中造成資源沖突影響業務系統的正常運行。

7、 備份系統建設的目的是為了系統的數據恢復需求,這就要求按配置的備份方案和策略進行備份的數據最終能夠完全用于恢復。這就要求備份方案的實施必須建立在同等環境和系統配置下的備份恢復測試。

8、 所有提供的備份功能模塊都能真正成為備份系統的關鍵,對系統運行保障提供有益的幫助和補充。不要因為某些環節處理不當或方案設計考慮不周全而使得有些功能模塊成為“廢品”甚至“累贅”,確保所設計的方案在投資上最優化。提高磁帶、 NAS 以及 SAN 設備的投資回報率( ROI

9、 備份系統是一個軟硬件結構復雜,涉及到的知識面也很廣,因此對備份系統的管理和維護提出了很高要求。要求提供有涉及到備份方面(包括 ORACLE 數據庫等應用軟件方面)的維護管理的技術支持,和及時的服務響應。

10、               減輕 IT 組織的人力損耗,使 IT 管理員不必對應用實行管理和預防的動作,諸如重啟,恢復和保持應用的活動性等等。通過減少和避免宕機時間來提高業務有效性以達到降低成本的目的。

6.9.1.3. 數據備份系統需求分析

現在我們再來看一看存儲管理系統的具體技術要求。對來說,備份系統不僅僅是要一個自動備份的功能,而是有著更高的要求:

1、 集中管理的備份系統;

對現在的用戶業務系統而言,各個系統集中的專門的管理是提高能效,降低維護成本的必然方式。

2、 快速便捷的災難恢復手段;

對于用戶來說,管理解決方案必須確保即使是在出現重大問題時也要確保最終用戶的不間斷工作。系統連續性要求很高,因此備份軟件應提供一種機制 , 可以使用戶在災難發生后 , 在非常短的時間內恢復服務器和整個網絡上的系統軟件和數據。

3、 備份對業務系統的影響盡可能小;

盡管擁有強壯的連續運行的系統,能夠提供的服務性能也是不同的。對服務水平的高要求帶來了對備份系統的要求。

4、 能夠對各種復雜系統進行高性能的備份;

對于各種行業,其業務系統所使用的存儲結構,數據性質不盡相同,比如 SAN NAS 等等。要求備份系統可全面支持各種存儲架構及備份技術。

5、 對存儲設備的智能管理及更高的設備利用率;      

在很多情況下,硬件設備的投資不斷加大,但其使用率卻不斷降低。使投資獲得最大的回報要求更高的設備使用率和共享能力。同時也要求更高的管理水平。

6.9.1.4. 建設完善的網絡存儲管理系統

建設完善的網絡存儲管理系統需要考慮多方面的因素,基本上可歸為六點:備份硬件、備份軟件、采用何種備份技術、災難恢復、備份策略、管理及維護。

6.9.1.5. 存儲硬件的選擇;

對于選擇什么樣的設備作為備份設備需要考慮用戶具體的業務性質與數據性質。現在常用的備份設備主要是磁帶和磁盤兩種。這兩種設備各有其優劣。磁盤設備的優點是存取數據的速度快、查詢定位快;但是由于是在線設備,導致備份數據的安全性不高,成本也較高。磁帶設備是一種順序設備,讀寫速度也很快,成本低。由于是一種離線設備,備份數據的安全性高。缺點是查找定位的速度慢,而且介質損壞的可能性大。綜合其優缺點,如果用戶數據量很大,改變較少,對恢復的時間要求不高,最好選擇磁帶設備,如果需要備份的數據很碎,并且經常需要恢復,那么磁盤設備是一個好的選擇。當然還可以將兩者結合起來,用磁盤備份進行快速多次備份,再將大容量數據克隆或轉移到磁帶。這樣既有條件縮短備份的時間間隔,也可以提高備份 / 恢復速度,還提高了數據的安全性,對備份系統的性能會是一個很大的提升。

6.9.1.6. 備份軟件的選擇;

備份管理軟件的選擇對于整個系統的性能至關重要。備份軟件不僅要提供良好的備份恢復能力特別是災難恢復能力,簡便的管理方法和技術領先性,還應該具有上節所述的更高的能力。不僅可以勝任目前的備份恢復管理,也提供良好的擴展性與前瞻技術能力。

6.9.1.7. 備份技術

備份技術多種多樣,從根本上可以分為三種:

1)       網絡備份;

通常的備份技術,在備份時會造成網絡資源及服務器資源的占用,影響業務系統性能。

2)       LANFree 備份;

備份時不會占用網絡資源,但仍然要由應用服務器負擔備份數據的傳遞。應用性能會受到影響。

3)       Serverless 備份。

備份對系統是透明的,即不會影響業務系統性能。因此可以消除備份時間的限制,可在白天進行備份,縮短備份時間間隔。是性能最好的備份技術。

一般容易存在一種誤區,即如果是 LAN 環境則使用網絡備份;使用 SAN 的存儲結構則考慮使用 LANFree ServerLess 。其實即使不使用 SAN 的存儲結構也是可以實現 LANFree ServerLess 備份技術的。采用何種備份技術主要取決于用戶的業務性質,數據量和備份時間窗口要求。如果網絡帶寬不能滿足在可提供的時間段內完成所有數據的備份,或網絡壓力大,則必須要使用高級的備份技術。使用 ServerLess 的主要是一些 24x7 的業務,為了不影響服務性能而采用的。只是一般這種備份要求與系統對存儲架構的要求一致,所以 LANFree ServerLess 的備份技術一般在 SAN 架構下實現。

4)       災難恢復;

備份系統必須考慮災難恢復的實現。實際上備份系統本身可以實現所有數據包括系統的恢復,但是時間較長。為了實現快速的災難恢復,可以采用相應的技術手段。但災難恢復計劃不僅是技術實現,而是包含很多內容。比如:全面的災難防范考慮、包括系統信息和恢復步驟等的完整的災難恢復文檔以及定期的災難恢復演習。這些是提高災難恢復速度的更重要的因素。對這些要做全面的考慮。

5)       備份策略

備份策略是備份系統日常工作的準則。備份策略的制定有一定的規律性,也要根據具體的情況。最終目的是為了安全便捷地恢復數據。采用合理的備份策略可以節省備份設備空間并實現快速恢復。

備份過程中要用到大量的存儲介質(本方案中為磁盤系統),隨著時間的推移,介質上備份數據的作用會越來越小,除非要特意恢復到某一歷史時刻的狀態,都會用最新的備份數據來進行恢復。所以在制定備份策略時,要根據數據的運作和使用情況,來確定數據的最長有效期、可容忍的數據丟失時間,從而確定執行備份的時間、每次備份的種類、使用空介質和重用老介質的方法。

數據庫服務器作為重要、寶貴的信息庫,承擔著日常的網絡與數據中樞的角色,其長期運行過程中積累下來的數據具有重要的價值。基于此,對于這些服務器的備份,應從整體、系統、長期的角度來制定備份策略,做到既能快速的進行日常備份,又能完備的保留一定歷史時期內的數據。

對數據進行備份,是出于保證數據的安全性、對系統信息做歷史記錄、在災難發生時恢復系統等多方面考慮的。若要詳細、歷史的記錄數據,并在特定情況下恢復特定時期的數據,就要保證數據備份的頻率、以及備份介質上數據的保存時間符合預期設計的目標。目前,國內外大型企業對資源數據的備份都是每天進行一次的,并且采用完全備份和差量備份結合的方式,給數恢復帶來便利。由于采用了先進的軟、硬件配置,這種日常備份操作都可以在晚間系統負載較輕時定時、自動、快速進行,對系統日間使用不會造成任何影響。

考慮到本系統的具體情況,我們認為做每日備份是極為合理的方案。由于系統中的每臺服務器數據交換和信息更新都極為頻繁,每天都有大量的信息數據、那么做每日備份,記錄每日系統的最新信息是極為必要的。       對系統做完全備份是出于恢復方便考慮,系統管理員不必使用任何其它歷史資料,就可以對系統進行完全恢復,簡單便捷。若是只對應用數據進行備份,那么一但系統崩潰,需要使用最近一次完全備份的磁帶恢復系統,再使用最近一次應用備份的磁帶恢復具體應用,操作及為不便。如果應用在系統配置文件中的一些信息較最近一次完全備份時有所不同,那么即使恢復了系統也難以正常運行,或者造成不可見的故障隱患

備份策略的定義

l 備份的時間選擇

定義好備份資源以后,我們必須根據實際需要配置備份策略。定義備份策略,涉及到以下內容:

在什么時間(備份時間,如下午 6:00 )、

將什么數據(備份內容,數據庫數據)、

以什么方式(備份方式,如全備份或增量備份)

備份到哪一個磁盤設備的哪個目錄

在我們對每一組數據、數據庫都根據需要定義好備份策略后,系統就會自動的按照我們定義的時間、方式、將需要備份的數據備份到我們指定的備份系統中去。

備份的方式

 

全備份

? 每次備份定義的所有數據,優點是恢復快,缺點是備份數據量大,數據多時可能做一次全備份需很長時間

 

增量備份

? 備份自上一次備份以來更新的所有數據,其優點是每次備份的數據量少,缺點是恢復時需要全備份及多份增量備份

 

差分備份

? 備份自上一次全備份以來更新的所有數據。

? 我們可以結合這三種方式,靈活應用。比如:

數據量少時,我們可以每次都用全備份備份數據,這樣,恢復時,只需要指定一個數據源即可。

數據量大時,如果每天作全備份,效率會很低。我們可以結合全備份和增量備份方式。比如每星期作一次全備份(如星期天),其它時間,每天作一個增量備份(如 :星期一到星期六)。恢復時,只要依次恢復最多七個備份介質即可。(如:上周日、星期一、星期二 ...,直到出事前一天的數據。)

數據量特別大時,每星期作全備份對系統的壓力也會很大。這時,我們可以結合全備份、累計增量備份、增量備份三種方式,提供相對效率高,恢復有快的備份手段。比如每個月作一次全備份(如每月初),然后每星期日作一次累計增量備份,其它時間,每天作一次增量備份。恢復時,先恢復月初的全備份,再恢復上周日的累計增量備份,在依次恢復以后每一天的增量備份,如星期一、星期二 ...,直到出事前一天的數據。(最多恢復 8份數據,相對的如果不采用累計增量備份方式,恢復時最多可能需要恢復 31份數據,恢復速度和復雜程度都會不理想)。

 

由此我們認為,對系統進行每日完全備份是必要的,可以更好的提高系統的安全性和可靠性。

 

6)       管理及維護。

良好的管理和維護是保證備份系統良好運行和可靠恢復的保障。它包括資料、管理員和后備的技術支持。

上面所說的完整的災難恢復文檔、恢復演習計劃,還有日常的管理文檔,備份策略等構成了全面的管理資料。這使備份的管理成為制度而不是依賴于某個人;管理員可以確保每日的備份正常安全;而方案建設提供商良好的響應快速的技術支持和維護的重要性則無須贅言。

6.9.2. 方案介紹

我們要構建一個系統的、穩定的、高效率的、開放的、可擴展的備份架構系統,為各種企事業用戶提供專業的數據備份保護服務。

要求能滿足使用各種目前主流操作系統平臺和應用數據庫的用戶對于數據作自動的和計劃外的遠程備份,數據通過城域網傳輸到服務中心的備份服務器上,并通過 SAN 光纖存儲網寫入集中存儲的光纖存儲設備中。

要求還能提供數據的實時同步復制,當遠端的客戶服務器有任何數據改變時能實時的把這些改變的數據內容同步在服務中心的服務器上。

隨著業務的擴大,能動態的進行系統結構擴展,平滑地加入新的客戶服務。

6.9.2.1. 數據備份要求

第一、數據庫服務器操作系統的備份(可選)。

 

由于在數據庫服務器的操作系統中有大量的服務、用戶、系統環境、各類腳本等設置和軟件,一旦出現災難,雖然操作系統安裝是一個可以預料的時間消耗,但是這些設置和軟件卻是很難在短時間內恢復的。如果系統管理員有過更替的話,要將數據庫服務器恢復到災難前基本是十分困難的。而且不論數據庫的數據如何得到了備份保護,要在災難后恢復數據庫的服務操作系統是首先要遇到的問題。因此首先我們要保護的是服務器的操作系統。

 

第二、數據庫中的數據備份

 

在整個用戶的 IT 系統中,特別是像這類的公司,數據庫服務器中的數據包含了很多是十分關鍵的生產數據,一旦出現災難或誤操作,發生了數據丟失的將會造成重大的經濟損失,甚至是事故。因此對于這些數據在發生了意外丟失后能及時的得到恢復將是十分關鍵的,這就需要對這些數據進行十分安全的備份保護。然而數據庫服務器是始終不關機,提供 7 × 24 小時數據庫服務的,因此數據庫是不能關閉來進行備份的,這就對備份軟件提出了能夠進行數據庫在線不關閉情況下的數據備份的高要求。

 

總之對于的數據備份系統建設,應實現以下功能:

 

l 集中化的備份管理;

l 支持多種操作系統、文件系統和數據庫;

l 支持多種備份設備如磁盤、磁帶、光盤等;

l 對各種操作系統與存儲結構具有一致的管理和使用格式;

l 策略化的備份與恢復機制,多種備份策略提供使用的靈活性;

l 智能化的備份設備管理,全面的設備共享能力;

l 全面的災難恢復支持;

l 開放的系統便于升級和擴展;

l 操作簡單明了,使用靈活方便,容易維護;

l   備份系統與硬件無關,硬件改造和升級時,備份系統可不受影響。保護前期的投資;

l 對數據庫可以進行在線不關閉情況下的數據備份。


我們建議使用一臺專用的服務器(或采用現有的一臺業務負荷不大的服務器)來作為備份服務器,在該服務器上安裝備份軟件的服務器端,并且配置管理連接在該服務器磁帶庫或者磁盤陣列,把所有來自數據庫服務器的備份數據寫入磁帶或磁盤。所有整個備份系統的備份內容和備份策略的設置都將在該服務器上進行操作。我們在服務器安裝備份軟件的相應客戶端和數據庫模塊,以此實現對 Oracle 數據庫熱備份。

另外還需要

·                      Oracle 數據庫、服務器上配置 iSCSI 卡驅動軟件,通過 iSCSI 協議訪問磁盤陣列,以保證 block level 的讀寫性能,滿足此類業務密集的 I/O 需求。其訪問權限控制由磁盤陣列綁定服務器網卡的 iSCSI nodename 來進行控制。 ( 其機制類似于網絡中的 MAC 地址綁定 )

·                      數據建立在文件系統上的應用,通過 CIFS NAS )協議訪問磁盤陣列,既能提供更好的性能以及更佳的文件共享功能,又能通過活動目錄服務器( Active Directory Server )進行訪問權限控制。

·                      備份服務器可以通過 CIFS 將數據備份到新的磁盤陣列上,在不改變備份方式的前提下,提高備份速度。

·                      存儲設備我們采用國際知名廠家的高性能的存儲設備。

6.9.3. 方案特點

·                    高可用性

在方案里,所有的構件都采用冗余設計,避免單點故障。

網絡系統為雙路徑 Active-Active 或者 Active-Standby 方式;主機可以采用雙網卡,使用 iSCSI 或者 NAS 協議,通過多路徑方式訪問存儲資源。

本方案中的存儲系統具有 99.998% 的高可用性,采用了雙控制器、全冗余架構;使用 RAID-DP NVRAM Snapshot 技術,可以最大限度地保證數據的高可用性。

·                    RAID-DP 技術,兼顧數據保護和性能

我們知道,在一個 RAID5 組里面,如果出現一個磁盤損壞,系統需要根據別的磁盤上的數據,經過計算后才能恢復壞盤上的數據。這個過程叫做 Rebuild 。在一個繁忙的系統里面,一個 7D+1P RAID5 FC 磁盤磁盤組的 Rebuild 時間,可能達到 7~8 小時;如果是 SATA/FATA 盤,可能長達十幾個小時。因此,在此期間同一 RAID 組內第二個磁盤發生故障的幾率也將大大增加。我們知道, RAID 5 是無法容忍第二個磁盤故障的,這將造成無法挽回的損失。

RAID-DP 技術可以有效地解決這個問題:在幾乎沒有性能損失的前提下,可以容忍同一個 RAID 組內兩個磁盤同時損壞,提供了 10000 倍于 RAID-5 的可靠性。而相對于 RAID1+0 RAID-DP 在空間利用率上的優勢是顯而易見的:以 10 個磁盤組成的 RAID 組為例, RAID-DP 的空間利用率為 80% ,而 RAID1+0 永遠都是 50%

因此,使用 RAID-DP 技術,兼顧了安全、性能和效率,具有最高的性價比,是最佳的選擇。


上圖為本方案磁盤陣列謝數據的機制。在磁盤陣列里面,有一個受電池保護的 NVRAM ,它相當于 NVRAM 相當于 Oracle Redo Log ;只有當 NVRAM 日志寫入后,才會返回數據寫入成功。

l     使用 SnapShot 快照技術,快速地對數據進行備份和恢復

在實際的生產中,有時候為了防止人為錯誤或者其他原因造成的邏輯錯誤(比如誤刪一個表 / 文件或者數據庫),可以使用 SnapShot 定期對數據進行快照備份。和其他的 Mirror 鏡像方式相比,快照方式速度快(秒級,而克隆方式是小時級別),占用空間少(克隆方式是,每一份克隆數據都占用和源數據相同大小的空間),同時也保證了數據的安全性。根據業務數據的重要性和特點,可以為不同的業務數據制定不同的備份周期和策略。比如,對于比較重要的系統,可以選擇每半小時自動生成一個快照副本;而對于不重要的系統,可以選擇一周生成一個快照副本。一旦需要恢復數據時,可以有選擇地進行快速的恢復。而整個恢復過程非常簡單和快捷,只需要在 Windows 資源管理器中完成幾個鼠標點擊。

l     和活動目錄服務器的用戶認證和權限管理集成,簡化了管理方式

本方案中的存儲可以指定由一個活動目錄服務器來控制其用戶認證和資源管理。對于系統管理員來說,可以把存儲看作域里面的一個資源,可以在活動目錄服務器上設置其共享資源、訪問權限以及空間配額。

l     無以倫比的擴展性

隨著業務的增加,數據量的增大,在未來有可能會對系統進行擴容和升級。在加入新的磁盤擴展柜和磁盤時,不能對業務系統產生任何影響。對現有的 RAID 組進行擴容時,由于采用了 RAID-DP 技術,因此不需要重新計算校驗,因此對業務系統的運行毫無影響。如果采用 RAID-5 技術,則需要重新計算校驗,將會對業務的運行產生一定的影響。

如果處理性能不夠而需要升級,存儲系統可以從最低端的產品升級到最高端的產品時只需要更換控制器,不需要做數據遷移。因此具有非常好的擴張性。

6.9.4. NATAPP 存儲產品的優勢

l   支持 FlexVol 技術可在線的動態調配磁盤的分配空間,將磁盤空間的利用率做到最高。節省用戶的投資。

l   支持 RAID10 RAID6 ,可以保證兩塊損壞時的數據恢復。 RAID6 可以保證兩塊損壞時的數據恢復。 另外 NetApp 支持 SyncMirror 技術可以保障在同一個存儲系統里任意 5 塊硬盤故障而不會有數據丟失。

l   采用條帶化磁盤校驗技術對熱點盤的寫次數比通用的技術少一半,大大的延長了熱點磁盤的使用壽命。

l   入門級產品最多支持 56 塊磁盤(采用 750G SATA 磁盤最大容量可擴展到 31TB

l   SnapLock 技術可對數據加鎖,保證數據在任何時候任何人都不能被改動。數據就好像是被寫到光盤上一樣。

l   FlexClone 克隆技術不需要分配多一倍的磁盤空間(只是在克隆卷分離時才需要多一倍的空間),改變的數據才占用空間,因而大大節省了磁盤的投資。

l   快照技術不占用額外的磁盤空間(一份數據最多可有 255 個快照),更改的數據不用再移動,只是指針的改變,所以快照時對生產的影響可以忽略,不管恢復的數據有多大,數據從快照區中恢復的時間都在秒級。

l   同一存儲系統內的主控制器可以靈活的分離,所以不用再增加多一套存儲系統通過 NetApp 業界獨特的 MetroCluster 技術就可以做到存儲的城域( 100 公里 左右)級的容災互備份


7. 設備清單

(。。。略)





發表評論
評論通過審核后顯示。
文章分類
聯系我們
聯系人: 牟經理
電話: 028-85666248
傳真: 028-85666248-8008
Email: business@cd-dxt.com
QQ: 489323802
地址: 成都市二環路西一段80號金科雙楠天都2號樓
福彩3d相年富