業務和管理需求使得數據中心管理和災難恢復的缺陷更加明顯。二十年前,用貨車運輸磁帶進行存儲能滿足需求了。十年前,兩個數據中心的距離只要能進行I/O,能滿足需求。現在,隨著電子商務成為首要的負載,恢復計劃還得考慮數據中心的地理距離,這一點限制了恢復時間。

地理距離與數據中心管理

概念上,這是關于兩個不同位置的數據中心,如圖1所示。在數目也許會擴展到更多站點。


圖1:地理性分離數據中心的示意圖

圖中兩個數據中心是分離的,這對于進行同步磁盤輸入輸出來說,實在太遠了,這導致了很多需求。首先每個數據中心必須得有自己的直接存取存儲設備(Direct Access Storage Device,簡稱DASD)場所來進行管理。第二是同步硬件復制會因為網絡延遲而無法工作。后,距離也意味著,每個數據中心的邏輯分區(logical partition,簡稱LPAR)不能處于同一個Sysplex(Systems Complex,系統聯合體)里面。

網絡在數據中心管理中占了重要位置,是兩個數據中心之間的切換開關。有了合適的內部通訊系統,以后的要求都可以基于不同標準,按路線分給每個數據中心。其實,有了現在基于瀏覽器的應用,用戶可以實現不同數據中心的不間斷切換。

因為硬件復制不可用,數據必須在邏輯數據庫或者訪問方式(access method)的級別上被獲取。有幾個產品可以做這件事。部分產品得通過讀數據庫或Virtual Storage Access Method(簡稱VSAM)記錄來升級。變更投到其他數據中心,通過通信線路使用多種的傳輸協議。在接收端,由另一個軟件發給數據庫或訪問方式命令來完成遠程升級。

為相隔兩地的數據中心配置

分離的數據中心有好幾種方式來配置,能想到的有以下幾種:

Hot-warm

企業中一個數據中心被指派成為所有網絡流量的目標。在第一個數據中心的升級會被復制到第二個數據中心站點,第二個會接收并把這些改變用在本地的DASD場所。一旦第一個數據中心故障,若第二個站點在線,混亂會降至低。

升級-查詢

在升級-查詢的方案中,一個數據中心地區全體升級,而其他只允許查詢。升級的站點為只讀的系統聯合體及時帶來改變。如果升級數據中心失敗,負責查詢的系統聯合體得負全責。

網絡在進行這種安裝時,起決定性作用,它必須能問信息內容,來區分詢問和升級事務。工作站可能也會使用網絡來平衡負載,使每個數據中心能夠帶上屬于自己的只讀流量。

升級-升級

這是個實實在在的事。每個數據中心支持所有數據的所有升級。兩種方式的復制流經通信連接,保持數據庫的同步。一旦發生故障,沒有出問題的數據中心承擔所有即將到來的流量。

注意當兩個數據中心都升級時,數據在邏輯上可能會分離。比如說對用戶的初級數據庫在密西西比河西邊的“A數據中心”,第二個只讀的數據在“B數據中心”。用戶在哪一邊都可能是反向的。終,這意味著網絡必須足夠智能,知道客戶的初級數據在哪。

其他的問題

相信各位深思熟慮的讀者已經想到不少這些問題。但是還有更多令人不安的不穩定因素。

批處理??在升級-升級的模式下,生產量會問題多多。企業得決定哪一方進行批處理,如果批處理兩方都得進行更頭疼了。還得考慮對帶寬的需求,用以從I/O相關批處理事務中擠出空間升級,通過復制鏈接。

復制的延遲??現代通信連接又快有可靠,但還會有問題。算是快完美的通信線也不能和DASD I/O一樣同步和快速。因此,系統基礎架構和一部分應用必須準備好應對延遲和“過時”的數據。

沖突問題??數據庫管理系統(Database Management Systems,簡稱DBMS)在不同的系統聯合體中,不能從太寬的距離鎖定數據庫記錄。這導致在不同數據中心內,相同的數據庫記錄可能會同時升級。基礎設施和應用需要準備好應對混亂。

控制改變??基礎設施、應用和數據庫設計的改變一定得認真管理,避免破壞在不同數據中心復制的一致性。

漂移??沒有異步復制技術在邏輯I/O層面是完美的,企業會發現分叉數據存儲變慢。整理這些不同需要周期性的調和進程。

死亡??對于數據中心來說,什么算死?數據中心通過復制流量和heartbeat來保持聯系。但是復制流量的減慢可能預示著一個數據中心工作做的少了。同樣地,一些遺落的heartbeat也暗示著網絡故障或減慢,而不是數據中心故障。

探查和遵照這些察覺到的故障來行事,要求精心策劃的政策、高度自動化和仔細的管理。好消息是數據中心的地理分離逐漸變得平常,解決這些問題的政策也變得更加便于學習。