E14 應急計劃
14.1 Contingency Planning
應急計劃
應急計劃或業務持續性計劃的目的是當組織及其信息系統在災難事件發生時,能夠減少或避免關鍵業務中斷,保證組織生存且持續運營。應急計劃應納入企業IT總體規劃,并成為企業風險管理框架的組成部分。
保證企業的業務持續性是最高管理層的職責,應急計劃的制定不是某個人或某個部門的事情,必須組成一個團隊,該團隊及其領導人應具有足夠的權威,能夠和相關部門和人員進行充分的溝通。應定期對員工進行風險管理培訓,并使每一個人明確其在業務持續性計劃中所承擔的角色和責任。
完整的應急計劃實施包括業務影響分析和目標設定、運行分類和重要性分析、計劃制定、計劃測試和實施、檢測:
◆ 業務影響分析(BIA)是制定應急計劃的首發步驟,它對每一種可能影響企業正常運營的潛在風險,如火災、洪水、颶風、系統崩潰、數據丟失、黑客攻擊和恐怖襲擊等事件發生的可能性及后果進行評估。
◆ 確定風險后,應根據不同業務可以承受的后果(如宕機時間、恢復成本)對業務進行分類和重要性分析,以此來制定不同類別業務的保護級別和恢復順序。不同的組織擁有不同的業務分類和優先級,以下是一種可能的分類:
■ 關鍵(Critical)系統:遠程通信和核心處理,如訂單處理、開票和發運
■ 重要(Vital)系統:財務(應收/應付、總賬)和客服。
■ 敏感(Sensititive)系統:薪資和終端用戶數據。
■ 非關鍵(Noncritical)系統:人力資源、預算和采購。
◆ 制定計劃:應急計劃應該考慮到方方面面,如備份和恢復的技術手段、財產保險、人員角色和通信方式、恢復階段的員工交通和生活設施等。以下是恢復計劃中應包括的若干內容:
■ 簡明介紹
■ 團隊職責列表和緊急聯系方式
■ 備份計劃和異地備份的地點
■ 問題升級的流程
■ 行動計劃,包括恢復的時間期限、恢復策略以及關于硬件、軟件、網絡和遠程通信的分類計劃
■ 保險文件
◆ 測試和實施計劃: 計劃有效性的最佳證據是對計劃進行了成功的測試。最好的測試是在生產環境,并且擁有同等規模的業務量情況下完成的。有些業務系統可能無法進行全面的實戰性測試,只能進行模擬中斷測試和紙面上的串行測試,此時應精心設計測試環境,使之盡可能接近實際環境。
◆ 監測:最好的計劃如果不進行更新也會過時,當組織的結構和運營發生改變時,災難恢復計劃必須隨之改變,以保證恢復計劃的及時、有效。
14.2 Backup & Recovery Technologies and Facilities
備份恢復技術和設施
故障弱化保護(fail—soft protection)是發生緊急故障時的第一道屏障,當系統發生自身故障時,故障弱化保護控制可將故障的影響限制在一定范圍內,或僅導致系統性能的下降。故障弱化技術包括:
磁盤冗余磁盤陣列RAID:將多只容量較小的、相對廉價的硬盤驅動器進行有機組合,使其性能超過一只昂貴的大硬盤,并且當其中一塊或幾塊硬盤發生故障時,只會降低讀寫速度而不會丟失數據。 RAID技術使用三種冗余技術:鏡像、校驗和條帶集。
虛擬存儲:存儲虛擬化概念是將多個物理存儲設備結合成一個邏輯虛擬存儲設備的方法,存儲虛擬化的好處是存儲設備可以在無需中斷系統的情況下調整。
服務器雙機熱備:兩臺服務器同時運行相同或不同的任務,當其中一臺服務器故障時,另一臺可以接管其關鍵任務,從而保證關鍵任務的不間斷運行。
負載均衡/服務器集群:通過負載均衡,流量可以被動態分配到一組運行相同應用程序的服務器組中的不同服務器上,這樣可以避免某臺服務器過載,也可以確保在某一臺服務器故障時,不會停機。
數據異地備份是防止系統故障或重大災難時的數據保存手段,根據備份數據的產生方式可分為脫機和聯機備份,根據備份數據的存放地點和防災難級別可分為異樓備份(防火災)、異城備份(防地震、洪水)、跨國備份(防戰爭)。
◆ 脫機異地備份:利用磁帶機,定期對數據進行備份(全備份或增量備份)后通過物理手段送至存放地。
◆ 聯機異地備份:通過網絡進行聯機實時備份。
■ 電子鏈接——通過電子線路自動傳送數據備份和實現數據的自動恢復。
■ 遠程日志——通過電子線路自動傳送處理日志和實現數據的自動恢復(通過重新執行處理日志中記錄的處理)。
信息設施異地冗余是防止系統故障或重大災難時的信息設施恢復手段,以下是幾類異地冗余信息設施或方法:
熱站(Hot Site):提供從機房環境、網絡、主機、操作系統、數據庫、通信等各方面的全部配置,災難發生后,一般幾個小時就可以使業務系統恢復運行。啟用時,只需操作人員到位并安裝應用程序、數據與文件即可運行。
溫站(Warm Site):只配備了部分設備,通常沒有主機,只提供網絡連接和一些外部設備(如:磁盤驅動器、磁帶驅動與控制器、UPS設備等)。安裝計算機或其他所缺少的設備可能要花幾天時間。
冷站(Cold Site):為降低成本,冷站只提供支持信息處理設施運行的基本環境(如電線、空調、場地等)。災難發生時,所有設備都必須運送到站點上,要從基礎設施開始安裝,因此故障恢復時間可能會很長,可能要幾周時間。
冗余信息處理設施:冗余信息處理設施是組織自己配備的、專用的恢復站點,用來對關鍵應用系統進行備份與恢復。
移動站點:移動站點是一種特別設計的拖車式計算設備,它可以快速地轉移到業務部門或到恢復站點。
組織之間簽訂互惠協議:組織之間簽訂互惠協議是指具有相同設備與應用系統的兩個組織或多個組織之間互相為對方建立備份的方法。
相關推薦:國際注冊內審師考試《經營分析和信息技術》講義匯總
新添考試應用:
①資訊訂閱,查詢最新考試信息②章節習題 海量套題全免費體驗!!
典型試題
1.良好的計劃可以幫助組織在處理中斷之后恢復計算機操作。良好的災難恢復計劃應該確保
a.備份/重啟程序已嵌入作業流和程序中。
b.變更控制程序不會被操作人員所繞過。
c.對設備工作能力的變更計劃與設計好的工作量相容。
d.與應用程序所有者達成服務級別的書面協議。
『正確答案』a
『解題思路』
a.正確。備份/重啟程序是一個災難恢復計劃的構成要素。
b.不正確。設計災難恢復計劃時無需關心變更控制程序的有效性。
c.不正確。設計災難恢復計劃時無需關心設備能力的變更計劃是否與設計好的工作量相容。
d.不正確。與應用程序所有者達成服務級別的書面協議雖然十分必要,但這與災難恢復計劃沒有關系。
2.某公司的應用系統必須24小時工作。公司高級管理層和信息系統管理部門已經做了很大努力保證災難恢復計劃及時、有效。該公司災難恢復計劃的一個重要方面是保證
a.組織和運營方面的變動在恢復計劃中得到體現。
b.對系統的變更在投入生產前已得到全面的測試。
c.必要時管理人員能替代一線人員的工作。
d.能力計劃可以準確預測系統負荷的改變。
『正確答案』a
『解題思路』
a.正確。公司組織和運營方面的變動可能導致原先的恢復計劃失效,因此,這類變動必須在最新的恢復計劃中得到體現。
b.不正確。對系統的變更當然要進行全面測試,但這超出了災難恢復計劃的目標范圍。
c.不正確。恢復計劃確實應考慮必要時如何替代一線工作人員,但通常不應由管理人員來充當。
d.不正確。考察能力計劃的準確性超出了災難恢復計劃的目標范圍。
3.在確定一個組織的災難構成因素時,以下哪一項是必要的?
a.風險分析。
b.文件和設備備份需求分析。
c.供應商供貨協議分析。
d.應急設施合同分析。
『正確答案』a
『解題思路』
a.正確。風險分析確定各項風險的級別及可能導致該風險的因素。
b.不正確。文件和設備備份需求分析確定災難發生后的恢復性需求。
c.不正確。供應商供貨協議分析確定供貨協議的合理性。
d.不正確。應急設施合同分析確定災難發生后啟動應急設施的可行性。
4.在對某組織的災難恢復能力進行審計時,審計師可能認為以下哪一項是最嚴重的控制弱點?
a.測試利用了恢復腳本。
b.熱站合同有兩年時間了。
c.備份介質被保存在現場。
d.每年只測試幾個系統。
『正確答案』c
『解題思路』
a.不正確。對后續事件來說,使用腳本是常見的實務。
b.不正確。恢復合同不是經常更新的。
c.正確。沒能在遠離現場的地方保存備份介質是一項非常嚴重的控制弱點。
d.不正確。一般來說,有限的測試時間僅僅允許測試幾個系統。
利用以下信息回答5-6題:
在對某全國性抵押貸款服務公司數據中心的年度檢查中,內部審計經理注意到該數據中心缺乏足夠的應付突發事件的方案。該審計經理尤其關注的是:數據中心鄰近一條會偶發大水的河流,又鄰近一條主干鐵路和高速公路。
5.由于公司鄰近河流,洪水泛濫時,即使洪水不會淹到數據中心,公司仍會遭受哪方面的風險?
a.顧客可能會拒絕與公司做生意。
b.貴重設備可能需要更換。
c.雇員可能無法提交工作報告。
d.許多顧客可能無法按時付款。
『正確答案』c
『解題思路』
a.不正確。只要公司仍能提供有效的抵押貸款服務,顧客沒有理由會拒絕與公司做生意。
b.不正確。貴重設備通常集中在數據中心,既然洪水沒有淹到數據中心,其貴重設備當然也無需更換。
c.正確。洪水可能導致道路中斷,公司雇員本人、家人或財產受到損害等,以致雇員無法提交工作報告。
d.不正確。作為一個顧客遍布各地的全國性抵押貸款服務公司,其顧客的付款行為應是在顧客所在地進行,因此盡管受洪水影響區域的部分顧客可能無法按時付款,但大多數顧客的付款并不會受影響。
6.管理層按照內部審計師的建議,準備了一份應付突發事件的計劃。這份計劃的最關鍵部分是提供
a.監控恢復過程中的欺詐和濫用行為。
b.繼續抵押業務。
c.信息資產的安全與控制。
d.最大程度地降低恢復期間的費用。
『正確答案』b
『解題思路』
a.不正確。監控恢復過程中的欺詐和濫用行為應該是計劃的一個重要方面,但相比之下,保證抵押業務的正常進行更為關鍵。
b.正確。該計劃的主要目標應該是保持抵押業務的連續性,因為這關系到企業的商業信譽和長遠利益,是企業的生命線。
c.不正確。信息資產的安全與控制在任何時候都很重要,但在應付突發事件的計劃中,其首要目標應是保證業務不間斷。
d.不正確。計劃當然應考慮如何最大程度地降低恢復期間的費用,但費用的節省不能以中斷業務為代價。
7.在對工廠材料存貨系統的降型化方案進行評估時,信息中心工作人員認為應該使用廉價冗余磁盤陣列(RAID)來存放存貨數據庫。使用RAID技術的目的是保證
a.如果一個驅動器發生故障,其所有的數據仍然可以被重構出來。
b.所有數據在驅動器之間均勻分配。
c.所有交易的前期、后期數據都被保留。
d.將寫入時間降至最少以避免并發寫沖突。
『正確答案』a
『解題思路』
a.正確。當冗余磁盤陣列(RAID)的某個驅動器發生故障時,可以從其它非故障磁盤中重構出故障盤中的數據。
b.不正確。RAID中的數據在各驅動器之間不一定均勻分配。
c.不正確。RAID中并不保留交易的前期、后期數據。
d.不正確。RAID盤由于是多盤同時操作,確實可以在一定程度上降低寫入時間,但不能避免并發寫沖突。
8.雖然管理層要求嚴格遵守有關制度,但是在緊急情況下測試庫程序還是被用于企業運營。在緊急情況下使用測試庫程序的風險是
a.準備測試庫程序的人員可能未被授予編寫和修改程序的權限。
b.測試庫程序可能未經進一步測試就永久投入運行。
c.測試庫的完整性可能受到威脅。
d.操作人員可能對程序的輸出不完全滿意。
『正確答案』b
『解題思路』
a.不正確。測試庫程序一旦投入企業運營,對其進行進一步的編寫和修改應根據變更控制程序來完成,而不能由準備測試庫程序的人員完成。
b.正確。在緊急情況下,測試庫程序未經正常的變更控制程序而直接投入運行,就不能保證該測試庫程序已經得到了充分的測試,從而可能留下大的隱患。
c.不正確。測試庫投入實際運營不會影響到測試庫的自身完整性。
d.不正確。對于一個在緊急情況下新投入運行的程序,操作人員可能對程序的輸出不完全滿意是正常的,只要沒有發生數據錯誤,對輸出結果可以通過正常的變更控制程序加以改進。
9.通過應用以下哪項措施可以最大程度地降低一個分布式信息技術系統完全停止運行的可能性?
a.例外報告。
b.故障弱化保護。
c.備份和恢復。
d.數據文件安全性。
『正確答案』b
『解題思路』
a.不正確。例外報告可用來控制更新的準確性和及時性,但不能最大程度地降低系統中斷帶來的影響。
b.正確。某個點的計算機停止運行后,其他點的計算機仍可以繼續運行的能力稱為故障弱化保護,這是分布式系統的一個優勢。
c.不正確。備份程序用來防止計算機故障后的恢復過程引入任何錯誤的改變。
d.不正確。數據文件安全性措施用來防止對數據文件的未經授權的修改。
10.某大型財產保險公司設有多處區域中心供顧客電話索賠。雖然各區域中心并不處于自然災害易發區,公司仍需要有災難恢復計劃,以便在災難發生或擴大時保持及時回應顧客要求的能力。保持這種能力的最好的方案是在災難發生時將顧客的電話轉發至:
a.復制了該區域中心設施的冷站點。
b. 復制了該區域中心設施的熱站點
c.第三方服務中心
d.未受到災害影響的其他區域中心
『正確答案』d
『解題思路』
a.不正確。冷站點投入較大,而且沒有響應的設備、軟件和服務人員,可能難以實現保持及時回應顧客要求的目標。
b.不正確。熱站點投入更大,而且仍然沒有配備服務人員。
c.不正確。第三方服務中心并沒有專門針對該公司業務的訓練有素的服務人員,如將區域中心的人員全部轉至第三方服務中心,則人員開銷將十分昂貴。
d.正確。將業務轉至未受到災害影響的其他區域中心名具有投入最小,顧客能得到熟練的服務,而且公司應對事件的自行控制能力強等多項優勢。
相關推薦:國際注冊內審師考試《經營分析和信息技術》講義匯總
新添考試應用:
①資訊訂閱,查詢最新考試信息②章節習題 海量套題全免費體驗!!
(責任編輯:中大編輯)