改進(jìn)數(shù)據(jù)中心風(fēng)險管理的三個步驟

2022-10-02    分類: 網(wǎng)站建設(shè)

隨著云計算的興起,一些IT傳道者、首席信息官和大型技術(shù)研究公司在5年前預(yù)言數(shù)據(jù)中心即將消亡。行業(yè)專家Mark Settle當(dāng)時提出建議,企業(yè)關(guān)閉內(nèi)部部署數(shù)據(jù)中心需要深思熟慮,并預(yù)測數(shù)據(jù)中心的業(yè)務(wù)將隨著數(shù)據(jù)量的增長而繼續(xù)增長。

改進(jìn)數(shù)據(jù)中心風(fēng)險管理的三個步驟

如今,數(shù)據(jù)中心不僅繼續(xù)存在,而且在與混合云和多云的市場競爭中蓬勃發(fā)展。不僅如此,數(shù)據(jù)中心還可以滿足與邊緣計算、物聯(lián)網(wǎng)和5G等新興技術(shù)相關(guān)的服務(wù)需求。

由于這些新的應(yīng)用程序以及終端用戶計算(EUC)和移動解決方案中的新興需求,數(shù)據(jù)中心的運營變得越來越復(fù)雜,導(dǎo)致出現(xiàn)更多的內(nèi)部和外部風(fēng)險。停機是一種持續(xù)性風(fēng)險,每次停機事件的平均損失高達(dá)每分鐘11000美元。

以下是企業(yè)識別和降低數(shù)據(jù)中心運營風(fēng)險的三個步驟。

1.采用綜合方法進(jìn)行風(fēng)險管理

2021年2月,德克薩斯州遭遇的冬季風(fēng)暴以及隨后導(dǎo)致的大面積停電,對該州的數(shù)據(jù)中心來說是一次嚴(yán)峻的考驗。雖然沒有發(fā)生大規(guī)模故障,但電氣故障切換系統(tǒng)存在重大問題。

從功能的角度來看,數(shù)據(jù)中心是運行業(yè)務(wù)關(guān)鍵型應(yīng)用程序的物理設(shè)施;而從業(yè)務(wù)的角度來看,它們是需要進(jìn)行預(yù)算和管理的不動產(chǎn)或資本資產(chǎn)。

關(guān)鍵是,單點故障可能(而且經(jīng)常會)導(dǎo)致數(shù)據(jù)中心的運營中斷,從而導(dǎo)致收入損失。這就是需要一個適用于整個企業(yè)的普遍風(fēng)險管理計劃和政策的原因。

這也是綜合風(fēng)險管理(IRM)發(fā)揮重要作用的地方。調(diào)研機構(gòu)Gartner公司將綜合風(fēng)險管理(IRM)定義為“由風(fēng)險意識文化和支持技術(shù)支持的一組實踐和流程,通過對企業(yè)如何管理其獨特風(fēng)險的綜合視圖來改進(jìn)決策制定和性能?!?/p>

在后疫情時代,實施遠(yuǎn)程工作、BYOD、CYOD和其他工作場所實踐變革的企業(yè)正在將其數(shù)字化轉(zhuǎn)型戰(zhàn)略與IT基礎(chǔ)設(shè)施升級相結(jié)合,以識別和緩解自然災(zāi)害、供應(yīng)鏈、數(shù)據(jù)處理以及商業(yè)模式所固有的風(fēng)險。

如果企業(yè)正在實施數(shù)字化轉(zhuǎn)型,則需要監(jiān)控可能影響數(shù)據(jù)中心的每個流程和因素(外部或內(nèi)部),并準(zhǔn)備好應(yīng)對由一個或多個事件同時發(fā)生的多重風(fēng)險。

數(shù)字化轉(zhuǎn)型不僅適用于嚴(yán)重依賴數(shù)據(jù)或技術(shù)的企業(yè)——它同樣適用于疫情之后開展遠(yuǎn)程工作的中小企業(yè),包括那些開始使用公有云替代數(shù)據(jù)中心的企業(yè)。

甚至政府部門也在認(rèn)真對待數(shù)字化轉(zhuǎn)型——利用云計算技術(shù)改造數(shù)據(jù)中心基礎(chǔ)設(shè)施是他們的兩個中心目標(biāo)之一(改善在線用戶體驗是另一個目標(biāo))。

Jeff Shupack說:“數(shù)據(jù)中心優(yōu)化是《美國聯(lián)邦信息技術(shù)收購改革法案》中記分卡的一個關(guān)鍵衡量指標(biāo)。該衡量指標(biāo)部分反映了政府機構(gòu)基礎(chǔ)設(shè)施利用云計算的程度?!?Jeff Shupack是一名數(shù)字化轉(zhuǎn)型專家,在通過精益敏捷實施降低全球資本計劃風(fēng)險方面具有15年的實踐經(jīng)驗。

很多企業(yè)正在認(rèn)識到,敏捷方法、大數(shù)據(jù)分析、移動解決方案和DevOps與可靠的、升級的數(shù)據(jù)中心協(xié)同工作,可以有效地預(yù)防風(fēng)險、充分地應(yīng)對風(fēng)險和快速地恢復(fù)災(zāi)難。因此,他們正在轉(zhuǎn)向能夠在混合IT基礎(chǔ)設(shè)施中實施這些好實踐的框架,以確保業(yè)務(wù)連續(xù)性、減少運營成本,并改善數(shù)字客戶體驗。

2.了解風(fēng)險

無論企業(yè)的風(fēng)險管理計劃多么全面,其發(fā)展速度永遠(yuǎn)不會超過技術(shù)進(jìn)步。新技術(shù)和新的工作方式正在創(chuàng)造前所未有的復(fù)雜性。以下是數(shù)據(jù)中心面臨的不同類型的風(fēng)險。

(1)IT安全性不足

可以說,如今數(shù)據(jù)中心面臨的大風(fēng)險是網(wǎng)絡(luò)安全漏洞,從DoS攻擊、社交工程到數(shù)據(jù)盜竊,都有可能發(fā)生。2021年,每個數(shù)據(jù)泄露事件造成的平均損失為424萬美元,這是17年來最高的記錄。

應(yīng)用程序和系統(tǒng)故障也會對物理安全方面產(chǎn)生影響,導(dǎo)致身份無法驗證、網(wǎng)絡(luò)連接中斷、授權(quán)人員無法進(jìn)入特定區(qū)域等情況。

(2)系統(tǒng)故障

沒有彈性架構(gòu)以及沒有連續(xù)的、冗余的、高帶寬的網(wǎng)絡(luò)連接,數(shù)據(jù)中心的運營注定要失敗。服務(wù)器、網(wǎng)絡(luò)設(shè)備和相關(guān)設(shè)備都需要集群、鏡像和復(fù)制等功能,以減少停機的機會。

應(yīng)用程序或軟件(如管理程序) 有時會發(fā)生故障,導(dǎo)致服務(wù)器或網(wǎng)絡(luò)癱瘓。因此需要確保所有應(yīng)用程序在混合基礎(chǔ)設(shè)施上無縫工作,并與云原生應(yīng)用程序進(jìn)行對話。

(3)電源故障

盡管這種情況極其罕見,但電力故障確實會發(fā)生——主要是自然災(zāi)害帶來的后果。需要為數(shù)據(jù)中心的所有機架和冷卻系統(tǒng)配備UPS電源或備用發(fā)電機路。數(shù)據(jù)中心與多個變電站的直接連接有助于防止受到本地變電站停電的影響。

(4)漏水

洪水或滲水可能會給數(shù)據(jù)中心帶來災(zāi)難。然而,維護(hù)良好的管路和排水系統(tǒng)對消防控制和冷卻系統(tǒng)至關(guān)重要。

(5)噪音

數(shù)據(jù)中心面臨的一個鮮為人知但卻十分嚴(yán)重的風(fēng)險是長期暴露在高頻噪音中,這會降低存儲系統(tǒng)的效率,降低讀/寫性能,并最終影響數(shù)據(jù)完整性。數(shù)據(jù)中心應(yīng)該建在遠(yuǎn)離運動場、消防站、機場等地方,并部署在使用聲學(xué)抑制技術(shù)的建筑物內(nèi)。

(6)火災(zāi)

電源尖峰和電氣短路是數(shù)據(jù)中心火災(zāi)的常見原因。如果不迅速控制,火災(zāi)可以在幾分鐘內(nèi)摧毀數(shù)據(jù)中心IT硬件。具有諷刺意味的是,空調(diào)和冷卻系統(tǒng)將會消散火災(zāi)產(chǎn)生的煙霧,使火災(zāi)早期探測變得更加困難。因此需要使用帶有光電傳感器的煙霧探測系統(tǒng),以持續(xù)監(jiān)測數(shù)據(jù)中心的空氣中是否有煙霧。

(7)糟糕的災(zāi)難恢復(fù)規(guī)劃

雖然數(shù)據(jù)備份目前是一個非常簡單的過程,但出于安全性和性能的綜合考慮,數(shù)據(jù)中心比公有云更受歡迎——希望在系統(tǒng)故障時能夠立即恢復(fù)事務(wù)性數(shù)據(jù)。

當(dāng)然,這取決于業(yè)務(wù)的性質(zhì)和監(jiān)管框架等因素。所以更有理由為每個不同的故障事件制定明確的恢復(fù)計劃;計算、存儲或網(wǎng)絡(luò)資源也是如此。

大多數(shù)先進(jìn)的災(zāi)難恢復(fù)計劃都有監(jiān)控系統(tǒng),可以跟蹤影響數(shù)據(jù)中心的風(fēng)險因素,并在超過關(guān)鍵閾值時發(fā)出警報。

3.在管理風(fēng)險之前評估風(fēng)險

所有的風(fēng)險并不都是相同的。雖然數(shù)據(jù)中心面臨著各種風(fēng)險,特別是不同的垂直領(lǐng)域,但最終使用的風(fēng)險緩解技術(shù)不一定需要針對數(shù)據(jù)中心環(huán)境進(jìn)行定制。

因此,數(shù)據(jù)中心運營商需要制定風(fēng)險管理計劃,列出數(shù)據(jù)中心可能面臨的所有風(fēng)險,并指定對每種風(fēng)險事件的響應(yīng)。

首先進(jìn)行風(fēng)險審計——對所有擁有和運營的數(shù)據(jù)中心設(shè)施進(jìn)行全面評估。評估影響設(shè)施設(shè)計、IT基礎(chǔ)設(shè)施和運營流程的因素。

如果過去發(fā)生過重大事故或中斷,那么可以進(jìn)行根本原因分析來解決沒有解決的問題。可以做些什么來確保在類似的情況下不會再次出現(xiàn)停機。

此外,如果使用具有多個數(shù)據(jù)中心和云計算系統(tǒng)的混合架構(gòu),需要單獨審核每個數(shù)據(jù)中心以及它們之間的數(shù)據(jù)路徑和連接。

如果在金融和醫(yī)療保健等監(jiān)管嚴(yán)格的行業(yè)中運營,則需要將定期數(shù)據(jù)中心風(fēng)險評估和災(zāi)難測試作為日常運營的一部分。

與其他事項一樣,需要創(chuàng)建框架、政策或備忘單提供適用于數(shù)據(jù)中心運營商的風(fēng)險類別、每個類別影響的系統(tǒng)、估算損壞和恢復(fù)成本,以及發(fā)生事故或災(zāi)難時應(yīng)遵循協(xié)議的現(xiàn)成參考。

例如,IT咨詢機構(gòu)凱捷公司采用了一種不斷發(fā)展的風(fēng)險管理方法,該方法識別并量化風(fēng)險及其緩解成本。凱捷公司高級交付中心經(jīng)理Kevin Read表示:“我們已經(jīng)建立了一個月度風(fēng)險管理系統(tǒng),記錄所有風(fēng)險和問題,并制定行動計劃。如果需要更改,將提供投資預(yù)算?!?/p> 如何消除停機時間

數(shù)據(jù)中心(甚至是企業(yè)的整個IT基礎(chǔ)設(shè)施)永遠(yuǎn)不會孤立地運行,數(shù)據(jù)中心大量組件正在全天候運轉(zhuǎn)。

IT基礎(chǔ)設(shè)施的風(fēng)險緩解是一個共同的責(zé)任,而不僅僅是首席信息官或首席技術(shù)官的責(zé)任。企業(yè)需要有足夠數(shù)量的受過培訓(xùn)的IT人員,他們愿意盡一切可能掌握數(shù)據(jù)中心的運營。

Tenable公司產(chǎn)品營銷副總裁Gavin Millard給大家的建議是:“沖突的目標(biāo)可能很難解決,最有效的方法之一是建立一個高效的流程,持續(xù)識別風(fēng)險所在。還需要一個可預(yù)測、可靠的方法來更新系統(tǒng),而不會影響企業(yè)的總體業(yè)務(wù)目標(biāo)?!?/p>

文章題目:改進(jìn)數(shù)據(jù)中心風(fēng)險管理的三個步驟
轉(zhuǎn)載注明:http://bm7419.com/news/200656.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供手機網(wǎng)站建設(shè)小程序開發(fā)、營銷型網(wǎng)站建設(shè)、App設(shè)計、定制開發(fā)定制網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)頁設(shè)計公司