高可用性的定義以及它為什么如此重要?

2024-03-04    分類(lèi): 網(wǎng)站建設(shè)

實(shí)現(xiàn)業(yè)務(wù)連續(xù)性是現(xiàn)代組織的首要關(guān)注點(diǎn)。停機(jī)可能會(huì)導(dǎo)致重大的財(cái)務(wù)影響,在某些情況下,還會(huì)導(dǎo)致無(wú)法恢復(fù)的數(shù)據(jù)丟失。

避免服務(wù)中斷和計(jì)劃外停機(jī)的解決方案是采用高可用性架構(gòu)。

因?yàn)槊總€(gè)企業(yè)都高度依賴(lài)互聯(lián)網(wǎng),所以每一分鐘都很重要。這就是公司計(jì)算機(jī)和服務(wù)器必須始終保持運(yùn)行的原因。

無(wú)論您選擇容納自己的 IT 基礎(chǔ)架構(gòu)還是選擇在數(shù)據(jù)中心托管解決方案,在設(shè)置 IT 環(huán)境時(shí)必須首先考慮高可用性。

高可用性定義

高可用架構(gòu)涉及多個(gè) 組件協(xié)同工作,以確保在特定時(shí)間段內(nèi)不中斷服務(wù)。這還包括對(duì)用戶(hù)請(qǐng)求的響應(yīng)時(shí)間。也就是說(shuō),可用的系統(tǒng)不僅必須在線(xiàn),而且還必須響應(yīng)。

實(shí)施能夠?qū)崿F(xiàn)這一目標(biāo)的 云計(jì)算架構(gòu) 是確保關(guān)鍵應(yīng)用程序和服務(wù)持續(xù)運(yùn)行的關(guān)鍵。即使發(fā)生各種組件故障或系統(tǒng)處于高壓力下,它們也能保持在線(xiàn)并做出響應(yīng)。

高度可用的系統(tǒng)包括在盡可能短的時(shí)間內(nèi)從意外事件中恢復(fù)的能力。 通過(guò)將流程轉(zhuǎn)移到備份組件,這些系統(tǒng)可以大限度地減少或消除停機(jī)時(shí)間。這通常需要持續(xù)維護(hù)、監(jiān)控和初步深入測(cè)試,以確認(rèn)沒(méi)有弱點(diǎn)。

高可用性環(huán)境包括帶有系統(tǒng)軟件的復(fù)雜服務(wù)器集群,用于持續(xù)監(jiān)控系統(tǒng)性能。首要任務(wù)是避免計(jì)劃外的設(shè)備停機(jī)。如果某個(gè)硬件出現(xiàn)故障,則不得在生產(chǎn)期間導(dǎo)致服務(wù)完全停止。

對(duì)于大型組織而言,不間斷地保持運(yùn)營(yíng)尤為重要。在這種情況下,幾分鐘的損失可能會(huì)導(dǎo)致聲譽(yù)、客戶(hù)和數(shù)千美元的損失。只要可用性水平不影響業(yè)務(wù)運(yùn)營(yíng),高度可用的計(jì)算機(jī)系統(tǒng)就允許出現(xiàn)故障。

高可用性基礎(chǔ)架構(gòu)具有以下特征:

硬件冗余

軟件和應(yīng)用程序冗余

數(shù)據(jù)冗余

消除單點(diǎn)故障

如何計(jì)算高可用性正常運(yùn)行時(shí)間百分比?

可用性是通過(guò)特定系統(tǒng)在特定時(shí)期(通常是一年)內(nèi)保持完全運(yùn)行的時(shí)間來(lái)衡量的。

它以百分比表示。請(qǐng)注意,正常運(yùn)行時(shí)間不一定與可用性相同。系統(tǒng)可能已啟動(dòng)并正在運(yùn)行,但對(duì)用戶(hù)不可用。造成這種情況的原因可能是網(wǎng)絡(luò)或 負(fù)載平衡 問(wèn)題。

正常運(yùn)行時(shí)間通常用五個(gè) 9 的可用性等級(jí)來(lái)表示。

如果您決定采用托管解決方案,這將 在服務(wù)水平協(xié)議 (SLA) 中定義?!耙粋€(gè)九”的等級(jí)意味著保證的可用性為 90%。今天,大多數(shù)組織和企業(yè)至少需要“三個(gè)九”,即 99.9% 的可用性。

企業(yè)有不同的可用性需求。那些需要全年全天候運(yùn)行的設(shè)備將瞄準(zhǔn)“五個(gè)九”,即 99.999% 的正常運(yùn)行時(shí)間??雌饋?lái) 0.1% 并沒(méi)有太大的區(qū)別。但是,當(dāng)您將其轉(zhuǎn)換為小時(shí)和分鐘時(shí),這些數(shù)字很重要。

如何實(shí)現(xiàn)高可用性

希望實(shí)施高可用性解決方案的企業(yè)需要了解系統(tǒng)獲得高可用性所需的多個(gè)組件和要求。為確保業(yè)務(wù)連續(xù)性和可操作性,關(guān)鍵應(yīng)用程序和服務(wù)需要全天候運(yùn)行。實(shí)現(xiàn)高可用性的最佳實(shí)踐涉及需要滿(mǎn)足的某些條件。以下是實(shí)現(xiàn) 99.999% 可靠性和正常運(yùn)行時(shí)間的 4 個(gè)步驟。

1. 消除單點(diǎn)故障高可用性與冗余

高可用性系統(tǒng)的關(guān)鍵要素是通過(guò)在所有級(jí)別上實(shí)現(xiàn)冗余來(lái)消除單點(diǎn)故障 。無(wú)論是自然災(zāi)害、硬件還是電源故障,IT 基礎(chǔ)設(shè)施都必須有備用組件來(lái)替換故障系統(tǒng)。

存在不同級(jí)別的組件冗余。其中最常見(jiàn)的是:

N+1 模型 包括保持系統(tǒng)正常運(yùn)行所需的設(shè)備數(shù)量(稱(chēng)為“N”)。 萬(wàn)一發(fā)生故障,每個(gè)組件都有一個(gè)獨(dú)立的備份 組件。一個(gè)例子是為應(yīng)用服務(wù)器使用額外的電源,但這可以是任何其他 IT 組件。該模型通常是主動(dòng)/被動(dòng)的。備份組件處于待命狀態(tài),等待發(fā)生故障時(shí)接管。N+1 冗余也可以是主動(dòng)/主動(dòng)的。在這種情況下,即使主要組件正常運(yùn)行,備用組件也能正常工作。請(qǐng)注意,N+1 模型并不是一個(gè)完全冗余的系統(tǒng)。

N+2 模型 類(lèi)似于 N+1。不同之處在于該系統(tǒng)將能夠承受兩個(gè)相同組件的故障。這應(yīng)該足以讓大多數(shù)組織保持正常運(yùn)轉(zhuǎn)。

2N 模型 包含雙倍數(shù)量的運(yùn)行系統(tǒng)所需的每個(gè)單獨(dú)組件。該模型的優(yōu)點(diǎn)是您不必考慮是否存在單個(gè)組件或整個(gè)系統(tǒng)的故障。您可以將操作完全移至備份組件。

2N+1 型號(hào) 提供與 2N 相同級(jí)別的可用性和冗余,并添加了另一個(gè)組件以改進(jìn)保護(hù)。

最終的冗余是通過(guò)地理冗余來(lái)實(shí)現(xiàn)的。

這是應(yīng)對(duì)自然災(zāi)害和其他完全停電事件的唯一機(jī)制。在這種情況下,服務(wù)器分布在不同區(qū)域的多個(gè)位置。

這些站點(diǎn)應(yīng)放置在不同的城市、國(guó)家甚至大洲。這樣,它們就完全獨(dú)立了。如果一個(gè)地方發(fā)生災(zāi)難性故障,另一個(gè)地方將能夠接手并保持業(yè)務(wù)運(yùn)行。

這種類(lèi)型的冗余往往非常昂貴。最明智的決定是從數(shù)據(jù)中心遍布全球的供應(yīng)商那里尋求托管解決方案。

除了停電,網(wǎng)絡(luò)故障是導(dǎo)致業(yè)務(wù)停機(jī)的最常見(jiàn)原因之一。

出于這個(gè)原因,網(wǎng)絡(luò)的設(shè)計(jì)必須使其保持 24/7/365 全天候運(yùn)行。為了實(shí)現(xiàn) 100% 的網(wǎng)絡(luò)服務(wù)正常運(yùn)行時(shí)間,必須有備用網(wǎng)絡(luò)路徑。他們每個(gè)人都應(yīng)該有冗余的企業(yè)級(jí)交換機(jī)和路由器。

2.數(shù)據(jù)備份與恢復(fù)

數(shù)據(jù)安全是每個(gè)企業(yè)最關(guān)心的問(wèn)題之一。高可用性系統(tǒng)必須有完善的數(shù)據(jù)保護(hù)和 災(zāi)難恢復(fù)計(jì)劃。

絕對(duì)必須有適當(dāng)?shù)膫浞?。另一個(gè)關(guān)鍵是在數(shù)據(jù)快速丟失、損壞或完全存儲(chǔ)故障的情況下恢復(fù)的能力。如果您的業(yè)務(wù)需要較低的 RTO 和 RPO ,并且您無(wú)法承受丟失數(shù)據(jù)的后果,那么可以考慮的最佳選擇是使用 數(shù)據(jù)復(fù)制。有許多備份計(jì)劃可供選擇,具體取決于您的業(yè)務(wù)規(guī)模、要求和預(yù)算。

數(shù)據(jù)備份和復(fù)制與 IT 高可用性齊頭并進(jìn)。兩者都應(yīng)該仔細(xì)計(jì)劃。在冗余基礎(chǔ)架構(gòu)上創(chuàng)建完整備份對(duì)于確保數(shù)據(jù)彈性至關(guān)重要,不容忽視。

3. 帶故障檢測(cè)的自動(dòng)故障轉(zhuǎn)移

在高度可用的冗余 IT 基礎(chǔ)架構(gòu)中,系統(tǒng)需要在發(fā)生故障時(shí)立即將請(qǐng)求重定向到備份系統(tǒng)。這稱(chēng)為 故障轉(zhuǎn)移。早期故障檢測(cè)對(duì)于縮短故障轉(zhuǎn)移時(shí)間和確保大系統(tǒng)可用性至關(guān)重要。

我們推薦的高可用性軟件解決方案之一是 Carbonite Availability。它適用于任何基礎(chǔ)設(shè)施,無(wú)論是虛擬的還是物理的。

如需快速靈活的基于云的基礎(chǔ)架構(gòu)故障轉(zhuǎn)移和故障恢復(fù),您可以求助于 Cloud Replication for Veeam。故障轉(zhuǎn)移過(guò)程適用于整個(gè)系統(tǒng)或其可能發(fā)生故障的任何部分。每當(dāng)組件發(fā)生故障或 Web 服務(wù)器停止響應(yīng)時(shí),故障轉(zhuǎn)移必須是 無(wú)縫 的并且是實(shí)時(shí)發(fā)生的。

該過(guò)程如下所示:

機(jī)器 1 及其克隆 機(jī)器 2 ,通常 稱(chēng)為 熱備用。

機(jī)器 2 持續(xù)監(jiān)控 機(jī)器 1 的狀態(tài)以發(fā)現(xiàn)任何問(wèn)題。

機(jī)器 1 遇到問(wèn)題。由于多種原因,它失敗或關(guān)閉。

機(jī)器 2 自動(dòng)聯(lián)機(jī)。現(xiàn)在,每個(gè)請(qǐng)求都被路由到 Machine 2 而不是 Machine 1。這對(duì)最終用戶(hù)沒(méi)有任何影響。他們甚至不知道Machine 1有任何問(wèn)題 。

修復(fù)故障組件的問(wèn)題后, 機(jī)器 1 和 機(jī)器 2 恢復(fù)其初始角色

故障轉(zhuǎn)移過(guò)程的持續(xù)時(shí)間取決于系統(tǒng)的復(fù)雜程度。在許多情況下,這將需要幾分鐘。但是,它也可能需要幾個(gè)小時(shí)。

規(guī)劃高可用性必須基于所有這些考慮,以提供最佳結(jié)果。每個(gè)系統(tǒng)組件都需要符合實(shí)現(xiàn) 99.999% 可用性和縮短故障轉(zhuǎn)移時(shí)間的最終目標(biāo)。

4.負(fù)載均衡

負(fù)載均衡器可以是硬件設(shè)備或軟件解決方案。其目的是跨多個(gè)服務(wù)器和組件分發(fā)應(yīng)用程序或網(wǎng)絡(luò)流量。目標(biāo)是 提高整體運(yùn)行性能和可靠性。

它通過(guò)有效管理負(fù)載和持續(xù)監(jiān)控后端服務(wù)器的運(yùn)行狀況來(lái)優(yōu)化計(jì)算和網(wǎng)絡(luò)資源的使用。

負(fù)載均衡器如何決定選擇哪個(gè)服務(wù)器?

許多不同的方法可用于跨服務(wù)器池分配負(fù)載。為您的工作負(fù)載選擇一種將取決于多種因素。其中一些包括所服務(wù)的應(yīng)用程序類(lèi)型、網(wǎng)絡(luò)狀態(tài)和后端服務(wù)器的狀態(tài)。負(fù)載均衡器根據(jù)當(dāng)前傳入請(qǐng)求的數(shù)量決定使用哪種算法。

一些最常見(jiàn)的負(fù)載平衡算法是:

循環(huán)賽。 使用循環(huán),負(fù)載平衡器將請(qǐng)求定向到第一臺(tái)服務(wù)器。它將向下移動(dòng)列表到最后一個(gè),然后從頭開(kāi)始。該方法易于實(shí)現(xiàn),應(yīng)用廣泛。但是,它沒(méi)有考慮服務(wù)器是否具有不同的硬件配置以及它們是否可以更快地過(guò)載。

最少的連接。 在這種情況下,負(fù)載均衡器將選擇活動(dòng)連接數(shù)最少的服務(wù)器。當(dāng)請(qǐng)求進(jìn)來(lái)時(shí),負(fù)載均衡器不會(huì)像輪詢(xún)那樣為列表中的下一個(gè)服務(wù)器分配連接。相反,它將尋找當(dāng)前連接最少的一個(gè)。在會(huì)話(huà)持續(xù)很長(zhǎng)時(shí)間的情況下,最少連接方法對(duì)于避免 Web 服務(wù)器過(guò)載特別有用。

源 IP 哈希。 這個(gè)算法會(huì)根據(jù)請(qǐng)求的源IP地址來(lái)決定選擇哪個(gè)服務(wù)器。負(fù)載均衡器使用源 IP 地址和目標(biāo) IP 地址創(chuàng)建唯一的哈希鍵。這樣的密鑰使其始終能夠?qū)⒂脩?hù)的請(qǐng)求定向到同一服務(wù)器。

負(fù)載均衡器確實(shí)在實(shí)現(xiàn)高可用性基礎(chǔ)架構(gòu)方面發(fā)揮著重要作用。但是,僅僅擁有一個(gè)負(fù)載均衡器并不意味著您擁有很高的系統(tǒng)可用性。

如果具有負(fù)載均衡器的配置僅路由流量以減少單臺(tái)機(jī)器上的負(fù)載,則不會(huì)使系統(tǒng)具有高可用性。

通過(guò)為負(fù)載均衡器本身實(shí)現(xiàn)冗余,您可以將其作為單點(diǎn)故障消除。

如果您選擇這種類(lèi)型的云計(jì)算服務(wù),那么保持高可用性是 DBaaS 提供商可以為您管理的任務(wù)之一。了解有關(guān) 數(shù)據(jù)庫(kù)即服務(wù)的更多信息。

最后:實(shí)施高可用性架構(gòu)

無(wú)論您經(jīng)營(yíng)何種規(guī)模和類(lèi)型的業(yè)務(wù),如果沒(méi)有 云災(zāi)難恢復(fù)解決方案,任何類(lèi)型的服務(wù)停機(jī)都可能代價(jià)高昂。

更糟糕的是,它可能會(huì)對(duì)您的聲譽(yù)造成永久性損害。通過(guò)應(yīng)用上面列出的一系列最佳實(shí)踐,您可以降低丟失數(shù)據(jù)的風(fēng)險(xiǎn)。您還可以大限度地減少出現(xiàn)生產(chǎn)環(huán)境問(wèn)題的可能性。

如果沒(méi)有高可用性系統(tǒng),您離線(xiàn)的機(jī)會(huì)會(huì)更高。

從這個(gè)角度來(lái)看,停機(jī)成本大大超過(guò)了精心設(shè)計(jì)的 IT 基礎(chǔ)架構(gòu)的成本。近年來(lái),托管和云計(jì)算解決方案比內(nèi)部解決方案支持更受歡迎。這樣做的主要原因是它 降低了 IT 成本 并增加了更多的靈活性。

無(wú)論您選擇哪種解決方案,高可用性系統(tǒng)的好處是多方面的:

您可以節(jié)省金錢(qián)和時(shí)間,因?yàn)闊o(wú)需重建因存儲(chǔ)或其他系統(tǒng)故障而丟失的數(shù)據(jù)。在某些情況下,中斷后無(wú)法恢復(fù)您的數(shù)據(jù)。這可能會(huì)對(duì)您的業(yè)務(wù)造成災(zāi)難性的影響。

更少的停機(jī)時(shí)間意味著對(duì)用戶(hù)和客戶(hù)的影響更小。如果您的可用性以五個(gè)九來(lái)衡量,這意味著幾乎沒(méi)有服務(wù)中斷。這可以提高員工的生產(chǎn)力并保證客戶(hù)滿(mǎn)意度。

您的應(yīng)用程序和服務(wù)的性能將得到改善。

如果您因服務(wù)器問(wèn)題不符合合同 SLA,您將避免罰款和處罰。

網(wǎng)頁(yè)標(biāo)題:高可用性的定義以及它為什么如此重要?
網(wǎng)頁(yè)URL:http://www.bm7419.com/news13/320013.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站改版、品牌網(wǎng)站設(shè)計(jì)、網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)公司、品牌網(wǎng)站制作、自適應(yīng)網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶(hù)投稿、用戶(hù)轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話(huà):028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

網(wǎng)站托管運(yùn)營(yíng)