“熄燈”數(shù)據(jù)中心,你準備好了嗎?

2022-10-04    分類: 網站建設

“熄燈”(lights-out)數(shù)據(jù)中心的概念已經流行了很多年,但是為什么要運營這樣一個數(shù)據(jù)中心呢?它們會在不久的未來發(fā)展應用嗎?

熄燈數(shù)據(jù)中心的基本思想非常簡單,就是指一種無人值守的數(shù)據(jù)中心,其中部署著完全自動化的設施,無需任何人員參與即可完成操作。通過“熄燈”的方式,大大節(jié)省了能源和人員管理成本。

“熄燈”數(shù)據(jù)中心,你準備好了嗎?

事實上,“熄燈”這個想法源自制造業(yè),具體可以追溯到Philip K Dick在1955年發(fā)表的一篇短篇小說。文中提及,在荷蘭,飛利浦工廠可以在少數(shù)質檢人員的監(jiān)督下制造剃須刀。而在日本Fanuc工廠,即便長期關閉空調和供暖系統(tǒng),也完全不影響機器人的生產效率。

十多年來,傳統(tǒng)數(shù)據(jù)中心一直通過運營人員管理和維護數(shù)百臺甚至數(shù)千臺服務器。除非更換硬件或修復故障,他們通常不會進入機房。數(shù)據(jù)中心的機械和電氣設備也都是自動化的,因此冷卻裝置可以在無人值守的情況下運行,并且提示工程師或致電制造商,以進行偶爾的預防性維護。

長久以來,傳統(tǒng)數(shù)據(jù)中心一直在通過人工來管理和維護服務器。為此,給運維人員提供工作環(huán)境和條件所進行的各種安全設置和環(huán)境設施或多或少的都需要利用一定的空間和能源。

熄燈數(shù)據(jù)中心在2011年首次亮相,當時美國互聯(lián)網服務提供商AOL公司進行了一次大型展示,宣布推出名為ATC的小型無人值守微型設施。AOL公司技術副總裁Mike Manos是一位曾在微軟公司工作過的數(shù)據(jù)中心專家,他在一篇博文中對熄燈數(shù)據(jù)中心的理念表示贊賞,認為這種技術“從根本上改變了業(yè)務”。

熄燈數(shù)據(jù)中心的宣傳炒作

 

如今,十年過去了,AOL公司早已不復存在,而數(shù)據(jù)中心仍然需要運營人員進行維護和管理。

確實,ATC的一些創(chuàng)意一直存在,通??梢圆捎妙A先安裝服務器的方式將機架安裝在這樣的數(shù)據(jù)中心中。

數(shù)據(jù)中心設計師指出,數(shù)據(jù)中心的機架和服務器可以放置得更近一些,如果不考慮建筑物適宜人類居住的因素,則可以通過在較高的溫度下運行來削減冷卻費用。而抽取空氣中的氧氣可以防止火災,并減少腐蝕。

但是總的來說,數(shù)據(jù)中心仍然充斥著大量大型設施,仍然需要配備現(xiàn)場工作人員。

Uptime Institute是數(shù)據(jù)中心可靠性方面的權威機構,該機構一直建議數(shù)據(jù)中心運營人員需要隨時準備處理出現(xiàn)的任何問題。該機構的技術專家Richard F.Van Loo在2015年發(fā)布的一份簡報中表示:

對于需要在Tier III級或Tier IV數(shù)據(jù)中心設施運營關鍵業(yè)務的組織來說,我們建議至少有一到兩家數(shù)據(jù)中心運營商的工作人員全天候(一年365天 24X7)在現(xiàn)場工作。

熄燈數(shù)據(jù)中心的發(fā)展在此后發(fā)生了一些變化,尤其是規(guī)模較小的數(shù)據(jù)中心提供商,例如EdgeConneX公司。

EdgeConneX公司在美國和歐洲構建的24個數(shù)據(jù)中心一直致力于采用一個熄燈運營模式。該公司的主要業(yè)務是二線數(shù)據(jù)中心市場的內容分發(fā),以及不需專職人員操作的數(shù)據(jù)中心設施的設計,當需要提供上門服務時,可利用先進的監(jiān)控設備,并進行遠程操作。

EdgeConneX公司的設計也許是利用自動化來簡化數(shù)據(jù)中心的運營的最雄心勃勃的例子,是一種利用設計作為工具改變商業(yè)模式的經濟學。其采用了一種先進的設計和操作模板,讓EdgeConneX公司快速改造現(xiàn)有數(shù)據(jù)中心建筑達到第三級的冗余度,可以支持更多的高功率密度的工作負載,每個機柜可超過20千瓦。

EdgeConneX公司CIO Lance Devin表示:

我們的整個業(yè)務前提都是基于熄燈數(shù)據(jù)中心的。我們通常部署電力容量為2MW的數(shù)據(jù)中心,而不是100MW的大型數(shù)據(jù)中心。因為我們無法承擔在數(shù)據(jù)中心安排3名工程師、17名安全人員以及2名維護人員所需的成本。

EdgeConneX公司擁有廣泛的客戶群,并運行分段管理系統(tǒng),該系統(tǒng)可以讓客戶控制IT硬件,而EdgeConneX公司則負責管理電源和冷卻基礎設施。

這樣的數(shù)據(jù)中心雖說算不上完全“熄燈”,但EdgeConneX能夠遠程控制安全性,這樣一來,客戶服務人員就可以通過服務臺來進行操作,無需與任何操作人員進行現(xiàn)實碰面。

疫情封鎖推動熄燈運營

 

隨著新冠疫情席卷全球,大多數(shù)公司(甚至是那些被認為不可或缺的公司)都采取了嚴格的居家隔離,在家辦公政策。這也導致了一些問題的出現(xiàn):

依靠現(xiàn)場數(shù)據(jù)中心支持人員的公司很快意識到,由于平時都是他們的員工在現(xiàn)場監(jiān)視數(shù)據(jù)中心,因此他們自身對數(shù)據(jù)中心操作的了解有限或沒有可視性; 許多積極主動型并且早前就已經部署了遠程功能DCIM(數(shù)據(jù)中心基礎架構管理)的公司很快就發(fā)現(xiàn)了他們在覆蓋范圍上的空白; 被視為“低優(yōu)先級”的云遷移項目已經變?yōu)?ldquo;高優(yōu)先級”甚至“最高優(yōu)先級”;

由于許多公司此次準備不充分,因此,他們更期待可以做好下一次準備。以下是大多數(shù)公司應該采取的一些非常具體的策略:

將數(shù)據(jù)中心外包給云服務提供商或托管公司,以保證正常情況下甚至危機期間,關鍵應用程序的正常運行; 通過遠程或通過自動化監(jiān)視和執(zhí)行維護和升級功能,使內部數(shù)據(jù)中心盡可能“熄滅”。

當越來越多的工作人員需要遠程居家辦公時,數(shù)據(jù)中心運營商采用的遠程控制服務也呈現(xiàn)激增趨勢。根據(jù)數(shù)據(jù)中心運營商QTS Data Centers公司首席技術官Brent Bensten的說法,在由于疫情而導致封鎖的前三周內,該公司遠程管理門戶(服務交付平臺或SDP)的登錄量激增了30%,而用戶在該系統(tǒng)上花費的時間也是原來的2倍。

Bensten表示:

新冠疫情加速了遠程管理平臺和工具的應用,因此可以遠程完成以前在現(xiàn)場完成的工作。 熄燈運營還是繼續(xù)面臨技能短缺問題?

 

在許多情況下,“熄燈”是降低數(shù)據(jù)中心技能要求的一種方式,既可以作為一種削減成本的手段,也可以作為解決難以尋求熟練員工問題的一種方式。

施耐德電氣公司的工程師Steven Carlini在一篇博客文章中對“為什么將來每個數(shù)據(jù)中心都將成為熄燈數(shù)據(jù)中心”進行了解釋。他認為,企業(yè)應該“盡可能”讓其內部部署數(shù)據(jù)中心實現(xiàn)“熄燈”,部分原因是為了應對疫情導致的封鎖,另一部分原因是為了解決技能短缺問題。

Carlini表示:

熄燈和無人值守的說法可能并不完全準確,因為安全人員很可能會在現(xiàn)場工作。建議數(shù)據(jù)中心應該雇用具備機械技能的安全人員,并讓他們實施即插即用的硬件更換工作,有些公司已經在嘗試使用Zoom視頻軟件指導人員進行維護和維修。

在很多情況下,“熄燈”數(shù)據(jù)中心的概念已經演變?yōu)椴恍枰嗉寄艿牡胤健?/p> 水下數(shù)據(jù)中心的探索

 

那么,真正“熄燈”運營的數(shù)據(jù)中心真的存在嗎?可能有一些數(shù)據(jù)中心以這種方式運行,但是并未公開;也可能是出于保密的原因,或是因為最終失敗了,例如AOL公司的ATC數(shù)據(jù)中心。

但是,我們確實知道一個知名案例。

早在2016年,微軟公司就曾向外界發(fā)布了一個創(chuàng)新型的“環(huán)保”數(shù)據(jù)中心——Project Natick數(shù)據(jù)中心(事實上,該項目于2014年已經啟動,2016年才正式對外公布)。最初,微軟先是建造了一個水下數(shù)據(jù)中心的原型——代號Leona Philpot的數(shù)據(jù)中心膠囊,并于2015年安置在加州海岸附近10米深的海水下長達四個月。Leona Philpot數(shù)據(jù)中心膠囊無需人員值守,使用壽命可達20年以上,采用可再生能源,每五年更換一次服務器硬件。

2018年,Project Natick研究項目進入到第二階段,開始設計和制造成熟完整的水下艙室。此次,微軟公司研究團隊在12個數(shù)據(jù)中心機架上放滿服務器,然后將服務器部署在一個壓力容器中,并將其沉入蘇格蘭海岸附近的海底。

2020年,微軟公司從海底打撈回這個代號為“SSDC-002”的水下數(shù)據(jù)中心。這個數(shù)據(jù)中心是一種充滿氮氣的鋼質容器,其中12個機架中運行864臺服務器,其存儲容量達到27.6PB,并通過電纜和光纖連接與地面的設施相連。

Project Natick水下數(shù)據(jù)中心負責人David Cutler表示:

我們在無人接觸的情況下運營了該設備長達25個月零8天,其結果無疑是令人滿意的。 可靠性和摩爾定律

 

水下數(shù)據(jù)中心服務器的可靠性要比陸地上同類服務器高出7倍。Project Natick水下數(shù)據(jù)中心使用了一批二手服務器,并將其中135臺服務器放置在陸基數(shù)據(jù)中心中運行,其余的855臺服務器部署在這個水下數(shù)據(jù)中心。

結果顯示,在135臺陸地服務器中,有8臺服務器在兩年內發(fā)生了故障。而在水下數(shù)據(jù)中心的855臺服務器中,只有6臺服務器發(fā)生故障。這些服務器都執(zhí)行相同的任務,并且沒有進行任何維護,但是傳統(tǒng)數(shù)據(jù)中心的振動和氧氣環(huán)境似乎影響了其可靠性。

關于”熄燈“數(shù)據(jù)中心的一大反對意見是,需要定期更換服務器和存儲設備,這并不是因為服務器和存儲設備已經耗盡,而是因為它們已經過時。幾十年來,IT硬件遵循摩爾定律(即硬件性能隨著技術進步每18個月翻一番),采用新服務器僅在使用能源成本方面就可以在三年內收回投資。

如今,芯片工藝現(xiàn)在已經接近極限,摩爾定律也即將終結,而服務器的使用壽命將更長。Cutler預測,這將使數(shù)據(jù)中心運營商最終走向”熄燈“模式。在數(shù)據(jù)中心的整個生命周期中,服務器往往占據(jù)很大一部分成本。在后摩爾定律時代,實際上沒有理由每兩年更換一次基礎架構。”

在邊緣采用熄燈數(shù)據(jù)中心

 

盡管傳統(tǒng)數(shù)據(jù)中心仍然需要運營人員進行管理,但新的應用場景和邊緣計算領域將可能需要運營熄燈數(shù)據(jù)中心。

物聯(lián)網等新技術以及人們將媒體和應用程序流氏傳輸?shù)郊抑械男枨?,導致了對高度分散的低延遲資源的需求。這意味著需要靠近人員和數(shù)據(jù)源部署大量小型數(shù)據(jù)中心設施。大多數(shù)的邊緣數(shù)據(jù)中心規(guī)模要比微軟公司Project Natick水下數(shù)據(jù)中心(代號SSDC-002)小得多,還有一些甚至在燈柱上安裝。

除非能夠完全消除現(xiàn)場訪問和運營,否則邊緣數(shù)據(jù)中心的容量將成為經濟成本上的噩夢,就像電話網絡在光纖機柜中表現(xiàn)的一樣。

讓我們回到“熄燈”概念誕生的最初。當AOL公司技術副總裁Mike ManosMike Manos提出這一想法時,他實際上是在談論邊緣計算設施,旨在使AOL公司的服務更貼近客戶。

Cutler表示,隨著技術的進步和發(fā)展,熄燈數(shù)據(jù)中心的發(fā)展可能比人們想象的還要快,將會成為數(shù)據(jù)中心行業(yè)的一種趨勢。

雖然目前,“熄燈”數(shù)據(jù)中心仍然面臨種種挑戰(zhàn),但有一件事是肯定的:無人值守的“熄燈”數(shù)據(jù)中心不再是一個科學項目或者一個幻想,隨著技術的進步和發(fā)展,它的發(fā)展可能比人們想象的還要快,它將成為數(shù)據(jù)中心行業(yè)的一種趨勢。

網頁標題:“熄燈”數(shù)據(jù)中心,你準備好了嗎?
URL地址:http://bm7419.com/news/201476.html

成都網站建設公司_創(chuàng)新互聯(lián),為您提供做網站、App開發(fā)、定制開發(fā)、網站設計公司、面包屑導航網站建設

廣告

聲明:本網站發(fā)布的內容(圖片、視頻和文字)以用戶投稿、用戶轉載內容為主,如果涉及侵權請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內容未經允許不得轉載,或轉載時需注明來源: 創(chuàng)新互聯(lián)

成都seo排名網站優(yōu)化