人工智能、液體冷卻和未來(lái)的數(shù)據(jù)中心
生成式人工智能(AI)的迅速崛起,凸顯了企業(yè)采用人工智能的非凡速度。Accenture最近的一份報(bào)告指出,98%的企業(yè)領(lǐng)導(dǎo)人表示,人工智能將在未來(lái)三到五年的戰(zhàn)略中發(fā)揮重要作用。McKinsey分析師發(fā)現(xiàn),近65%的企業(yè)計(jì)劃在未來(lái)三年內(nèi)增加對(duì)人工智能的投資。
這種勢(shì)頭才剛剛開(kāi)始。NVIDIA、AMD和Intel正在推出專為生成式人工智能和高性能計(jì)算(HPC)設(shè)計(jì)的新芯片。公共云提供商和新興芯片企業(yè)也參與了競(jìng)爭(zhēng)。IDC分析師預(yù)測(cè),人工智能軟件、硬件和服務(wù)的全球支出將達(dá)到3000億美元,高于今年預(yù)計(jì)的1540億美元。
然而,擴(kuò)展人工智能仍然存在挑戰(zhàn),其中最重要的是涉及支持這些工作負(fù)載所需的數(shù)據(jù)中心基礎(chǔ)設(shè)施的挑戰(zhàn)。
數(shù)據(jù)中心越來(lái)越“熱”
圖形處理單元(GPU),是人工智能和機(jī)器學(xué)習(xí)(ML)最常見(jiàn)的芯片,可以極大地加速人工智能應(yīng)用的計(jì)算過(guò)程。其非常強(qiáng)大,如NVIDIA的H100 GPU包含800億個(gè)晶體管,因此會(huì)產(chǎn)生大量熱量,必須對(duì)其進(jìn)行有效冷卻。
傳統(tǒng)上,在單個(gè)數(shù)據(jù)中心機(jī)架中達(dá)到10千瓦的配置被認(rèn)為是高密度,但空氣冷卻仍然是冷卻這些服務(wù)器的有效方法。盡管Uptime Institute發(fā)現(xiàn)很少有數(shù)據(jù)中心擁有超過(guò)30千瓦的機(jī)架,但極端密度正在出現(xiàn)。高性能計(jì)算的商品化和生成式人工智能的興起正在增加電力需求,并使傳統(tǒng)的空氣冷卻方法負(fù)擔(dān)過(guò)重。
例如,NVIDIA最新的GPU的最大功耗比上一代芯片高出160%。機(jī)架配置很容易超過(guò)40千瓦范圍,這對(duì)于傳統(tǒng)的風(fēng)冷方法而言是難以管理的。當(dāng)今的數(shù)據(jù)中心必須不斷發(fā)展,以有效管理這些升高的熱負(fù)荷。
冷卻技術(shù)越來(lái)越重要
好在,有多種液體冷卻技術(shù)可以應(yīng)對(duì)這一挑戰(zhàn),包括日益流行的后門(mén)熱交換和直接芯片技術(shù)。新興的浸入式冷卻技術(shù)也有不同的風(fēng)格,這些技術(shù)本質(zhì)上是將IT組件浸入充滿液體冷卻劑的容器中。
盡管浸入式冷卻尚處于早期采用階段,但分析師預(yù)測(cè),該技術(shù)將在未來(lái)四年內(nèi)成為主流,市場(chǎng)規(guī)模將從2021年的2.51億美元增長(zhǎng)到2027年的超過(guò)16億美元。這將極大地影響數(shù)據(jù)中心基礎(chǔ)設(shè)施需求,并且企業(yè)領(lǐng)導(dǎo)者必須知道他其數(shù)據(jù)中心運(yùn)營(yíng)商是否愿意在短期內(nèi)進(jìn)行必要的投資來(lái)支持這種轉(zhuǎn)變。
液體冷卻的優(yōu)點(diǎn)和缺點(diǎn)
液體作為熱導(dǎo)體的效率是空氣的1,000倍,而且運(yùn)行所需的基礎(chǔ)設(shè)施更少。風(fēng)冷系統(tǒng)需要一個(gè)復(fù)雜的制冷基礎(chǔ)設(shè)施,其中包括冷卻器、氣泵、電纜、濕度控制和過(guò)濾系統(tǒng),以及冗余備份系統(tǒng),以確保在停電時(shí)服務(wù)器不會(huì)處于不冷卻狀態(tài)。
相比之下,液體冷卻系統(tǒng)相對(duì)簡(jiǎn)單,但在當(dāng)前數(shù)據(jù)中心基礎(chǔ)設(shè)施中實(shí)施其的前期投資和復(fù)雜性可能會(huì)帶來(lái)重大挑戰(zhàn)。設(shè)置可能很復(fù)雜,并且可能需要專門(mén)的維護(hù)。此外,服務(wù)器設(shè)計(jì)可能需要調(diào)整,浸入式方法可能會(huì)使OEM保修失效,并且冷卻系統(tǒng)泄漏可能會(huì)造成損壞和停機(jī)。數(shù)據(jù)中心運(yùn)營(yíng)商還必須考慮在數(shù)據(jù)中心使用液體的新法規(guī)和環(huán)境標(biāo)準(zhǔn)。
也就是說(shuō),液體或浸入式冷卻系統(tǒng)不需要太多的備份或特殊的地板或通道密封策略。對(duì)能源消耗和成本的總體影響可能是巨大的。最近的一項(xiàng)研究結(jié)果發(fā)現(xiàn),實(shí)施液體冷卻可以減少近20%的設(shè)施電力,總數(shù)據(jù)中心電力減少10%以上??偸褂眯?TUE)是一項(xiàng)新指標(biāo),旨在比較高性能計(jì)算環(huán)境中液體冷卻與空氣冷卻的效率,結(jié)果顯示,液體冷卻的能源效率提高了15%以上。
過(guò)渡到液體冷卻還有其他可持續(xù)發(fā)展的好處。液體冷卻系統(tǒng)比空氣冷卻系統(tǒng)需要更少的水。改造數(shù)據(jù)中心可以采用新的思維方式來(lái)縮小其物理足跡和碳足跡。熱再利用策略可以為周?chē)钠髽I(yè)和社區(qū)提供能源。這些可能性令人興奮,并且可能會(huì)像生成人工智能本身一樣具有變革性。
現(xiàn)在需要了解什么
對(duì)于大多數(shù)企業(yè)而言,實(shí)現(xiàn)本地?cái)?shù)據(jù)中心的轉(zhuǎn)型可能過(guò)于復(fù)雜且昂貴。另一方面,當(dāng)今的大部分公共云基礎(chǔ)設(shè)施并不是為運(yùn)行大規(guī)模人工智能應(yīng)用而構(gòu)建的,而大容量工作負(fù)載的云成本不斷上升,促使許多組織尋找其他選擇。
考慮到這些挑戰(zhàn)和機(jī)遇,擁有處理無(wú)數(shù)客戶用例的基礎(chǔ)設(shè)施經(jīng)驗(yàn)的托管數(shù)據(jù)中心提供商,可能會(huì)為許多企業(yè)提供最佳解決方案。這個(gè)領(lǐng)域的領(lǐng)導(dǎo)者可以提供專業(yè)知識(shí)和支持,以指導(dǎo)組織完成轉(zhuǎn)型。還與許多硬件原始設(shè)備制造商和液體冷卻供應(yīng)商建立了重要的關(guān)系,這些供應(yīng)商將推動(dòng)數(shù)據(jù)中心的發(fā)展,提供多樣化的選擇來(lái)滿足客戶的獨(dú)特需求。
組織現(xiàn)在需要知道其數(shù)據(jù)中心運(yùn)營(yíng)商是否已經(jīng)在計(jì)劃,也許更重要的是,是否擁有可用的物理容量或適合安裝所需的技術(shù),以使下一代數(shù)據(jù)中心的發(fā)展成為可能。數(shù)據(jù)中心已經(jīng)面臨著將工作負(fù)載轉(zhuǎn)移到滿足其要求的最佳服務(wù)器的復(fù)雜挑戰(zhàn)。隨著人工智能和高性能計(jì)算工作負(fù)載的需求不斷增加,添加根本上不同的冷卻系統(tǒng)的額外挑戰(zhàn)肯定會(huì)使這些障礙變得更加復(fù)雜。
現(xiàn)在正在投資這些策略的數(shù)據(jù)中心運(yùn)營(yíng)商將處于有利地位,可以幫助其客戶正面應(yīng)對(duì)這些挑戰(zhàn)。人工智能正在改變一切,包括數(shù)據(jù)中心。現(xiàn)在是開(kāi)始這次對(duì)話的時(shí)候了。
- 上一篇
企業(yè)能否恢復(fù)云中斷期間的損失?
云計(jì)算風(fēng)險(xiǎn)是廣泛的??蛻艨赡軙?huì)因勒索軟件或其他形式的網(wǎng)絡(luò)攻擊而丟失數(shù)據(jù),并且他們可能會(huì)遇到與網(wǎng)絡(luò)安全無(wú)關(guān)的中斷相關(guān)后果。這可能意味著企業(yè)需要購(gòu)買(mǎi)不止一種類型的策略來(lái)為云中斷的后果提供足夠的保護(hù)。
- 下一篇
無(wú)縫進(jìn)行業(yè)務(wù)數(shù)字化轉(zhuǎn)型的20個(gè)基本步驟
在本文中,福布斯商業(yè)委員會(huì)的成員中的20人分享了成功進(jìn)行數(shù)字化轉(zhuǎn)型的經(jīng)驗(yàn),同時(shí)分享了將企業(yè)帶到數(shù)字時(shí)代的下一個(gè)水平的基本步驟。
相關(guān)資訊
- 您的數(shù)據(jù)能滿足您的ML/AI計(jì)劃嗎?
- 無(wú)線通信的質(zhì)量與哪些因素有關(guān)?
- 如何保護(hù)物聯(lián)網(wǎng)智能電表的安全
- 數(shù)字化轉(zhuǎn)型之路:從傳統(tǒng)到創(chuàng)新
- 5G網(wǎng)絡(luò)下的遠(yuǎn)程醫(yī)療:如何提升實(shí)時(shí)
- ML可以解決醫(yī)療保健中的網(wǎng)絡(luò)安全
- 為什么低代碼/無(wú)代碼應(yīng)用程序開(kāi)
- 教育中的區(qū)塊鏈:增強(qiáng)信任、安全和
- 數(shù)據(jù)驅(qū)動(dòng)的數(shù)字化轉(zhuǎn)型如何為工程
- 智慧城市中的公共安全:如何使用物